1: 2026/02/16(月) 01:56:14.05 ソースはゲイリーマーカスによる驚き屋批判記事 ・codexや4.6は長時間のタスクにも優れる←実際は信頼性・脆弱性にかなり問題がある ・METRベンチマークでも高い成果←コーディングに限っても最新モデルのスコアは低い。使い物にならない ・推論向上・ハルシネーション減少の壁は大きく、人間の仕事を奪うのは到底厳しい ・むしろ最近はセキュリティ上の欠陥が増えている。 https://substack.com/@garymarcus/note/p-187671104 続きを読む Source: 投資ちゃんねる – 株・FX・仮想通貨・投資2chまとめ 投稿ナビゲーション デーブ・スペクター氏、異例「オチなし」投稿に反響「どんなに日本で株価が上がっても円安が…」 日経平均、イラン情勢の時間差攻撃をがっつり喰らい歴代7位の下げ幅を記録