Anthropic、Opus 4.7ローンチ前に4.6の性能を意図的に低下か
-
FromAnthropic (Hacker News)
Anthropicが、Claude 3 Opusのバージョン4.7のリリース前に、バージョン4.6の性能を意図的に低下させたという疑惑が浮上しています。
この疑惑は、ユーザーがOpus 4.6で過去のバージョンよりも「悪化」したと感じたことから生じました。具体的には、以前は完璧にこなせていたタスク(例: Pythonコードの生成)で、より不完全な出力をするようになったとの報告があります。
さらに、AIモデルの性能を比較するベンチマークサイト「LMSYS Chatbot Arena」のデータによると、Opus 4.6はOpus 4.5と比較して、 Eloレーティングが低下しています。これは、モデルの「賢さ」が減少したことを示唆しています。
Anthropicは、モデルの改善は継続的なプロセスであり、特定のバージョンが意図的に「弱体化」されることはないと述べています。しかし、Opus 4.7のリリース直前に4.6の性能が低下したという事実は、ユーザーコミュニティの間で憶測を呼んでいます。
この出来事は、AIモデルの進化における透明性や、ユーザーがモデルの性能変動をどのように受け止めるかという点について、改めて議論を提起しています。
[custom_js_sp]
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
