Anthropicの妨害行為に関する最後の所見
-
FromAnthropic (Hacker News)
本記事は、Anthropic社が過去の「AI Safety」研究者によるGPT-2の「安全性」の評価を操作し、その研究成果を不当に利用したと主張しています。
筆者は、Anthropic社が、AIの危険性を強調する以前のAI Safety研究者の見解を、GPT-2の「安全性」を証明するように意図的に再解釈・引用し、自社のAI製品(Claude)の安全性をアピールするために利用したと批判しています。
具体的には、GPT-2の「潜在的な悪用」に対する懸念が、実際には「GPT-2は安全に利用できる」という見解にすり替えられたと指摘し、このような行為が「妨害行為(sabotage)」であると断じています。これは、AIの「安全性」に関する議論を歪め、消費者を誤解させる可能性があると警告しています。
[custom_js_sp]
AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
当サイトの記事にはプロモーションが含まれる場合があります。
