GPT-4oやClaude 3.5 Sonnet、Gemini 1.5 Proといった主要な大規模言語モデルを対象としたテストの結果、AIはユーザーの意見に合わせる傾向があることをスタンフォード大学の研究チームが発表しました。
また、研究チームは生成AIによる自動評価技術「LLM-As-A-Judge」を使用して、生成された回答を「正解」「不正解」「不適当」の3種類に分類しています。ここでの「不正解」は生成された回答が真の回答と異なることを指し、「不適当」はモデルがクエリへの回答を控える、またはクエリに含まれるコンテンツに無関係な応答を示したことを指しています。 実験の結果、全サンプルの58.19%が人間であるユーザーの意見に同調する結果が示されました。特に、Gemini 1.
5 Proは62.47%と最も高い同調率を示し、Claude 3.5 Sonnetの57.44%、GPT-4oの56.71%と続きました。 また、研究チームはAIが正解に向かって回答を生成する「漸進的共鳴」と、AIがユーザーの意見に合わせるために誤った解答を提示する「退行的共鳴」に生成結果を分類。その結果、全サンプルの58.19%のうち、43.52%が漸進的共鳴、14.66%が退行的共鳴であることが明らかになっています。モデル別に見ると、Gemini 1.5 Proは漸進的共鳴が53.22%、退行的共鳴が9.25%。Claude 3.5 Sonnetによる漸進的共鳴が39.13%、退行的共鳴が18.31%でした。そして、GPT-4oの漸進的共鳴は42.32%、退行的共鳴は14.40%であることが分かっています。 研究チームは、今回の実験結果を踏まえ、教育環境や医学的診断とアドバイス、プロフェッショナルなコンサルティング、技術的な問題の解決におけるAIシステムの信頼性について懸念を表明しています。研究チームは、「AIモデルが独立した推論よりもユーザーの意見を尊重すると、正確で有用な情報を提供する能力が損なわれ、意思決定や安全性にとって正しい情報が重要となる状況下で大きな問題になる可能性があります」と指摘しました。 研究チームによると、AIがユーザーの意見を優先してしまうこの動作は、肯定的なフィードバックを最大化するためのモデルのトレーニングを反映している可能性があるとのこと。AI関連企業では、ユーザーの意見に同意するとユーザーの反応が向上する傾向にあることをAIモデルに学習させているそうです。 そこで研究チームは、「協調性と精度のバランスをとるトレーニング方法の改善」「ユーザーの意見に同調する行動を検出するためのより良い評価フレームワークの開発」「自立性を保ちつつも有用性を維持できるAIシステムの開発」「重要なアプリケーションにおける安全対策の実装」の必要性を強調しました。また、研究チームは「今回の研究から得られた結果は、ユーザーの印象を良くするためのアライメントよりも精度を優先しなければならないハイステークスアプリケーション向けの信頼性の高いAIシステムを開発するための基礎を築くものです」と語りました。
United States Latest News, United States Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
2024年はほとんどの大陸で記録上最も暑い年で上昇値1.5度以上の節目を迎えたとEUの報告書で判明EUのコペルニクス気候変動サービス(C3S)は2025年1月に、2024年の気候に関する世界中の分析レポートを発表しました。レポートでは、オーストラリア大陸および南極大陸以外のすべての地域で2024年が記録上最も暑い年となり、産業革命前の水準と比べて平均気温が「1.5度」高い初めての年となったことが報告されています。
Read more »
Age of Empires IV Ver.1.5 & Intel Arc B570 Challenger 10GB OC レビューAge of Empires IV Ver.1.5 のレビュー、Intel Arc B570 Challenger 10GB OC のレビュー、PCゲーム関連ニュース - 2023年9月20日
Read more »
中国産AI、GPT-4oに迫るパフォーマンスを披露ByteDanceのDoubao 1.5 Proが、OpenAIのGPT-4o、GoogleのGemini、AlibabaのQwenなどのベンチマークで優位に立ち、中国産AIの台頭が顕著です。トレーニングコストを抑えつつ高性能を実現するモデルが続々と登場しており、DeepSeek R1もOpenAIのo1に肉薄するスコアを記録しました。中国の研究機関は、アメリカのモデルと競争力を持ち、AI分野でさらなる躍進が期待されます。
Read more »
ゼンレスゾーンゼロ、Ver.1.5「輝きのモーメント」配信開始!新エージェント「アストラ・ヤオ」「イヴリン・シェヴァリエ」が登場ゼンレスゾーンゼロの最新アップデートVer.1.5「輝きのモーメント」が配信!新エージェント「アストラ・ヤオ」「イヴリン・シェヴァリエ」が活躍する特別劇場「響き合う旋律」が楽しめる。前回のアップデートVer.1.4も大きな話題を呼んだ本作品から、目が離せません。
Read more »
hololive OFFICIAL CARD GAME Ver.1.5 発売決定hololive公式 トレーディングカードゲームVer.1.5の発売が決定しました。2025年発売予定。
Read more »
CAST、1.5億円の資金調達完了・新ブランド「ULTRACK™」始動CAST、1.5億円の資金調達完了・新ブランド「ULTRACK™」始動 株式会社CASTのプレスリリース
Read more »
