近年では、テクノロジーの発展に伴ってさまざまなAI企業から人間のような対話が可能な大規模言語モデルが数多くリリースされています。これらの大規模言語モデル同士で、対話が非常に重要な人狼系ゲームをプレイさせた際の結果が公開されており、各大規模言語モデルの実力が明らかとなっています。
AI bots now play Mafia with each other on public website, and almost all of them are terrible at it | Tom's Hardware https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-bots-can-now-play-mafia-with-each-other-and-almost-all-of-them-are-terrible-at-it 開発者のGuzus氏は、「claude-3.
7-sonnet」「deepseek-chat」「llama-3.3-70b-instruct」などの大規模言語モデルに対し、8名でプレイできる人狼系ゲーム「マフィア」をプレイさせました。各プレイヤーには「農民」「医者」「マフィア」の3つの役職が与えられ、その内訳は村人が5名、医者が1名、マフィアが2名です。ゲームは1日を1ターンとして扱うターン制で行われ、ターンごとにプレイヤーはマフィアが誰であるかを推測し、追放しなければなりません。マフィア側はターン進行時に村人を1人殺害することが可能で、医者は自分の選んだプレイヤーをマフィア側の攻撃から守ることができます。最終的に、マフィアのメンバーを追放することができれば村人側の勝利、マフィア側が村人を全員殺害することができればマフィア側の勝利となります。Which AI is the best mafia game player?planning to make it scalable so that it can be applied to other interesting games. could be developed to generate a movie script someday
United States Latest News, United States Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
「AIは人間にごまをする」という研究結果、特にGemini 1.5 Proではその傾向が顕著GPT-4oやClaude 3.5 Sonnet、Gemini 1.5 Proといった主要な大規模言語モデルを対象としたテストの結果、AIはユーザーの意見に合わせる傾向があることをスタンフォード大学の研究チームが発表しました。
Read more »
「Grok-3」がリリースされる、GPT-4oやGemini 2.0 Proと比べて圧倒的に高性能とxAIはアピールイーロン・マスク氏のAI企業「xAI」が2025年2月18日にGrok-3を発表しました。xAIは、Grok-3が前モデルの10倍以上の計算能力を備えており、GPT-4oやGemini 2.0 Proと比べて圧倒的に高性能だとアピールしています。
Read more »
「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功Anthropicが「Claude 3.7 Sonnet」を発表しました。Anthropicによれば、Claude 3.7 Sonnetは「市場初のハイブリッド推論モデル」で、ベンチマークではOpenAIのo1やo3-mini、DeepSeek-R1を超える性能を見せたとのことです。
Read more »
Claude 3.7 Sonnetにポケモンをプレイさせる「ClaudePlaysPokemon」をAnthropicがTwitchで配信開始、推論しながらの超ゆっくりプレイを皆が見守るAI企業のAnthropicは、2025年2月25日に発表した推論モデル「Claude 3.7 Sonnet」がベンチマークでOpenAIのo1やo3-mini、DeepSeek-R1を超える性能を示したと報告しました。さらに、AnthropicはClaude 3.
Read more »
自治体AI zevoにてo3-miniが、GPT-4o、4o miniに続き本日2025年2月26日より利用可能に!新たな生成AIモデルを追加!自治体AI zevoにてo3-miniが、GPT-4o、4o miniに続き本日2025年2月26日より利用可能に!新たな生成AIモデルを追加! シフトプラス株式会社のプレスリリース
Read more »
GPT-4o miniやClaude 3を無料かつ匿名で誰でも使える「Duck.ai」 が登場ユーザーのプライバシーを保護し、検索のパーソナライズを行わないことを運営方針とする検索エンジン「DuckDuckGo」が、AIチャットボット用インターフェースである「Duck.ai」を一般公開しました。誰でも無料かつ匿名で、GPT-4o miniやClaude 3、Llama 3.3などのチャットモデルと会話することが可能です。
Read more »
