Google、AIの実力をゲームで競う「Kaggle Game Arena」発表 8種のモデルのトーナメント開催へ

速報 News

Google、AIの実力をゲームで競う「Kaggle Game Arena」発表 8種のモデルのトーナメント開催へ
AI生成AIニュース企業・業界動向
  • 📰 topitmedia
  • ⏱ Reading Time:
  • 11 sec. here
  • 5 min. at publisher
  • 📊 Quality Score:
  • News: 18%
  • Publisher: 51%

Google DeepMindとKaggleは、AIモデルがゲームで競う新ベンチマーク「Kaggle Game Arena」を発表した。初イベントとして、Google、OpenAI、Anthropicなどの最新AIによるチェストーナメントを開催する。

が共同で、AIモデルの厳密な評価を目的とした新しい公開ベンチマークプラットフォーム「Kaggle Game Arena」を導入したと発表した。「AIモデルとエージェントが様々な戦略ゲームで直接競い合い、信頼性の高いAI評価の新たな境地を切り開くための新しいベンチマークプラットフォーム」という。8つのAIとは、Googleの「Gemini 2.5 Pro」「Gemini 2.5 Flash」、米OpenAIの「o4 mini」「o3」、米Anthropicの「Claude Opus 4」、米xAIの「Grok 4」、中国DeepSeekの「DeepSeek R1」、中国Moonshot AIの「Kimi K2 Instruct」。トーナメントはシングルエリミネーション方式で行われ、各対戦は4ゲーム先取のマッチとなる。3日間のエキシビショントーナメントは、毎日午前10時30分(太平洋標準時)からkaggle.

com/game-arenaで1ラウンドずつストリーミング配信する予定だ。 Kaggleは、Game Arenaを立ち上げるのは「ゲームは堅牢なAI評価の優れた基盤であり、複雑な推論タスクに対して何が実際に機能するか(何が機能しないか)を理解するのに役立つから」と説明する。ゲームにおけるモデルのパフォーマンスは、Kaggleベンチマークのリーダーボードで確認できるようになっている。

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

topitmedia /  🏆 93. in JP

AI 生成AIニュース 企業・業界動向

 

United States Latest News, United States Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

「レコチョク上半期ランキング2025」「dヒッツ上半期ランキング2025」発表~Number_i、Mrs. GREEN APPLEがランキング席巻!~「レコチョク上半期ランキング2025」「dヒッツ上半期ランキング2025」発表~Number_i、Mrs. GREEN APPLEがランキング席巻!~「レコチョク上半期ランキング2025」「dヒッツ上半期ランキング2025」発表~Number_i、Mrs. GREEN APPLEがランキング席巻!~ 株式会社レコチョクのプレスリリース
Read more »

「アルプロン U30アスリート支援プロジェクト」発表 大学生から若年層アスリートの栄養面、経済面を応援、選考受付スタート「アルプロン U30アスリート支援プロジェクト」発表 大学生から若年層アスリートの栄養面、経済面を応援、選考受付スタート「アルプロン U30アスリート支援プロジェクト」発表 大学生から若年層アスリートの栄養面、経済面を応援、選考受付スタート 株式会社アルプロンのプレスリリース
Read more »

' 千寿オリーブ 'のマイクロバイオーム、ついに宇宙医療へ──大阪・関西万博で「アストロバイオーム プロジェクト」発表' 千寿オリーブ 'のマイクロバイオーム、ついに宇宙医療へ──大阪・関西万博で「アストロバイオーム プロジェクト」発表' 千寿オリーブ 'のマイクロバイオーム、ついに宇宙医療へ──大阪・関西万博で「アストロバイオーム プロジェクト」発表 美麗インターナショナル有限会社のプレスリリース
Read more »

【デニムの街・倉敷でお披露目】ボルボ・トラック×青木被服、藍の血が流れる「BLUE BLOOD」発表!【デニムの街・倉敷でお披露目】ボルボ・トラック×青木被服、藍の血が流れる「BLUE BLOOD」発表!【デニムの街・倉敷でお披露目】ボルボ・トラック×青木被服、藍の血が流れる「BLUE BLOOD」発表! ボルボ・トラック中国株式会社キャリオンのプレスリリース
Read more »

Google DeepMindが生成AI改変の検出ツール「Backstory」発表/ASRockからCore Ultra 200Sシリーズ対応の新型ベアボーン「DeskMini B860」:週末の「気になるニュース」一気読み!(1/3 ページ)Google DeepMindが生成AI改変の検出ツール「Backstory」発表/ASRockからCore Ultra 200Sシリーズ対応の新型ベアボーン「DeskMini B860」:週末の「気になるニュース」一気読み!(1/3 ページ)うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、7月20日週を中心に公開された主なニュースを一気にチェックしましょう!
Read more »

写真で見る ホンダの新型軽バッテリEV「N-ONE e:」(プロトタイプ)写真で見る ホンダの新型軽バッテリEV「N-ONE e:」(プロトタイプ)本田技研工業の軽EV第2弾となるのが「N-ONE e:」だ。同社では2024年に第1弾となる商用EV「N-VAN e:」をリリースしており、この第2弾が待望の乗用モデルということになる。今回紹介するのはプロトタイプでスペックは非公表。発表、発売は2025年秋を予定している。
Read more »



Render Time: 2026-04-01 23:46:17