DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか

United States News News

DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか
United States Latest News,United States Headlines
  • 📰 gigazine
  • ⏱ Reading Time:
  • 78 sec. here
  • 3 min. at publisher
  • 📊 Quality Score:
  • News: 34%
  • Publisher: 51%

2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、Apple、Microsoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。

DeepSeekの優れている点の1つは、オープンソースで公開されているということです。ライバルでクローズドモデルのOpenAIの「o1」とは違い、提供元にお金を払わなくとも好きなサーバーやローカル上で実行することができます。 DeepSeekをオープンソースで公開したことについて、CEOのLiang Wenfeng氏は「オープンソースは人材を惹きつける鍵です。時代を変えるテクノロジーにおいてクローズドソースによって作られた塀は一時的なものであり、OpenAIのクローズドソースのアプローチでさえ、他社の追い上げを防ぐことはできませんでした。私たちは、DeepSeekを通じてノウハウを蓄積し、イノベーションを起こせる組織と文化を形成します。オープンソースは商業的なものというよりも文化的な行動であり、それに貢献することで私たちは尊敬を集められます。今後クローズドソースに変更することはありませんし、まず強力な技術的エコシステムを持つことがより重要だと考えています」と述べています。 DeepSeekのもう1つの優れた点は、AI開発におけるブレークスルーを達成した点です。これまでの一般的な大規模言語モデルは、人間の価値観に沿うように人間がモデルのトレーニングを繰り返す「人間のフィードバックによる強化学習」という手法でトレーニングされ、出力内容に有害なものが生じないよう調整されてきました。 ところが、DeepSeekの「R1-Zero」の方は人間によるフィードバックを削除し、ほとんどの過程で強化学習のみに基づいたアプローチでトレーニングを行っています。DeepSeekの開発者らによると、「正解」と、「思考プロセスを利用した適切な形式」の2つに対して報酬関数を設定し、段階的に評価しようとしたり可能性のあるすべての答えを検索したりするのではなく、一度に複数の異なる答えを出してから報酬関数に基づく評価を行うようモデルに指示したとのこと。 トンプソン氏は「つまり、推論の仕方を人間が教えずとも、十分な計算量とデータを与えればAIが勝手に推論してくれるという状態を実現したのです」と解説しています。このアプローチによりモデルは思考時間により多くの時間を割り当てることが可能になり、予期せぬ能力が開花しました。これは、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという既存のモデルの問題を解決する可能性があります。 3つ目の優れた点が、少ないコストで開発されたという点です。OpenAIなどがトレーニングに数十億ドルを費やしていると言われる中、このモデルは600万ドル未満のコストしかかからなかったとされており、またアメリカの半導体輸出規制の中で性能を落として輸出されたNVIDIA製半導体で開発を実現したという点が注目すべきポイントです。 低性能の機器でも高性能の機器に勝るモデルを開発できたという事実により、半導体企業のNVIDIAの価値が揺らいで株価が一時下落しましたが、いずれにせよDeepSeekがNVIDIAの製品に頼ったということに変わりはなく、トンプソン氏は「まだNVIDIAは有利」との見方を示しています。 一方で投資家は頭を悩ませることになります。大企業が多額の費用を投じて進歩を夢見た分野に突然安価でフリーな代替品が現れれば、産業が混乱します。NVIDIA株の下落や、「AIの開発にはエネルギーが必要」との観点から買われていたエネルギー企業の売り転換は、混乱する投資家らの内情がよく反映されていると言えます。海外メディアのAxiosはこの点を「既存の企業に全賭けしたベンチャーキャピタルにとって絶滅レベルの出来事だ」と.

DeepSeekの優れている点の1つは、オープンソースで公開されているということです。ライバルでクローズドモデルのOpenAIの「o1」とは違い、提供元にお金を払わなくとも好きなサーバーやローカル上で実行することができます。 DeepSeekをオープンソースで公開したことについて、CEOのLiang Wenfeng氏は「オープンソースは人材を惹きつける鍵です。時代を変えるテクノロジーにおいてクローズドソースによって作られた塀は一時的なものであり、OpenAIのクローズドソースのアプローチでさえ、他社の追い上げを防ぐことはできませんでした。私たちは、DeepSeekを通じてノウハウを蓄積し、イノベーションを起こせる組織と文化を形成します。オープンソースは商業的なものというよりも文化的な行動であり、それに貢献することで私たちは尊敬を集められます。今後クローズドソースに変更することはありませんし、まず強力な技術的エコシステムを持つことがより重要だと考えています」と述べています。 DeepSeekのもう1つの優れた点は、AI開発におけるブレークスルーを達成した点です。これまでの一般的な大規模言語モデルは、人間の価値観に沿うように人間がモデルのトレーニングを繰り返す「人間のフィードバックによる強化学習」という手法でトレーニングされ、出力内容に有害なものが生じないよう調整されてきました。 ところが、DeepSeekの「R1-Zero」の方は人間によるフィードバックを削除し、ほとんどの過程で強化学習のみに基づいたアプローチでトレーニングを行っています。DeepSeekの開発者らによると、「正解」と、「思考プロセスを利用した適切な形式」の2つに対して報酬関数を設定し、段階的に評価しようとしたり可能性のあるすべての答えを検索したりするのではなく、一度に複数の異なる答えを出してから報酬関数に基づく評価を行うようモデルに指示したとのこと。 トンプソン氏は「つまり、推論の仕方を人間が教えずとも、十分な計算量とデータを与えればAIが勝手に推論してくれるという状態を実現したのです」と解説しています。このアプローチによりモデルは思考時間により多くの時間を割り当てることが可能になり、予期せぬ能力が開花しました。これは、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという既存のモデルの問題を解決する可能性があります。 3つ目の優れた点が、少ないコストで開発されたという点です。OpenAIなどがトレーニングに数十億ドルを費やしていると言われる中、このモデルは600万ドル未満のコストしかかからなかったとされており、またアメリカの半導体輸出規制の中で性能を落として輸出されたNVIDIA製半導体で開発を実現したという点が注目すべきポイントです。 低性能の機器でも高性能の機器に勝るモデルを開発できたという事実により、半導体企業のNVIDIAの価値が揺らいで株価が一時下落しましたが、いずれにせよDeepSeekがNVIDIAの製品に頼ったということに変わりはなく、トンプソン氏は「まだNVIDIAは有利」との見方を示しています。 一方で投資家は頭を悩ませることになります。大企業が多額の費用を投じて進歩を夢見た分野に突然安価でフリーな代替品が現れれば、産業が混乱します。NVIDIA株の下落や、「AIの開発にはエネルギーが必要」との観点から買われていたエネルギー企業の売り転換は、混乱する投資家らの内情がよく反映されていると言えます。海外メディアのAxiosはこの点を「既存の企業に全賭けしたベンチャーキャピタルにとって絶滅レベルの出来事だ」と

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

gigazine /  🏆 80. in JP

 

United States Latest News, United States Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

OpenAI CEO、中国製オープンソースAI「DeepSeek」を評価し、新たなリリースを予告OpenAI CEO、中国製オープンソースAI「DeepSeek」を評価し、新たなリリースを予告中国発のオープンソース生成AI「DeepSeek」が、OpenAIのモデルと並ぶ性能を発揮し世界的に注目を集めている。OpenAI CEOはDeepSeekを高く評価し、より優れたモデルのリリースを予告した。
Read more »

中国企業DeepSeekが強化学習だけで開発したオープンウェイトLLM「R1」が注目を集める中国企業DeepSeekが強化学習だけで開発したオープンウェイトLLM「R1」が注目を集めるDeepSeekは、SFTをほとんど用いず強化学習のみでトレーニングされたLLM「R1」を開発し、VentureBeatから注目されています。R1は、複雑な問題への対応力やCoTの透過的な表示など、ユニークな能力を発揮しています。また、限られたマシンパワーで開発されたこと、重み付けが公開されているオープンウェイトモデルであることも、R1が注目を集める理由です。
Read more »

OpenAIサム・アルトマン氏、DeepSeekを称賛しつつ対抗リリースを予告OpenAIサム・アルトマン氏、DeepSeekを称賛しつつ対抗リリースを予告OpenAIのサム・アルトマンCEOは1月28日、自身のXアカウントを通じて、中国の生成AI「DeepSeek」に言及した。
Read more »

中国AI「ディープシーク」の実力は? 一番偉い人を聞くと「回答の仕方を学習してない」中国AI「ディープシーク」の実力は? 一番偉い人を聞くと「回答の仕方を学習してない」中国の人工知能(AI)開発の新興企業「DeepSeek(ディープシーク)」の対話型生成AIが公開され、話題となっている。現在、無料で利用できる3つの生成AI、…
Read more »

オープンソース生成AI DeepSeek、性能で世界を驚かせるオープンソース生成AI DeepSeek、性能で世界を驚かせる中国の企業がオープンソースで提供する生成AI、DeepSeek。1月20日の公開以降、OpenAIのo1に匹敵する性能を示し世界的に注目を集めている。OpenAIのサム・アルトマンCEOもDeepSeekを称賛し、さらなる競争激化を予感させる。
Read more »

中国のAIスタートアップ、ディープシークが世界を揺るがす中国のAIスタートアップ、ディープシークが世界を揺るがす中国のAIスタートアップ、ディープシークが、低コストで開発された新しいオープンソースAIモデル「R1」を発表し、世界中のAI開発者を驚愕させている。ディープシークのR1は、既存の大手AI開発企業と肩を並べる、あるいはそれ以上の性能を持つことが判明し、その技術の革新性は、AI業界全体の paradigmshiftを引き起こす可能性を秘めている。
Read more »



Render Time: 2026-04-02 10:29:59