DeepSeek が開発した高性能LLM「DeepSeek」の学習手法が、OpenAIのAPI規約に違反する可能性があるとして、大きな議論を呼んでいます。DeepSeek は、OpenAI のモデルの出力結果を学習データとして使った「蒸留」手法を採用しており、この手法が著作権侵害となる可能性が指摘されています。
DeepSeekが開発したLLM「DeepSeek」が大きな騒ぎになってきました。その背景には、DeepSeekが開発の際に使ったより性能の高いLLMを利用して、問題と回答をその推論過程まで含めた出力結果を学習データとして使うことでより効率よくAIに学習させる「蒸留(ディスティレーション)」という手法があります。1月20日に公開された「DeepSeek R1」はOpenAI「o1」に匹敵する性能とされ、さらに圧倒的な低コストで開発されたとアピールされたこともあり、アメリカのAI分野での優位性が揺らいだとの危惧が広がりました。そういうなか、6日に、スタンフォード大学とワシントン大学は「s1-32B」という軽量かつ安価に学習させた蒸留を使って開発した高性能LLMモデルを発表しました。わずか、1000問の学習データと約6ドル(約910円)の計算コストで、2024年9月リリースのOpenAI「o1-Preview」を超える性能を生み出したと主張しています。1月28日の米FOXニュースで、トランプ政権AI担当のデビッド・サックス氏は、DeepSeekが「OpenAIのAIモデルから知識を“抽出”したという“実質的な証拠”がある」と述べました。その具体的な内容について説明はなかったものの、DeepSeekの学習手法が急激に注目を集めました。DeepSeekはAPIを通じてChatGPTに多数の質問をぶつけ、出力結果をデータ学習の素材に使用したとされており、この工程を「蒸留」と呼びます。OpenAIはそのような蒸留行為を利用規約で禁じています。1月29日のフィナンシャルタイムズの報道では、DeepSeekがOpenAIのAPIを通じて大量のデータを収集し、AIモデルのトレーニングに利用した可能性があるとして、OpenAIとマイクロソフトが共同で調査を進めているとしています。 「 著作権侵害 が成立するためには「類似性」と「依拠性」が必要ですが、まず、そもそも教師モデルの中身(パラメータ)が著作権によっては保護されない可能性が高いです。次に「教師モデル」と蒸留によって作成された「生徒モデル」の中身(パラメータ)は全く異なるものですので、「類似性」を満たしません。さらに、「蒸留」というのは、教師モデルの中身に直接アクセスする手法ではないため、「依拠性」も満たさない可能性が高いと思われます」(柿沼氏)。柿沼氏は、日本の著作権法を前提としているが、アメリカ法でもあまり変わらないと考えられています。.
DeepSeekが開発したLLM「DeepSeek」が大きな騒ぎになってきました。その背景には、DeepSeekが開発の際に使ったより性能の高いLLMを利用して、問題と回答をその推論過程まで含めた出力結果を学習データとして使うことでより効率よくAIに学習させる「蒸留(ディスティレーション)」という手法があります。1月20日に公開された「DeepSeek R1」はOpenAI「o1」に匹敵する性能とされ、さらに圧倒的な低コストで開発されたとアピールされたこともあり、アメリカのAI分野での優位性が揺らいだとの危惧が広がりました。そういうなか、6日に、スタンフォード大学とワシントン大学は「s1-32B」という軽量かつ安価に学習させた蒸留を使って開発した高性能LLMモデルを発表しました。わずか、1000問の学習データと約6ドル(約910円)の計算コストで、2024年9月リリースのOpenAI「o1-Preview」を超える性能を生み出したと主張しています。1月28日の米FOXニュースで、トランプ政権AI担当のデビッド・サックス氏は、DeepSeekが「OpenAIのAIモデルから知識を“抽出”したという“実質的な証拠”がある」と述べました。その具体的な内容について説明はなかったものの、DeepSeekの学習手法が急激に注目を集めました。DeepSeekはAPIを通じてChatGPTに多数の質問をぶつけ、出力結果をデータ学習の素材に使用したとされており、この工程を「蒸留」と呼びます。OpenAIはそのような蒸留行為を利用規約で禁じています。1月29日のフィナンシャルタイムズの報道では、DeepSeekがOpenAIのAPIを通じて大量のデータを収集し、AIモデルのトレーニングに利用した可能性があるとして、OpenAIとマイクロソフトが共同で調査を進めているとしています。 「著作権侵害が成立するためには「類似性」と「依拠性」が必要ですが、まず、そもそも教師モデルの中身(パラメータ)が著作権によっては保護されない可能性が高いです。次に「教師モデル」と蒸留によって作成された「生徒モデル」の中身(パラメータ)は全く異なるものですので、「類似性」を満たしません。さらに、「蒸留」というのは、教師モデルの中身に直接アクセスする手法ではないため、「依拠性」も満たさない可能性が高いと思われます」(柿沼氏)。柿沼氏は、日本の著作権法を前提としているが、アメリカ法でもあまり変わらないと考えられています。
United States Latest News, United States Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
中国のDeepSeek、iPhoneのダウンロード数でトップ-アジア株を動かす中国のスタートアップ企業、ディープシーク(DeepSeek)が開発したの人工知能(AI)モデル「DeepSeek」が、アップルのスマートフォン「iPhone」のダウンロード数でトップに躍り出たことで、シリコンバレーではAI分野における米国の優位性に疑問の声が上がっている。
Read more »
ChatGPT超えの中国AI「DeepSeek-R1」の衝撃中国のAIスタートアップ「DeepSeek」は2025年1月20日、OpenAIの最新モデル「o1」と同等性能を持つ大規模言語モデル「DeepSeek-R1」をオープンソース(MITライセンス)で公開した。
Read more »
OpenAIのサム・アルトマンCEOが「DeepSeek-R1はスゴイけど、もっとスゴイAIモデルを発表予定」と発言AI業界のリーダー的存在であるOpenAIのサム・アルトマンCEOが、低コストで高パフォーマンスなAIモデルを開発したと業界で話題の中国発のAI企業「DeepSeek」について、「DeepSeek-R1は印象的なモデルだけど、より優れたAIを発表予定」とX(旧Twitter)で発言しています。
Read more »
中国のオープンウェイトLLM「DeepSeek R1」が世界を震撼させる中国のAI企業DeepSeekが1月20日にリリースした大規模言語モデル(LLM)DeepSeek R1は、OpenAIのo1に匹敵する性能を備えながら、誰でも扱えるオープンウェイトモデルとして公開されたことで世界中で大きな話題を呼んでいます。DeepSeek R1は、強化学習だけでo1レベルの性能に到達したとされ、数学などの難問にも優れているとされています。しかし、政治的なバイアスが組み込まれているとの指摘もあり、日本でも警戒の声が上がっています。
Read more »
東京大学発AIスタートアップ、LightblueがDeepSeek-R1の日本語対応モデル公開株式会社Lightblueは、中国のAI企業DeepSeekが開発した最先端の推論型LLM「DeepSeek-R1」の蒸留モデルをベースに、日本語での追加学習を行ったモデル「Lightblue/DeepSeek-R1-Distill-Qwen-7B-Japanese」を公開しました。このモデルは、日本語のプロンプトに対してより一貫した出力を可能にすることで、DeepSeek-R1の日本語対応を大幅に向上させています。
Read more »
DeepSeek が AI 市場に Disruption をもたらすか?DeepSeek-R1 は ChatGPT のパフォーマンスに匹敵する性能を持ちながら、開発コストが 1/10程度であることから、AI 市場に大きな変化をもたらす可能性がある。DeepSeek の登場により、高コストだった AI がコモディティ化する可能性があり、NVIDIA 株価などにも影響を与えている。
Read more »
