デビッド・サックスとAI業界を巡る論争
中国の人工知能(AI)モデル「R1」で知られるDeepSeek(ディープシーク)に関する議論が高まっています。この議論の背景には、ライバルであるオープンAIによるデータの無断活用や個人情報の過度な収集といった問題が含まれています。
オープンAIとマイクロソフトによる調査
ウォール・ストリート・ジャーナルは、ディープシークがオープンAIのモデルを無断で利用してAIを開発した疑いについて、オープンAIとマイクロソフト(MS)が調査を進めていると報じました。オープンAIは、中国の機関が自社のAIツールから大量のデータを引き出し「蒸留(distillation)」というプロセスを経てモデルを訓練させたとの疑惑を主張しています。**蒸留**とは、規模の大きいAIモデルの能力値を小さなモデルに圧縮して取り込む技術です。
デビッド・サックスの見解
ドナルド・トランプ米国政府の元AI・仮想通貨政策総括者であるデビッド・サックス氏も、これらの主張に「相当な証拠がある」と述べています。彼の意見が信頼されている背景には、AI業界での長年の経験と知識があるためです。
ディープシークの性能と信頼性の検証
AI業界内では、ディープシークの実際の**性能**と**信頼性**をさらに検証する必要があるという声が上がっています。ベンチマークの性能は優れていますが、実際に大衆向けにサービスを提供する際には、その活用性に問題が生じる可能性があるのです。また、ディープシークの強みとされる「コスパ」に関しても、過大評価されている可能性があります。韓国国内のIT業界の関係者によれば、「ディープシークが公開した『低費用』は1回の学習費用に過ぎず、運営費用や累積投資費用を考慮すると、非常に安いとは言えない」とのことです。
個人情報収集に対する懸念
ディープシークは他のAIサービスと比べて、より広範囲にわたって個人情報を収集することで知られています。そのデータは中国内のセキュリティサーバーに保存されるため、プライバシーの懸念が高まっています。NAVERクラウド AIイノベーションセンターのハ・ジョンウ・センター長によれば、「ディープシークのポリシーでは、使用装備の情報に加えてキーボード入力パターンなども収集している」とし、他のAIモデルよりも多くの情報を収集していると述べています。さらに、**オプトアウト**(情報収集拒否)の機能も提供されていないことが問題視されています。