オープンAIがディープシークのAIモデルのデータ無断利用を調査中。個人情報収集の懸念も広がり、業界内での評価が分かれる。
この調査は、ディープシークのAIモデル「R1」がオープンAIのデータを無断で利用して開発された可能性があるという疑惑に基づいている。
ウォール・ストリート・ジャーナル(WSJ)の報道によれば、オープンAIとマイクロソフト(MS)は、ディープシークが自社のAIツールから大量のデータを引き出し、それを基にモデルを訓練した「蒸留(distillation)」プロセスを経ているとの主張がある。
この蒸留は、大規模なAIモデルの能力を小さなモデルに圧縮する手法であり、デビッド・サックス氏は「相当な証拠がある」と述べている。
AI業界では、ディープシークの実際のパフォーマンスと安定性を検証する必要性が指摘されている。
ベンチマークでは優れた性能を示しているものの、実際のサービス提供においては活用性に問題が生じる可能性がある。
さらに、ディープシークの「コスパ」の良さが誇張されている可能性もある。
韓国のIT業界関係者によると、ディープシークが発表した「低費用」は、運営費用や累積投資費用を考慮すると実際には非常に安いとは言えないという意見がある。
また、ディープシークは他のAIサービスに比べて個人情報を広範に収集しており、そのデータは中国国内のセキュリティサーバーに保存されるため、懸念の声が上がっている。
現在、ディープシークは米国だけでなく、国内のアプリストアでも無料アプリダウンロードランキングで1位を獲得している。
NAVERクラウドAIイノベーションセンターのハ・ジョンウ・センター長は、ディープシークのポリシーにおいて、使用装備の情報やキーボード入力パターンなどまで収集していることを指摘し、他のAIモデルに比べてさらに多くの情報を収集している上に、オプトアウト機能もないと警鐘を鳴らしている。
参考リンクhttps://news.yahoo.co.jp/articles/775fa42b912472131d13654c8bebe9d9dfb1f3b7
コメントの内容では、中国製品に対する安全性の懸念が多く寄せられていました。
特に、中国製品が情報を抜き取るリスクや、尖閣問題に対する姿勢が問題視されていたようです。
また、アメリカのメディアや資本家が高価な商品を売るために安価な商品を攻撃する可能性についての意見もありました。
AIに関しては、著作権の問題が取り上げられ、AIが学習するデータが著作権侵害に当たらないとの意見や、生成されたデータには著作権がないとする見解が示されていました。
過去のアメリカの行動についても言及され、日本がかつてアメリカに潰されたことを思い出させるコメントがありました。
全体として、情報の安全性や著作権に対する不安が広がり、特に中華製品に対しては規制を求める声が多かったようです。
ネットコメントを一部抜粋
中国製は安全性が確保されていない。
アメリカのメディアと資本家は高価の商品を素人に売るために、安い商品を崩すように宣伝する可能性があるかもしれません。
仮に利用されたとしても:1.AI学習対象データは仮に著作権があっても、著作権侵犯に当たらない。
アメリカの本質は変わらないな。
過去には日本を潰しに来たからな。
どっちにしても中華産で安全性が確保されないんだから日本ではダウロードできないように規制してくれよ。