米国製AI、オープン化に勢い DeepSeekの「蒸留」が加速

米国製AI、オープン化に勢い DeepSeekの「蒸留」が加速
https://www.nikkei.com/article/DGXZQOGN21E0K0R20C25A2000000/

『2025年2月24日 5:58 [会員限定記事]

think!
多様な観点からニュースを考える
山崎俊彦さん他1名の投稿
山崎俊彦浅川直輝

【シリコンバレー=山田遼太郎】米国の人工知能(AI)企業の間で生成AIの基盤モデルを外部の技術者が使えるようにする「オープンソース」開発に勢いが出てきた。技術の公開に消極的な米オープンAIへの反発に加え、中国DeepSeek(ディープシーク)が使った「蒸留」と呼ぶ手法がモデルの低コスト化を速める可能性があるためだ。

元CTOムラティ氏、オープンAIを反面教師に
オープンAIの元最高技術責任者(C…

この記事は会員限定です。登録すると続きをお読みいただけます。

多様な観点からニュースを考える
※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。

山崎俊彦のアバター
山崎俊彦
東京大学 大学院情報理工学系研究科  教授

ひとこと解説「先生が生徒に勉強を教えるように、既存のモデル(先生役)の出力データを使い新たなモデル(生徒役)をつくるAIの開発手法をこう呼ぶ。」

一見教師モデルよりも性能が低い(パラメータ数が少ない)生徒モデルでも、蒸留によって教師モデルに近い性能が出せるのが味噌です。「教師がいるのだったら一般的に用いられる教師あり学習と同じでは?」と思われるかもしれませんが、下記の記事をどうぞ。

知識蒸留:巨大なモデルの知識を抽出する
https://xtech.nikkei.com/atcl/nxt/mag/rob/18/00007/00040/?P=2

DeepSeek 』