1月20日に、中国のAI企業DeepSeekがリリースした大規模言語モデル(LLM)の「DeepSeek R1」が世界中に衝撃を与えています。OpenAIの「o1」に匹敵する性能とアピールされているにも関わらず、誰にも扱えて、緩いライセンスでオープンウェイトモデルとして公開されるとはまったく予想外でした。今までのLLM開発をけん引してきたアメリカを中心とするAI大手各社に大幅な戦略の見直しを迫るほどのものでした。一方で、政治バイアスが明確に組み込まれていることもあり、日本でも警戒が広がっています。ローカルPCで動作するDeepSeek R1はどれほどの性能のものなのか、早速試してみました。
アメリカ有利だったLLM開発に中国が追いついた
発表によると、DeepSeek R1は各種比較テストでo1に匹敵する性能であると主張しています。また、教師モデルを持たず、強化学習だけでo1レベルに達したとアピールしています。数学などの難易度の高い問題を解くことが得意なようです。パラメーター数はトータルでは6710億、実際の推論時に使うアクティブパラメーターは370億、さらに記憶容量を決めるコンテキスト長は12万8000トークンにまで対応しているという巨大LLMモデルです。ファイルサイズは650GBに及び、これはo1に匹敵すると考えられています。
当初の報道では、開発費が600万ドル(約8億円)とされ、大きな衝撃を与えました。ChatGPTの開発費に比べて10分の1以下であるというわけです。社員も150人しかおらず、1500人以上と言われるOpenAIに比べると非常に小さな規模です。しかし、その後の米Semianalysis誌によると、中国のヘッジファンドHigh-Flyer Capital(高飛資本)から資金提供を受けており、株式などの取引用のAIのために多額のコンピューティング環境への投資をしており、人件費なども含めると実際の投資額は5億ドル(約750億円)になると推測されており、そこまで小規模というわけではないようです。それでも、北米企業が圧倒的な優位性を維持できていると考えられていたLLM開発で、中国企業に一気に追いつかれた可能性が出てきました。
この連載の記事
-
第98回
AI
動画生成AIの進化がすごい 「超リアル」「ローカルで動く」2つの方向に -
第97回
AI
AI法案、柔軟規制で国会審議へ 罰則なし“ソフトロー”の狙いは -
第96回
AI
AI生成の3Dデータが実用レベルに近づいてきた -
第95回
AI
月3万円で使えるOpenAIの「Deep Research」 驚異的だが、情報格差が広がる不安も感じた -
第94回
トピックス
1000円あればOpenAIレベルのAIが作れる DeepSeekで注目の「蒸留」とは -
第92回
AI
動画生成AI、ついにアダルトの扉が開く -
第91回
AI
AIの書いた小説が普通に面白い ChatGPT「o1」驚きの文章力 -
第90回
トピックス
画像生成AIで年賀状 リアルな人物も簡単に -
第89回
AI
OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI -
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい - この連載の一覧へ