検索
ニュース

中国の新興AI企業の高性能オープンソースLLM「DeepSeek-R1」登場 注目の理由は?OpenAIの「o1」に匹敵する性能とAPI料金の安さが売り

中国のAIスタートアップであるDeepSeekは、大規模言語モデル「DeepSeek-R1」と「DeepSeek-R1-Zero」およびDeepSeek-R1から蒸留した6つの小型モデルをオープンソースとして公開した。

Share
Tweet
LINE
Hatena

 中国のAIスタートアップ(新興企業)であるDeepSeekは2025年1月20日(中国時間)、大規模言語モデル(LLM)「DeepSeek-R1」と「DeepSeek-R1-Zero」およびDeepSeek-R1から蒸留した6つの小型モデルをオープンソースとして公開したと発表した。

 DeepSeek-R1は、数学、コーディング、推論タスクにおいて、OpenAIの「o1」と同等の性能を達成しており、6つの蒸留モデルのうち「DeepSeek-R1-Distill-Qwen-32B」は、さまざまなベンチマークでOpenAIの「o1-mini」を上回っている。


DeepSeek-R1モデル(提供:DeepSeek)

 DeepSeek-R1とDeepSeek-R1-Zeroは、DeepSeekの既存モデル「DeepSeek-V3-Base」をベースにトレーニングされている。


DeepSeek-R1蒸留モデル(提供:DeepSeek)

従来手法よりも効率的、「蒸留」を用いたDeepSeekの強み

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る