中国の新興AI企業の高性能オープンソースLLM「DeepSeek-R1」登場 注目の理由は?OpenAIの「o1」に匹敵する性能とAPI料金の安さが売り

中国のAIスタートアップであるDeepSeekは、大規模言語モデル「DeepSeek-R1」と「DeepSeek-R1-Zero」およびDeepSeek-R1から蒸留した6つの小型モデルをオープンソースとして公開した。

» 2025年01月29日 12時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 中国のAIスタートアップ(新興企業)であるDeepSeekは2025年1月20日(中国時間)、大規模言語モデル(LLM)「DeepSeek-R1」と「DeepSeek-R1-Zero」およびDeepSeek-R1から蒸留した6つの小型モデルをオープンソースとして公開したと発表した。

 DeepSeek-R1は、数学、コーディング、推論タスクにおいて、OpenAIの「o1」と同等の性能を達成しており、6つの蒸留モデルのうち「DeepSeek-R1-Distill-Qwen-32B」は、さまざまなベンチマークでOpenAIの「o1-mini」を上回っている。

DeepSeek-R1モデル(提供:DeepSeek)

 DeepSeek-R1とDeepSeek-R1-Zeroは、DeepSeekの既存モデル「DeepSeek-V3-Base」をベースにトレーニングされている。

DeepSeek-R1蒸留モデル(提供:DeepSeek)

従来手法よりも効率的、「蒸留」を用いたDeepSeekの強み

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。