検索
ニュース

Anthropic、生成AI「Claude 3.5 Sonnet」を発表 推論速度は前世代上位モデルの2倍、図やグラフの解釈能力も向上2024年内に「Claude 3.5 Haiku」と「Claude 3.5 Opus」をリリース予定

Anthropicは、同社の大規模言語モデルとして「これまでで最も高性能」とする「Claude 3.5 Sonnet」を発表した。

Share
Tweet
LINE
Hatena

 AI(人工知能)スタートアップ企業のAnthropicは2024年6月21日(米国時間)、同社の大規模言語モデル(LLM)として「これまでで最も高性能」とする「Claude 3.5 Sonnet」を発表した。

 Anthropicは2024年3月に、「Haiku」「Sonnet」「Opus」の3モデルで構成される「Claude 3」ファミリーを発表している(それぞれ下位、中位、上位モデル)。Claude 3.5 Sonnetは、最新世代の「Claude 3.5」ファミリーの中で最初に発表された。

 Claude 3.5 Sonnetは現在、AnthropicのWebサービス「Claude.ai」とClaude iOSアプリで無料で利用できる。有料の「Claude Pro」および「Claude Team」プランの契約者については、利用量の上限がより高く設定されている。

 またClaude 3.5 Sonnetは、Anthropic API、Amazon Web Services(AWS)の「Amazon Bedrock」、Google Cloudの「Vertex AI」からも利用できる。利用料金は100万入力トークン当たり3ドル、100万出力トークン当たり15ドルで、コンテキストウィンドウは20万トークンに対応している。

Claude 3 SonnetのコストでClaude 3 Opusを上回る性能(インテリジェンス)を発揮するClaude 3.5 Sonnet(提供:Anthropic)
Claude 3 SonnetのコストでClaude 3 Opusを上回る性能(インテリジェンス)を発揮するClaude 3.5 Sonnet(提供:Anthropic)

前世代の上位モデルの2倍の速度

 Claude 3.5 Sonnetは、大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、コーディングの熟練度(HumanEval)を評価する業界ベンチマークにおいて最高記録を達成しており、他のベンチマークでも好成績を収めている(下表)。ニュアンス、ユーモア、複雑な指示を把握する力が顕著に向上しており、自然で親しみやすいトーンで高品質のコンテンツを記述する力が卓越しているという。

 またClaude 3.5 Sonnetは、Claude 3 Opusの2倍の速度で動作する。この性能向上と費用対効果の高い料金設定により、コンテキストに応じた顧客サポート、複数ステップのワークフローの調整など、複雑なタスクに最適なものとなっていると、Anthropicは述べている。

 同社がエージェントコーディングに関する社内評価をした結果、Claude 3.5 Sonnetは問題の64%を解決し、Claude 3 Opus(38%)を上回った。指示され、関連するツールが提供されると、Claude 3.5 Sonnetは洗練された推論とトラブルシューティング機能により、独立してコードを記述、編集、実行する。コード変換にも容易に対応できるため、レガシーアプリケーションの更新やコードベースの移行に特に効果的だという。

Claude 3.5 Sonnetのベンチマーク結果(提供:Anthropic)
Claude 3.5 Sonnetのベンチマーク結果(提供:Anthropic)

最先端のビジョンモデル

 Claude 3.5 Sonnetは、Anthropicのビジョンモデルとして最も強力であり、標準的なビジョンベンチマークでClaude 3 Opusを上回っている。図やグラフの解釈のような視覚的推論を必要とするタスクの処理能力が顕著に向上している他、不完全な画像を文章化することも可能だ。後者の機能は、特に小売り、物流、金融サービスなどの業界で役立つという。

Claude 3.5 Sonnetのビジョン機能に関するベンチマーク結果(提供:Anthropic)
Claude 3.5 Sonnetのビジョン機能に関するベンチマーク結果(提供:Anthropic)

Claude.aiの新機能「Artifacts」

 AnthropicはClaude.aiの新機能「Artifacts」も発表した。ユーザーがClaudeと対話する方法を拡張する機能だ。ユーザーがClaudeにコードスニペット、テキストドキュメント、Webサイトデザインのようなコンテンツの生成を依頼すると、これらのArtifacts(成果物)が会話と並んで専用ウィンドウに表示される。

 ユーザーはリアルタイムでClaudeの創作物を見たり、編集したり、発展させたりすることができる。AIが生成したコンテンツをプロジェクトやワークフローにシームレスに統合できるようになると、Anthropicは説明している。

 Artifactsが示しているように、Anthropicは今後、Claudeを会話型AIから共同作業環境へと進化させていく計画だ。

安全性とプライバシーへの取り組み

 AnthropicはClaudeモデルを厳格にテストしており、悪用を減らすためのトレーニングを施している。Claude 3.5 Sonnetはインテリジェンス(性能)が飛躍的に向上したにもかかわらず、同社のレッドチームの評価では、AI安全レベルはClaude 3ファミリーと同じ「ASL-2」となっている。

今後の計画

 Anthropicは2024年後半に、「Claude 3.5 Haiku」と「Claude 3.5 Opus」をリリースする計画だ。これに続く次世代モデルファミリーの開発に加え、Claudeとエンタープライズアプリケーションの統合など、より多くのビジネスユースケースをサポートする新しいモダリティと機能にも取り組んでいる。また、Claudeがユーザーの好みや操作履歴を記憶し、ユーザー体験をよりパーソナライズされた効率的なものにする機能も模索しているという。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る