Amazon Web Servicesは、DeepSeekが2025年1月に公開した大規模言語モデル「DeepSeek-R1」が、「Amazon Bedrock」において利用可能になったと発表した。フルマネージドのサーバレスモデルとして利用できるという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Amazon Web Services(AWS)は2025年3月10日(米国時間)、中国のAI(人工知能)スタートアップ企業であるDeepSeekが2025年1月に公開した大規模言語モデル(LLM)「DeepSeek-R1」が、「Amazon Bedrock」で利用可能になったと発表した。AWSによると、フルマネージドのサーバレスモデルとして利用できるという。
Amazon Bedrockは、主要なAI企業などの高性能な基盤モデル(Foundation Model)を単一のAPIで提供するフルマネージドサービス。セキュリティ、プライバシー、責任あるAIを備えた生成AIアプリケーションの構築に必要な幅広い機能を提供する。
AWSは2025年1月末から、「Amazon Bedrock Marketplace」とAmazon Bedrockのカスタムモデルインポートを通じて、DeepSeek-R1をAmazon Bedrockで利用できるようにしていた。Amazon Bedrock Marketplaceは、幅広い基盤モデルへのアクセスを提供する機能だ。Amazon Bedrockのカスタムモデルインポートは、カスタマイズしたモデルをインポートして既存の基盤モデルとともにAmazon Bedrockで使用できる機能だ。
ユーザーは単一のAPIとAmazon Bedrockのツールを介して、DeepSeek-R1の機能で生成AIアプリケーションを強化できる。複雑なインフラを管理することなく、アプリケーションの差別化と具体的なビジネス価値の提供に集中することが可能になる。
DeepSeekによると、DeepSeek-R1はMIT Licenseで一般公開されており、推論、コーディング、自然言語理解において強力な機能を提供しているという。これらはインテリジェントな意思決定支援、ソフトウェア開発、数学的問題解決、科学的分析、データ洞察、包括的な知識管理システムで威力を発揮する。さらにDeepSeekは、同社のモデルは同等モデルよりも大幅に割安で、コスト効率が高いと強調している。
AWSは、「どのAIソリューションも、本番環境に導入する際は、データプライバシー要件に十分配慮し、出力にバイアス(偏り)がないかどうかをチェックし、結果をモニタリングする必要がある」と注釈した上で、DeepSeek-R1のような一般公開されているモデルを実装する場合は、Amazon Bedrockの以下の機能を利用することを検討すべきだと述べている。
データを完全に管理しながら、責任を持ってAIを大規模に展開するために、Amazon Bedrockのエンタープライズグレードのセキュリティ、モニタリング、コスト管理機能を利用できる。ユーザーの入力とモデル出力は、どのモデルプロバイダーとも共有されない。
Amazon BedrockでDeepSeek-R1モデルと通信している間、デフォルト(既定)で使用できるセキュリティ機能には、保存時および転送時のデータ暗号化、きめ細かなアクセス制御、安全な接続オプション、各種コンプライアンス認証のダウンロードなどが含まれる。
「Amazon Bedrock Guardrails」を使用して、アプリケーション要件と責任あるAIポリシーに合わせてカスタマイズされたセーフガードを実装できる。これにはコンテンツフィルタリング、機密情報フィルタリング、カスタマイズ可能なセキュリティ対策が含まれる。
コンテキストのグラウンディング(Grounding)と自動推論チェックにより、ハルシネーション(誤った回答の生成)を防止することもできるという。定義したポリシーセットでBedrockのDeepSeek-R1モデルとユーザーのインタラクションを制御できる。
Amazon Bedrockのモデル評価ツールを使って、自動評価または人間による評価を通じて数ステップで、モデルを評価、比較して、ユースケースに最適なモデルを特定できる。
AWSは、生成AIアプリケーションに堅牢(けんろう)な保護を追加するために、Amazon Bedrock Guardrailsを統合し、DeepSeek-R1モデルでAmazon Bedrockのモデル評価機能を使用することを強く推奨している。
DeepSeek-R1は、米国東部(バージニア北部)、米国東部(オハイオ)、米国西部(オレゴン)のAWSリージョンにおいて、Amazon Bedrockでフルマネージドで提供されており、クロスリージョン推論(異なるリージョン間でのルーティングを最適化した推論)がサポートされている。
Copyright © ITmedia, Inc. All Rights Reserved.