Cohere、高精度なマルチモーダル検索を実現する埋め込みモデル「Embed 4」を提供開始:マルチモーダル/多言語検索やエージェント型AIアプリケーション構築を支援
Cohereは、企業がAIアプリケーションに情報検索/取得機能を追加できるようにする最新のマルチモーダル埋め込みモデル「Embed 4」の提供を開始した。
カナダのCohereは2025年4月15日(カナダ時間)、企業がAI(人工知能)アプリケーションに高度な情報検索/取得機能を追加できるようにする最新のマルチモーダル埋め込みモデル「Embed 4」の提供を開始した。これらの機能は、ビジネス上のコンテキストを理解する必要があるAIアシスタントやエージェントを構築する上で不可欠だという。
Embed 4は、Cohereのプラットフォームと「Microsoft Azure AI Foundry」「Amazon SageMaker」で提供されている。VPC(仮想プライベートクラウド)やオンプレミス環境へのプライベートデプロイ(展開)にも対応している。
Embed 4の主な特徴は以下の通り。
最先端のマルチモーダル機能
文書がテキストベースか、画像、表、グラフ、コード、図表などを含むかにかかわらず、複雑なPDFレポートや動的なプレゼンテーションスライドといった多面的な文書を正確かつ迅速に検索できる独自の機能を持つ。また、現実世界のノイズ(スペルミスやフォーマットの問題など)の多いデータや、スキャンされた、あるいは手書きの文書に対する検索でも、高いパフォーマンスを発揮するようトレーニングされている。
画期的なコンテキスト長
最大128K(12万8000)トークン(約200ページに相当)の長文の文書(アニュアルレポート〈年次財務報告書〉、製品マニュアル、詳細契約書など)の埋め込みを生成でき、文書全体の文脈を保持した検索を実現する。
優れた多言語機能
アラビア語、日本語、韓国語、フランス語など、100以上の言語に対応し、異なる言語間での検索(クロスリンガル検索)もできる。グローバル企業は言語の壁を越えて情報にアクセスできるという。
高いセキュリティを求められる業界向けの最適化と柔軟なデプロイ
金融、ヘルスケア、製造など、規制の厳しい業界特有のデータに対する理解が最適化されており、関連性の高い洞察の抽出に優れている。また、機密確保のため、VPCやオンプレミス環境へのデプロイにも対応している。
Cohereは「既存の埋め込みモデルでは、複雑でマルチモーダルなビジネス資料をネイティブに理解できないことから、企業は精度をわずかに上げるためだけに、煩雑なデータ事前処理パイプラインを開発せざるを得ない。Embed 4はこの問題を解決し、これまで検索不能だった膨大な情報から企業とその従業員が洞察を効率的に引き出せるようにする」とした上で、「『グローバル企業におけるマルチモーダル/多言語検索の基盤』『エージェント型エンタープライズAIアプリケーションの基盤』というユースケースで強みを発揮するモデルだ」と、述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Cohereの研究部門が高性能多言語モデル「Aya Expanse」を発表 日本語含む23言語で利用可能
Cohereの研究部門は高性能な多言語モデルファミリー「Aya Expanse」を発表した。23の言語にわたって優れた性能を発揮し、ベンチマークで他の主要なオープンウェイト(重み)モデルを上回っている。生成AIの活用を検討する企業が「RAG」を導入すべき5つの理由 Cohere
Cohereは、企業が生成AI活用を推進する上でRAGが重要な役割を果たすとし、5つの理由を解説した。Cohere、企業ワークロード向けLLM「Command R」のファインチューニング機能を提供開始
Cohereは、2024年3月に発表したエンタープライズワークロード向け大規模言語モデル「Command R」のファインチューニング機能を提供開始した。