Google、ビジョン言語モデル「PaliGemma 2」を発表　化学式、楽譜、胸部X線など多様なタスクに対応：事前訓練済みモデルをKaggleやHugging Faceで公開

Googleは、同社のビジョン言語モデル「PaliGemma」の最新版となる「PaliGemma 2」を発表した。事前訓練済みのモデルおよびコードをHugging FaceやKaggleで閲覧、ダウンロードできる。

» 2024年12月25日 08時00分公開

[＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　Googleは2024年12月5日（米国時間）、同社のビジョン言語モデル（VLM）「PaliGemma」の最新版となる「PaliGemma 2」を発表した。

　PaliGemma 2は、「Gemma 2」をベースに、視覚機能を追加して構築されたモデルだ。画像とテキストの両方を入力として受け取り、テキストを出力する。Googleによると、画像や短編動画のキャプション生成、視覚的質問応答、テキスト読み取り、オブジェクト検出、オブジェクトセグメンテーションなど、幅広い視覚言語タスクにおいてパフォーマンスを発揮するよう設計されているという。

　「既存のPaliGemmaユーザーは、主要なコードを書き換えることなくPaliGemma 2にアップグレードできる。特定のタスクやデータセットに対して簡単にファインチューニングが可能で、ニーズに合わせてモデルの性能をカスタマイズできる」と、Googleは述べている。

　Googleは、PaliGemma 2の主な特徴、前世代モデルからの変更点を次のように説明している。

PaliGemma 2の主な特徴

スケーラブルなパフォーマンス

　PaliGemma 2は、複数のモデルサイズ（3B、10B、28Bパラメーター）と解像度（224px、448px、896px）に対応しており、パフォーマンスを最適化できる。

長文キャプション生成

　PaliGemma 2は、単純な物体識別だけでなく、画像に対して詳細でコンテキストに適したキャプションを生成する。アクション、感情、シーン全体のストーリーを説明できる。

新しい分野への拡大

　PaliGemma 2は、化学式の認識、楽譜の認識、空間推論、胸部X線レポートの生成で、優れたパフォーマンスを示している。

PaliGemma 2の利用方法

　事前訓練済みのモデルおよびコードをHugging FaceやKaggleで閲覧、ダウンロードできる。またGoogleのGitHubリポジトリ（google-gemini/gemma-cookbook）で公開されているノートブックを使用して試すこともできる。

関連記事

AIコーディングアシスタント「GitHub Copilot」で無料プラン開始　コード補完数などの制限は？
GitHubは、AIコーディングアシスタント「GitHub Copilot」の無料プラン「GitHub Copilot Free」の提供を開始した。
Google、最新のAIモデルファミリー「Gemini 2.0」を発表　AIコーディングエージェント「Jules」など最新の取り組みを紹介
Googleは、エージェント時代に向けた最新のAIモデルファミリー「Gemini 2.0」を発表し、その最初のモデルの試験運用版リリースや、Gemini 2.0を用いたAIエージェントの研究開発など、関連する一連の取り組みも紹介した。
オープンマルチモーダルAI「Molmo」リリース　公開された4つのモデルのパフォーマンス、既存モデルとの違いとは？
アレン人工知能研究所は、オープンマルチモーダルAI「Molmo」を発表した。最初のリリースとして、4つのモデルを公開した。

関連リンク

Copyright © ITmedia, Inc. All Rights Reserved.

SpecialPR

アイティメディアからのお知らせ

キャリア採用の応募を受け付けています

スポンサーからのお知らせPR

SpecialPR

＠IT eBook

【無料】「サーバなんて触ったことないから分からない」人も必見　AWSを題材にサーバとストレージの基礎が学べる電子書籍150ページ

AI時代のエンジニア像とは？　まつもとゆきひろ氏が語る「ジュニア不要論」の危機【ディレクターズカット収録】

シンギュラリティはすぐそこに？　超IT用語解説漫画「食べ超」で縦横無尽に未来を夢想しよう

「ポテチの量は毎回違う？」そのギモン、Excel×確率分布で解けます　無料eBook『Excelで学ぶ、やさしい確率分布』配布中

» 一覧ページへ

注目のテーマ

その「AIコーディング」は本当に必要か？

システム開発ノウハウ【発注ナビ】PR

編集部からのお知らせ

＠IT NETWORK Live 2026 夏【Amazonギフトカードプレゼント】

あなたにおすすめの記事PR

@ITについて

RSSについて

＠ITのRSS一覧

アイティメディアIDについて

アイティメディアIDとは

メールマガジン登録

＠ITのメールマガジンは、もちろん、すべて無料です。ぜひメールマガジンをご購読ください。

申し込みページへ

ITmediaはアイティメディア株式会社の登録商標です。

メディア一覧 | 公式SNS | 広告案内 | お問い合わせ | プライバシーポリシー | RSS | 運営会社 | 採用情報 | 推奨環境