OpenAIはOpenAI o1-previewとo1-miniをリリースした。本稿では、これまでのモデルとの違いや利用可能なユーザー、利用制限などについて取り上げる。
(2024/10/05)
OpenAIは、同社のAIモデル向けの「Realtime API」(パブリックβ版)、「Chat Completions API」の音声入出力サポート、「ビジョンファインチューニング」機能、「Model Distillation」スイート、「プロンプトキャッシング」を発表した。
(2024/10/04)
DataFrameオブジェクトの指定した列のヒストグラムを描画することで、データの分布を視覚的に把握できます。また、年齢層のような考え方を基に、列のデータを一定のグループにまとめる(ビニングする)ことが可能です。その方法を見ていきましょう。
(2024/10/04)
データ分析の初歩から学んでいく連載(確率分布編)の第8回。t分布は母分散が分からない場合の平均値に関連する分布です。中心極限定理を出発点とし、正規分布と比較しながらt分布の姿を明らかにしていきます。続けて、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介します。
(2024/10/03)
randomモジュールのrandint関数やchoice関数、choices関数とstringモジュールで定義されている定数を組み合わせてランダムな文字列を生成する方法を紹介する。
(2024/10/01)
Alphabet傘下の自動運転システム開発企業Waymoは、Waymo Driverの事故率と人間の事故率を比較した調査結果を公開した。Waymoの自動運転技術がもたらす交通安全への影響を多角的に検証している。
(2024/09/30)
Metaは、同社の大規模言語モデルの最新版「Llama 3.2」を提供開始した。中小規模のビジョンモデル(11Bと90B)と、エッジデバイスやモバイルデバイスに搭載可能な軽量のテキスト専用モデル(1Bと3B)をラインアップしている。
(2024/09/30)
米国スタートアップ企業のNapkin AIは、テキストを分かりやすいビジュアルに変換するAIツール「Napkin AI」について、日本語など複数言語に対応したと発表した。
(2024/09/28)
Salesforce AI Researchは、大規模アクションモデル(LAM)と同社のLAM「xLAM」の概要について説明するブログエントリを公開した。LAMは、意思決定やアクションを行える点が特徴だ。
(2024/09/26)
ノークリサーチは、「2024年版 中堅・中小企業のITアプリケーション利用実態と評価レポート」内のコラボレーション分野(グループウェア、Web会議、ビジネスチャット)に関するダイジェストを公開した。中堅・中小企業が生成AI活用を進めていく上でも重要な役割を果たすという。
(2024/09/26)
itertoolsモジュールのaccumulate関数やpandasのDataFrameオブジェクトが持つcumsumメソッドやcumprodメソッドで累積和や累積積を求める方法を紹介する。
(2024/09/24)
Anthropicは同社のWebサービス「Claude.ai」において、Artifacts機能の一般提供を開始した。ユーザーはArtifactsを通じて生成されたコンテンツを編集したり、発展させたりできる。
(2024/09/21)
NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。
(2024/09/20)
IDCは、世界の経済と雇用の観点からAIの影響を評価した調査報告書を発表した。企業がAIを導入して既存の業務運営に活用し、顧客により良い製品やサービスを提供するための支出が、2030年までに累計19.9兆ドルの経済効果を世界にもたらすという。
(2024/09/20)
タイタニックデータセットを使って、欠損値の扱い方、不要な列の削除、カテゴリカルデータのエンコーディングなど、前処理の仕方を見ていきましょう。
(2024/09/20)
Googleは、大規模言語モデル(LLM)のハルシネーションの課題に対処するために、現実世界の統計データに接続するよう設計されたオープンLLM「DataGemma」を発表した。
(2024/09/19)
NVIDIAは、企業独自のAIアプリケーション構築を支援する「NIM Agent Blueprint」を発表した。生成AI活用のユースケースに応じた、サンプルアプリケーション、レファレンスコード、カスタマイズ用文書、デプロイ用のHelmチャートを提供するという。
(2024/09/18)
用語「ジャッカード距離」について説明。集合間の「異なり」(=非類似度)を評価する尺度で、「2つの集合がどれだけ異なっているか」を測定するために使用される。集合間の「重なり」(=類似性)を測定するジャッカード類似度と対になる概念。値は0〜1で、1に近いほど「異なっている(=似ていない)」を意味する。
(2024/09/18)
dir関数とgetattr関数を組み合わせてオブジェクトの属性とその値を取得する方法やinspectモジュールが提供する関数を使って同様なことをさらに詳細に行う方法を紹介する。
(2024/09/17)
Microsoftは、AIプラットフォーム「Azure AI」の機能強化について発表した。小型の言語モデルであるPhiモデルファミリーの追加やAIソリューションの構築に役立つ新しい機能が使えるようになった。
(2024/09/12)
Gartnerは、2027年までに生成AIソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。
(2024/09/12)
データ分析の初歩から学んでいく連載(確率分布編)の第7回。カイ二乗分布は標準得点の二乗和の分布です。標準得点とは何か、二乗することはどういう意味を持つのか、といった基本的なところからカイ二乗分布の姿を明らかにしていきます。続けて、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介します。
(2024/09/12)
OpenAIは「GPT-4o」のファインチューニング機能の提供を開始した。コーディングやクリエイティブな執筆といったユースケースで、モデルの出力結果に大きな影響を与える可能性があるという。
(2024/09/11)
用語「オーバーラップ係数」について説明。集合間の類似性を評価する尺度で、「2つの集合の共通部分が、いずれかの集合のうち小さい方の集合の大きさと比べて、どれだけ大きいか」を測定するために使用される。値が1に近いほど「似ている」を、0に近いほど「似ていない」を意味する。部分的な一致が重要視される場面で利用されている。
(2024/09/11)
IDCの調査によると、2028年までにAI関連の世界的な支出が6320億ドルに達する見込みだという。特に生成AIへの投資が急増し、成長率59.2%を記録する見通しだ。
(2024/09/10)
base64モジュールが提供するb64encode関数とb64decode関数などを使って、文字列やバイナリファイルをBase64形式でエンコード/デコードする方法を解説する。
(2024/09/10)
KDDI、アルティウスリンク、ELYZAの3社は「コンタクトセンター業務特化型LLMアプリケーション」を開発した。アルティウスリンクのコンタクトセンター向けサービス「Altius ONE for Support」の標準機能として提供する。
(2024/09/09)
Claudeを開発したAnthropicは、企業用の生成AIアシスタント「Claude Enterprise」のサービス提供を開始した。
(2024/09/09)
用語「ジャッカード類似度」について説明。集合間の類似性を評価する尺度で、「2つの集合がどれだけ重なり合っているか」(=全体の要素数に対する共通部分の割合)を測定するために使用される。値が1に近いほど「似ている」を、0に近いほど「似ていない」を意味する。主にクラスタリングや文書比較などで利用されている。
(2024/09/09)
用語「レーベンシュタイン距離」について説明。2つの系列(文字列やDNA配列など)を比較して、一方から他方へ変換するのに最も少ない編集操作(挿入/削除/置換)の回数をカウントすることで、2系列間の距離を計測する方法。文章の編集作業量の計測、スペルチェック、データクリーニング、DNA配列の比較などに利用され、データ間の違いや類似度を評価できる。
(2024/09/09)
用語「ハミング距離」について説明。同じ長さの2つの系列(文字列やビット列)を比較して、異なる位置の数をカウントすることで、2系列間の距離(または類似度)を計測する方法。エラーチェックやデータ比較、クラスタリングに利用され、データ間の違いや類似度を直感的に評価できる。
(2024/09/09)