Anthropicは同社のWebサービス「Claude.ai」において、Artifacts機能の一般提供を開始した。ユーザーはArtifactsを通じて生成されたコンテンツを編集したり、発展させたりできる。
(2024/09/21)
NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。
(2024/09/20)
IDCは、世界の経済と雇用の観点からAIの影響を評価した調査報告書を発表した。企業がAIを導入して既存の業務運営に活用し、顧客により良い製品やサービスを提供するための支出が、2030年までに累計19.9兆ドルの経済効果を世界にもたらすという。
(2024/09/20)
タイタニックデータセットを使って、欠損値の扱い方、不要な列の削除、カテゴリカルデータのエンコーディングなど、前処理の仕方を見ていきましょう。
(2024/09/20)
Googleは、大規模言語モデル(LLM)のハルシネーションの課題に対処するために、現実世界の統計データに接続するよう設計されたオープンLLM「DataGemma」を発表した。
(2024/09/19)
NVIDIAは、企業独自のAIアプリケーション構築を支援する「NIM Agent Blueprint」を発表した。生成AI活用のユースケースに応じた、サンプルアプリケーション、レファレンスコード、カスタマイズ用文書、デプロイ用のHelmチャートを提供するという。
(2024/09/18)
用語「ジャッカード距離」について説明。集合間の「異なり」(=非類似度)を評価する尺度で、「2つの集合がどれだけ異なっているか」を測定するために使用される。集合間の「重なり」(=類似性)を測定するジャッカード類似度と対になる概念。値は0〜1で、1に近いほど「異なっている(=似ていない)」を意味する。
(2024/09/18)
dir関数とgetattr関数を組み合わせてオブジェクトの属性とその値を取得する方法やinspectモジュールが提供する関数を使って同様なことをさらに詳細に行う方法を紹介する。
(2024/09/17)
Microsoftは、AIプラットフォーム「Azure AI」の機能強化について発表した。小型の言語モデルであるPhiモデルファミリーの追加やAIソリューションの構築に役立つ新しい機能が使えるようになった。
(2024/09/12)
Gartnerは、2027年までに生成AIソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。
(2024/09/12)
データ分析の初歩から学んでいく連載(確率分布編)の第7回。カイ二乗分布は標準得点の二乗和の分布です。標準得点とは何か、二乗することはどういう意味を持つのか、といった基本的なところからカイ二乗分布の姿を明らかにしていきます。続けて、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介します。
(2024/09/12)
OpenAIは「GPT-4o」のファインチューニング機能の提供を開始した。コーディングやクリエイティブな執筆といったユースケースで、モデルの出力結果に大きな影響を与える可能性があるという。
(2024/09/11)
用語「オーバーラップ係数」について説明。集合間の類似性を評価する尺度で、「2つの集合の共通部分が、いずれかの集合のうち小さい方の集合の大きさと比べて、どれだけ大きいか」を測定するために使用される。値が1に近いほど「似ている」を、0に近いほど「似ていない」を意味する。部分的な一致が重要視される場面で利用されている。
(2024/09/11)
IDCの調査によると、2028年までにAI関連の世界的な支出が6320億ドルに達する見込みだという。特に生成AIへの投資が急増し、成長率59.2%を記録する見通しだ。
(2024/09/10)
base64モジュールが提供するb64encode関数とb64decode関数などを使って、文字列やバイナリファイルをBase64形式でエンコード/デコードする方法を解説する。
(2024/09/10)
KDDI、アルティウスリンク、ELYZAの3社は「コンタクトセンター業務特化型LLMアプリケーション」を開発した。アルティウスリンクのコンタクトセンター向けサービス「Altius ONE for Support」の標準機能として提供する。
(2024/09/09)
Claudeを開発したAnthropicは、企業用の生成AIアシスタント「Claude Enterprise」のサービス提供を開始した。
(2024/09/09)
xAIはGrok-2のβ版をリリースした。Grok-2は最先端の推論機能を備えたLLMで、X PremiumまたはPremium+ユーザーは、Xアプリ上で利用できる。
(2024/09/07)
機械学習やディープラーニングにおいて練習材料としてよく使われるタイタニックデータセットを使って、その概要や、性別と生死に関連があるかどうかを調べてみましょう。
(2024/09/06)
Gartnerは、「デジタルワークプレースアプリケーションのハイプサイクル2024」を発表した。このハイプサイクルの中で「日常型AI」と「デジタル従業員体験」が、2026年までに主流になると予測している。
(2024/09/04)
用語「ダイス係数」について説明。集合間の類似性を評価する尺度で、「2つの集合の共通部分が、それぞれの集合の大きさと比べて、どれだけ大きいか」を測定するために使用される。値が1に近いほど「似ている」を、0に近いほど「似ていない」を意味する。少数の一致でもその正確性が重要視される場面で利用されている。
(2024/09/04)
Pythonで何らかの値を一定の書式に従って文字列に変換するにはformat関数や文字列のformatメソッド、f文字列を使用する。このときに一定の書式を指定するのに使うのが書式指定子である。その指定方法をまとめて紹介する。
(2024/09/03)
日立製作所は、専門的な業務に適したLLMの構築や継続的な改善を支援する「業務特化型LLM構築・運用サービス」と、実行環境の構築、運用を担う「生成AI業務適用サービス」の提供を2024年10月1日に開始する。
(2024/08/30)
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載(確率分布編)の第6回。正規分布は平均値を「山」の中心として、標準偏差によって左右対称に「すそ」が広がるような形の連続型確率分布です。正規分布がどのようなものかを確認した後、確率密度関数や累積分布関数の求め方や可視化の方法を解説し、利用例などを紹介していきます。
(2024/08/29)
Clouderaは、レポート「エンタープライズAIと最新のデータアーキテクチャを巡る状況」を発表した。AIを導入しているITリーダーの割合は多いものの、それに関するデータインフラや従業員スキルの整備は進んでいないことが分かった。
(2024/08/28)
用語「ジャッカード類似度」について説明。集合間の類似性を評価する尺度で、「2つの集合がどれだけ重なり合っているか」(=全体の要素数に対する共通部分の割合)を測定するために使用される。値が1に近いほど「似ている」を、0に近いほど「似ていない」を意味する。主にクラスタリングや文書比較などで利用されている。
(2024/08/28)
GoogleはGemini 1.5 Proの更新内容とGoogle AI StudioおよびGemini APIの更新内容を同社公式ブログで発表した。Gemini 1.5 Flashモデルの価格が大幅に引き下げられ、チューニング機能が全ての開発者に開放された。
(2024/08/27)
Gartnerは、先進テクノロジーに関するハイプ・サイクルの最新版「Hype Cycle for Emerging Technologies, 2024」を公開した。
(2024/08/27)
2つの自然数の最大公約数を求めるために使われるユークリッドの互除法の説明と、それに基づいて最大公約数を求める関数の実装を幾つか紹介する。
(2024/08/27)
Pandasでデータを処理する際には避けては通れない欠損値。その概要と欠損値かどうかの判定方法、欠損値が行や列に含まれているかを確認する方法、それら数をカウントする方法、欠損値を含む行や列を削除したり置き換えたりする方法を紹介します。
(2024/08/23)
「知識ゼロから学べる」をモットーにした機械学習入門連載の第3回。数値予測に使われる「線形回帰」は、最も基本的な機械学習のアルゴリズムです。その概要と仕組みを図解で学び、Pythonとscikit-learnライブラリを使った実装と実践も体験します。初心者でも安心して取り組める易しい内容です。
(2024/08/22)