os.pathモジュールのsplit関数はファイルパスを末尾の要素とそれ以外に分割する。その使い方と注意点を紹介する。
(2024/03/19)
KPMGジャパンは、生成AIを活用したアドバイザリーサービスの提供を開始すると発表した。企業のデータ分析プロセス構築を支援する。KPMGのデータ分析に関する知見と、あずさ監査法人のデータアナリティクスのノウハウを活用した。
(2024/03/18)
IBMとNASAは、宇宙物理学、惑星科学、地球科学、太陽物理学、生物物理科学に関する文献を学習させた言語モデルを、Hugging Faceで公開した。
(2024/03/18)
ガートナージャパンは「デジタルワークプレースと働き方の未来に関する展望」を発表した。同社によると「2027年までに日常型AIを主導する組織を設けない企業の8割は、生成AI導入の乱立と混乱で成果を生み出せなくなる」という。
(2024/03/15)
VS CodeでJupyter Notebookを使うための準備をして、ノートブックを作成したり、ノートブックを操作したりする方法を紹介します。
(2024/03/15)
GoogleがリリースしたGemini 1.5の強みの一つに、ロングコンテキストウィンドウがある。Googleが実装したロングコンテキストウィンドウとは何か、そしてこの機能が開発者にどのように役立つのか。
(2024/03/14)
Mistral AIがリリースしたLLM、Mistral Largeはテキスト理解、変換、コード生成などさまざまなタスクに活用できる。MistralはAzure AI Studioなどで利用できる。
(2024/03/13)
用語「RAG」について説明。ChatGPTなどのチャットAIに独自の情報源を付与する仕組みのことで、具体的には言語モデルによるテキスト生成に特定の情報源(ナレッジベース)の検索を組み合わせること。これには、生成内容の正確さを向上させるメリットがある。
(2024/03/13)
Ollama Projectは、オープンソースの大規模言語モデルをローカル環境で実行できる「Ollama」のWindowsプレビュー版を公開した。
(2024/03/12)
os.path.splitext関数は渡されたパスを拡張子とそれ以外の部分に分割する。その基本的な使い方と注意点、拡張子ごとに処理を切り分けるサンプルコードを紹介する。
(2024/03/12)
Stability AIは、同社の画像生成モデル「Stable Diffusion」の最新版となる「Stable Diffusion 3」を発表した。
(2024/03/11)
Googleは、同社の大規模言語モデル「Gemini」の次世代モデルである「Gemini 1.5」を発表した。
(2024/03/09)
用語「グラウンディング」について説明。特定の知識や情報源(ナレッジベースなど)に基づいて言語モデルの生成内容を裏付けるプロセスのことで、チャットAIに独自の情報源を付与するRAG(検索拡張生成)という仕組みがその代表例。チャットAIがもっともらしいウソを答える問題(=ハルシネーション)を減らせるといったメリットがある。
(2024/03/06)
Microsoftは、「Azure OpenAI Service」で独自のデータを使用できる新機能「Azure OpenAI Service On Your Data」の一般提供を開始した。
(2024/03/05)
Pythonでは整数値(int型)の値を16進数表現に変換するには幾つかの方法がある。その中からhex関数を使う方法と文字列の書式指定を使って変換する方法を紹介する。
(2024/03/05)
ハルシネーションとは、チャットAIなどが、もっともらしい誤情報(=事実とは異なる内容や、文脈と無関係な内容)を生成することを指す。AIから返答を受け取った人間が「本当かどうか」の判断に困るという問題がある。この問題を回避する方法として、独自の情報源を付与するRAGや、Webアクセスを含める機能などがある。
(2024/03/04)
データセット「Iris」について説明。150件のあやめの「表形式データ(花びら/がく片の長さと幅の4項目)」+「ラベル(3種類のあやめの分類)」が無料でダウンロードでき、多クラス分類問題などのディープラーニングや統計学/データサイエンスに利用できる。scikit-learnとTensorFlowにおける利用コードも紹介。
(2024/03/04)
正規化とは、比較や分析を容易にするために、データの単位やスケールを共通の基準に整えること。単に「正規化」(Min-Max法)と言った場合は、データを最小値「0」〜最大値「1」にスケーリングすることを意味する。また、正規化の一種である標準化は、データを平均「0」、分散「1」にスケーリングすることを意味する。
(2024/03/04)
IDC Japanは、2024年以降のAIの取り組みや課題に関する予測を発表した。同社は「AIなど最新の自動化技術を事業活動に展開することで、自社のブランド力を向上させられる」としている。
(2024/02/29)
ベクトルデータベースとは、テキストなどのデータを数値ベクトル(埋め込み)として保存するデータベースを指す。「ベクトルストア」とも呼ばれる。ベクトル検索により、意味的に類似する情報を探せるのが特徴で、チャットAIのRAG構築に役立つ。本稿ではベクトル検索の機能を持つ代表的な製品の概要もそれぞれ簡単に紹介する。
(2024/02/29)
Googleは、大規模言語モデル「Gemma」を提供開始した。「Gemini」と同じ研究と技術に基づく軽量のオープンモデルファミリーだ。
(2024/02/27)
ガートナージャパンは、コンサルティングサービスに関する見解を発表した。新たなアイデアやビジネスに関する支援を除き、コンサルティングベンダーに委託している業務をAIが担うようになっていくという。
(2024/02/27)
Pythonで整数値(int型)の値を2進数表現に変換するには幾つかの方法がある。その中からbin関数を使う方法と文字列の書式指定を使って変換する方法を紹介する。
(2024/02/27)
AIはエンジニアから仕事を奪うのか?――生成AIへの期待値の高まりとともに、改めてAIとの向き合い方が問われている。仕事でAIを使うことが当たり前になる時代に、エンジニアはどう振る舞うべきか。@ITが開催したセミナーからそのヒントを探る。
(2024/02/27)
なあ、何で世間はお年寄りを大切にするか知ってるか? それはな、歴史ある生き物には利用価値があるからなんだよ!
(2024/02/26)
Googleは「Bard」日本語版で「Gemini Pro」が使用できるようになったことを発表した。また、Bardの英語版に画像生成機能を導入した。
(2024/02/24)
OpenAIは、テキストから最大60秒の動画を生成するAIモデル「Sora」を発表した。
(2024/02/22)
データ分析の初歩からステップアップしながら学んでいく連載の第15回。複数の説明変数を基に目的変数の値を予測する重回帰分析について、Excelを使って手を動かしながら学んでいきましょう。カテゴリーなどの数値ではないデータを説明変数として利用する方法や、二次関数などの多項式を基に回帰分析する方法も紹介します。
(2024/02/22)
文字列に特殊な文字を含めるにはエスケープシーケンスを使用する。代表的なエスケープシーケンスの使用例を紹介する。
(2024/02/20)