ニュース
Python向け日本語自然言語処理ライブラリ「GiNZA」、リクルートがGitHubで公開:新元号「令和」にも対応
リクルートのAI研究機関であるMegagon Labsは、Python向け日本語自然言語処理ライブラリ「GiNZA」をオープンソースとしてGitHubで公開した。国立国語研究所のテキストコーパスを利用した学習済みモデルも組み込んだ。
リクルートは2019年4月2日、Python向け日本語自然言語処理ライブラリ「GiNZA(ギンザ)」をオープンソースソフトとして公開したと発表した。1.0.1版では新元号「令和」にも対応した。
公開したのは同社のAI(人工知能)研究機関であるMegagon Labs。同ライブラリでは、国立国語研究所との共同研究成果の学習モデルを用いた。
GiNZAは、Python向けの自然言語処理ライブラリ「spaCy」をフレームワークとして利用し、オープンソースの形態素解析器「Sudachi」のPython版である「SudachiPy」を内部に組み込んだ。
import spacy nlp = spacy.load('ja_ginza_nopn') doc = nlp('依存構造解析の実験を行っています。') for sent in doc.sents: for token in sent: print(token.i, token.orth_, token.lemma_, token.pos_, token.dep_, token.head.i) print('EOS')
文単位で依存構造解析結果を出力するサンプルコード
日本語は取り残されていた
関連記事
日本語の自然言語解析APIをNTT Comが提供、対話用AIエンジンの機能を利用
NTTコミュニケーションズは、日本語の自然言語解析API「Communication Engine “COTOHA API”」の提供を開始した。構文解析、固有表現抽出、キーワード抽出、類似度算出、文タイプ判定、照応解析、ユーザー属性推定といった機能を、さまざまなサービスに組み込むことができる。機械翻訳は、翻訳家の仕事を奪うのか――「人工知能」を作る上での良質な栄養素とは?
外国語を翻訳するときに使う「機械翻訳」。ニューラルネットワークによって精度が上がったものの、人間の助けはまだまだ必要だ。さらなる精度向上をするには、何が必要なのかGengoプロダクト部長のチャーリー・ワルター氏に話を聞いた。定型業務を対話とAIで自動化――DTCが「Robotics & Cognitive Automation」サービスを提供開始
デロイト トーマツ コンサルティングは、「Robotics & Cognitive Automation」サービスの提供を開始する。NTTコミュニケーションズの自然言語解析AIエンジンを利用しており、会話だけで定型業務を自動化できる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.