「Yahoo!ニュース」の違反コメント対策に深層学習判定モデルを導入:検知数が約2.2倍に向上
ヤフーは、「Yahoo!ニュース コメント」で違反コメントへの対策をさらに強化した。新たに導入した「深層学習を用いた自然言語処理による判定モデル(AI)」によって、違反コメントの検知数が約2.2倍に向上した。
ヤフーは2020年3月6日、「Yahoo!ニュース コメント」で違反コメントへの対策を強化したと発表した。「深層学習を用いた自然言語処理による判定モデル(AI)」を、同社が独自に開発した深層学習特化型スーパーコンピュータ「kukai」で稼働させた。
これまでもYahoo!ニュースは、ユーザーから違反報告があった記事や、閲覧数の多い記事、特定ジャンルの記事といった優先順位を付けて、人手や機械学習によってコメントのパトロールを24時間365日体制で実施していた。そして、違反があれば、違反コメントの削除や、悪質なユーザーのアカウント停止といった処置を、主に人手で行ってきた。
深層学習特化型のスーパーコンピュータ「kukai」で判定モデルを実行
今回の対策強化に当たって導入した判定モデルには、1100万件のコメントデータなどを学習させた。実際に1週間分のコメントデータを使って、今回導入した判定モデルと、従来の「機械学習を用いた自然言語処理による判定モデル(AI)」を比較したところ、違反コメントの検知数が約2.2倍に向上したという。
新たに導入した判定モデルを実行するkukaiは、NVIDIAのGPU「Tesla P100」を160基備えた深層学習特化型のスーパーコンピュータ。kukaiは、2017年6月に発表された省エネ性能ランキング「GREEN500」で世界第2位を獲得するほど、省エネ性能に優れる。演算性能は、従来ヤフーが利用していたシステムの約225倍に当たる460.7TFLOPS(テラフロップス)で、消費電力1ワット当たりの演算性能は世界トップクラスの14.04GFLOPS/W(ギガフロップスパーワット)だとしている。
なおヤフーは、「今後、今回導入した判定モデルの結果をコメント表示順の改善にも採用し、より多くの人に読んでほしいコメントが上位に表示されるようにする」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 機械学習/統計学/データサイエンスの無償gacco動画、全まとめ【2022年秋版】
2022年3月末の最新状況に合わせて改訂。はじめてのAIから、機械学習、深層学習、自然言語処理、統計学、社会人のためのデータサイエンス(実用知識)、大学生のためのデータサイエンス(理論知識)まで、全28個の講義内容を紹介。本稿独自に考察した、学習者対象やお勧めの学習方法についても示す。 - 「インターネット」で勝てなかった日本が、「深層学習」で勝つには 東大・松尾豊氏
NVIDIAが開催した「GTC Japan 2018」で、東京大学 特任准教授、日本ディープラーニング協会 理事長の松尾豊氏が登壇。深層学習の原理や、深層学習に関する研究の現状について説明し、今後、実社会で深層学習がどう扱われていくのか、持論を展開した。 - 第7回 時系列データの予測を行う深層学習(RNN)を作成してみよう(TensorFlow編)
ディープラーニングの代表的手法「RNN」により時系列データの予測を行う機械学習モデルを構築してみる。RNNによる深層学習がどのようなものか体験しよう。