「Gmail」のスパムフィルターを大幅に強化したテキストベクタライザ「RETVec」 何がすごいのか?敵対的なテキスト操作に対する耐性が向上

Googleは、オープンソースの多言語テキストベクタライザ「RETVec」(Resilient & Efficient Text Vectorizer)を用いて「Gmail」の受信トレイの保護を大幅に強化した。

» 2023年12月07日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Googleは2023年11月29日(米国時間)、オープンソースの新しい効率的な多言語テキストベクタライザ「RETVec」(Resilient & Efficient Text Vectorizer)を用いて「Gmail」の受信トレイの保護を大幅に強化したことをセキュリティブログで明らかにした。

 GoogleのGmail、「YouTube」「Google Play」などのシステムは、フィッシング攻撃や不適切なコメント、詐欺などの有害コンテンツを識別するために、テキスト分類モデルを利用している。この種のテキストは、機械学習モデルによる分類が難しい。攻撃者が敵対的なテキスト操作(ホモグリフ《※》や見えない文字の使用、キーワード詰め込みなど)によって分類器を回避しようとするからだ。

(※)ホモグリフは、同一または非常によく似た形の複数の書記素、文字、字体や、こうした特性を持つ複数の文字の列を指す

RETVecでGmailのスパム分類器を強化

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。