「埼玉県浦和市」も正しく修正、富士通がクレンジングソフト顧客データの氏名・住所表記を統一

» 2009年09月14日 00時00分 公開
[垣内郁栄,@IT]

 富士通は企業が保有する氏名や住所データの表記を統一するデータクレンジング・ソフトウェア「Interstage Information Quality」を9月9日に販売開始した。独自の解析技術を使うことで、氏名や住所の表記を高精度に統一でき、マスターデータ統合やマーケティング分析などに活用できるという。

 日本人の名前や日本の住所はさまざまな表記があり、複数の登録データを統合する際の障害になる。同じ人の名前でも登録データによって、漢字の字体が異なっていることが多い。また、住所表記も漢字が異なっていたり、「一丁目二番三号」という住所を「1-2-3」と表記したり、「1丁目2-3」と書くなどさまざまなタイプがある。近年の自治体合併で住所が変更されても、登録データに反映されていないことも多い。

富士通 ミドルウェア事業本部 データマネジメント・ミドルウェア事業部 事業部長 堀江剛氏

 これら異なる表記が混じった登録データを統合し、マーケティング活動などに活用するのは難しく、「日本特有の複雑さがデータ品質の向上を阻害している」(富士通 ミドルウェア事業本部 データマネジメント・ミドルウェア事業部 事業部長 堀江剛氏)という。

 富士通が10月下旬に出荷開始するInterstage Information Qualityは、これら日本語表記のうち、氏名の分かち書き(氏と名を分ける)と、住所の欠落補完、誤り補正、丁番地表記の標準化、旧住所を新住所に変換する機能がある。特に住所の表記統一については97%の成功率を誇るという。他社のクレンジング・ソフトウェアは前方一致方式で照合していることが多く、住所が省略されているとそれ以降を補正できない。これに対して、Interstage Information Qualityは総当たりで正しい住所を探す。登録データの全要素を辞書と照合することで正しいと思われる住所を見つけることができ、一部が省略された住所や誤りも補正できるという。

 富士通が蓄積している過去40年の住所データも利用でき、「埼玉県浦和市」を「埼玉県さいたま市浦和区」に修正するなど旧住所を新住所に補正できる。100万件のデータの場合、350秒で処理できるという(クアッドコアサーバを利用)。

 価格は1プロセッサライセンス(2コア)で250万円(税別)。住所辞書更新サービスがサーバ当たり年額80万円。Windows版のほか、Linux版とSolaris版を用意する。顧客データを多く持つ、流通や金融、公益企業が主なターゲット。富士通は、名寄せ・法人名のクレンジングができるソフトウェアも2010年に提供するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ