IPアドレスからどのようにして位置情報や企業情報を取得できるのか。IPv4だけでも43億個あるIPアドレスの全てを、網羅的にデータベース化してきた創業者にその仕組みを聞いた。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
IPアドレスは、しばしば“インターネットの住所”に例えられる。これは“どこのどの相手”と通信するのかを識別するためにIPアドレスが使われるためだが、「203.0.113.1」といったIPアドレスから、それが“地球上のどの場所”に当たるのかを推定できる人はほとんどいないだろう。
だが実際、IPアドレスは場所を特定する「ジオロケーション」技術の一つとして、閲覧する場所に応じてWebサービスの表示を切り替える仕組みや、金融サービスの不正検知、マーケティング戦略などに応用されている。位置情報に加え、それに付随する企業情報などもIPアドレスにひも付けて提供されていることがある。
なぜIPアドレスから場所や企業の情報が分かるのか――。IPアドレスの割り当てに関して一部公開されている情報はあるが、それだけで地区町村レベルの高精度の位置情報を得られるわけではない。
IPアドレスにひも付く位置情報や企業情報のデータベースを提供するGeolocation Technology(旧:サイバーエリアリサーチ)の代表取締役社長である山本敬介氏に、IPアドレスから位置情報が得られる仕組みや、“数十億個”以上もの膨大なIPアドレスをどう調査してきたのか、それをどう活用できるのかなどを聞いた。
ISDN(Integrated Services Digital Network)の時代から蓄積されてきたネットワークに関する知見とノウハウがなければ、特定し得ない情報も多いという。
Geolocation TechnologyではIPv4(Internet Protocol version 4)だけでも43億個あるIPアドレスを含め、IPv6(Internet Protocol version 6)を含めて全てのIPアドレスを網羅し、そのデータベースでは日次で大量のIPアドレス情報の更新を続けているという。山本氏がこの事業を立ち上げたのは、IPアドレスから位置情報を提供する仕組みがまだ一般的になる前の、2000年のことだ。
静岡県庁と、静岡のFM放送局から寄せられた2つの要望が、IPアドレスを基に位置情報を提供する事業で会社を立ち上げるきっかけになったという。当時山本氏は、陸上自衛隊の通信部隊から、地元静岡県のインターネットサービスプロバイダー(ISP)に転職し、従事していた。「インターネットに関する相談事のほとんどがISPに持ち込まれていた」(同氏)時代だった。
当時の静岡県知事からは「県民と県外の人でどのWebページを見ているかランキングを出したい」という要望があった。地元FM放送局からは「バナー広告を地域ごとに出し分けたい」という要望があった。
この要望に応えるためには、Webを閲覧しているユーザーの位置情報を何らかの方法で特定する必要があるわけだが、「当時、これらの領域はまだ技術的に確立されていなかった」と山本氏は振り返る。
当時はまだ、ISDNによるダイヤルアップ(電話回線を使ったインターネットに接続する方式)でインターネットに接続するのが主流の時代。実現方法を考えるために自社のネットワーク網を見ているとき、アクセスポイント(通信ネットワークにアクセスするための接続点)ごとに、固有のIPアドレス帯が割り振られており、電話番号の市外局番とIPアドレスをひも付けられることに気が付いたという。
全国のISPのネットワークでも同様だとすれば、全てのISPのアクセスポイントで使われているIPアドレスを調べれば、IPアドレスと市外局番という位置情報が結び付いたデータベースを作れる。市外局番は地域を識別するための電話番号の構成要素だ。当時、静岡県内でも10個ほどあったため、静岡県内を地域ごとに10個ほどに割れることになる。
まずは静岡県内で始め、それを本格的に事業化したかったというが、当時勤めていたISPの経営幹部に事業計画書を持って相談したものの、6000万円ほどと試算した予算の確保が難しいという判断だった。「静岡県庁とFM放送局からその必要性を訴え掛けられたことで、確実にこの市場はあるなと思った」と振り返る山本氏。結局、自ら起業するという選択をした。立ち上げ資金は自身で集め、後はエンジェル投資家やベンチャーキャピタルからの資金調達で賄った。
当時、全国に2000社ほどのISPがあった。アクセスポイントのIPアドレスを調べるため、ひたすらISPに加入して会員になり、同社の拠点がある静岡県三島市からダイヤルアップ接続をするという作業を繰り返した。北海道から沖縄までアクセスポイントを接続して、IPアドレスを集めていった。
インターネット接続はその後、ADSL(Asymmetric Digital Subscriber Line)や光通信によるブロードバンドの時代へと移り変わっていった。ダイヤルアップによって電話番号に基づく地域情報とIPアドレスをひも付けることはできなくなったが、「当時に構築されたネットワークがそのまま生かされている部分もある」(山本氏)という。その知見やデータの蓄積が、現在のネットワークにおいて地域特定をする際にもベースになっているそうだ。
ADSLでは市外局番は使えないので、ネットワークのつながり、通信経路に着目したという。インターネット上で自分のコンピュータから目的のサーバまで、どの経路をたどっているのかを調べるための「トレースルート」を繰り返して、日本国内のネットワーク図を作っていった。
はじめはISDNのような電話番号に基づく規則性が特定できずに困ることもあったという。地域を特定するための鍵の一つになったのは、ルーターに「静岡」や「東京」といった名称が付いていることだった。「ISPのルーターだとそうした名前が付いていることがよくあり、中には市区町村レベルで名称が付けられている非常に分かりやすいISPもある」(山本氏)
もう一つ鍵になるのが、顧客から寄せられるフィードバックだという。同社が提供するデータベース「SURFPOINT」では、事業開始当初からインターネット業界の企業などが顧客になった。「『サービスの精度が良くなるのであれば』ということで、IPアドレスと位置情報をひも付けた情報を協力的にフィードバックしてくれているという。
これは同社では「DFLS(Daily Feedback Loop System)」という名称で仕組み化されている。独自に調べ上げたデータにこうしたフィードバックも加えることで、全く見当が付かない位置情報も割り出せるようになるという。同社が“ネットトレーサー”と呼ぶ専門調査員も日々、膨大な量のIPアドレスの調査に当たっている。「25年の蓄積がデータベースの精度を支える基礎になっている」(山本氏)
とはいえIPv4のIPアドレスだけでも43億個に及び、それを調べ上げるのはとてつもない作業だ。地域を特定するためにホスト名(IPアドレスにひも付いた機器やサーバの名称)を手掛かりにするために、IPv4のIPアドレス全てを逆引きで調べ上げたりもした。その際、アクセスが集中し過ぎて地元のISPのDNS(名前解決)サーバを落としてしまったこともあったという。さすがにその時は厳しく注意されたということで、それ以降は「アクセスが集中しないように分散させて調査している」という。
2000年の12月に最初にデータベースをリリースした際、収録していたIPアドレスの数がちょうど百万個ぐらいだったが、それが今ではIPv4のアドレス43億個全てを収録しており、それにIPv6も加えて網羅的に収録している。
新たに割り振られるIPアドレスの付属情報を調査する際は、日本国内では各ISPなどの組織にどのIPアドレス帯が割り振られているのかをJPNIC(Japan Network Information Center)が公開しており、まずはこうした一次情報がベースになる。その上で独自に調査しているデータも組み合わせながらデータベースの更新をしているという。
企業情報も調査
企業情報については、IPアドレスから逆引きによってホスト名を調べ、そのドメイン名に「www」を付けるなどして企業の特定につながる情報を調べているという。こうして企業に関するさまざまなデータをIPアドレスにひも付けることによって、営業活動やマーケティングに直結する情報が得られるというわけだ。
今ではAI(人工知能)を使ってデータの自動分類をしているが、それでも特定し切れない不明なものは残る。そうした場合は、IPアドレスの割り振られ方や、地域ごとに集中しているIPアドレス帯などについて、専門の知見と経験を持った人間による確認が最終的には生きてくる。
「日本のインターネットのネットワーク構成の移り変わりを理解していることが強みになっている」(山本氏)。今はホスト名を見ただけでは位置情報を特定するものが難しいネットワークも増えているというが、過去からのつながりを押さえていることで、ネットワークのつながりから特定することが可能になっている。
今でこそ広告配信や不正検知、マーケティングなどでIPアドレスにひも付く情報が広く使われているが、2000年に創業した際、この分野は国内ではほぼ未開拓だった。
事業を始めた当初、同社のサービスに最初に目を付けたのがインターネット広告業界だった。最初の顧客は、ちょうど日本でジオターゲティング広告事業を始めようとしていた米国のインターネット広告の配信インフラ会社Double Clickだ。同社は2008年にGoogleに買収されている。
この最初の採用をきっかけに、国内でもインターネット広告やWebマーケティングを中心に顧客が増えた。今では不正検知などのセキュリティ領域を含めて、より幅広く活用されるようになっているという。
IPアドレスから分かる情報やその活用領域、IPアドレスの枯渇やIPv6の動向などについては次回にまとめる。
AIボットやDDoSが増加、HTTP/3とIPv6の普及も――インターネットで起きた主要動向
その不正ログイン対策は抜けるのか? 「突破されない」認証設計の10原則
プロトコル(通信プロトコル)とは? TCP/IPとは? 分かりやすく解説Copyright © ITmedia, Inc. All Rights Reserved.