国内の総合辞書検索屋への挑戦者、ウェブリオとは?:ものになるモノ、ならないモノ(11)
数回にわたる国内のWeb2.0企業シリーズ。第3弾の今回は、100を超える専門辞書の集合体、Weblio。100を超える専門辞書の集合体、Weblio。既存辞書を登録していくという方針は、ユーザー参加型のCGM辞書を超えられるか?(編集部)
総合検索辞書サイト、ウェブリオオフィスの熱気
このコラムでは何回かに分けて、Web 2.0周辺の話題をお届けしている(参照記事:Webちらし、国産RSSリーダーと人工知能化の野望、API公開のずいぶん前からすでにWeb2.0でした)。@ITのようなオンラインメディアで何かを取り上げるのであれば、いままさに巣立とうとしている面白いサービスを応援したいという気持ちを持ちつつ、日々ネットをウオッチしている。
そんな中、「バーチカル検索」「マッシュアップ」「ロングテール」といった、最近のトレンドを示す言葉がポンポンと気持ちよく当てはまる格好の取材対象を見つけた。「Weblio」は、ネット上に点在する辞書、百科事典、用語事典のたぐいを一堂に集めた総合検索辞書サイトだ。
昨年、大学を卒業したばかりの辻村直也社長を先頭に平均年齢24.4歳の若い5人組のチーム「ウェブリオ株式会社」が運営しているサービスだが、オシャレでカワイイサイトデザインからスマートなIT企業のそれを連想して訪れた筆者の期待は、見事に裏切られた。渋谷の JR線路沿いに建つマンションのワンルームオフィスに入った途端、その部屋の熱気に気おされてしまったのだ……。
デジタル機器が吐き出す特有の熱気と、オルガン曲の通奏低音のように地べたをはうファンの騒音が、ドアの内側の空気を外の世界とは別物にしている。いや、それだけではない。若い才能が、ほとばしる情熱を体中に収め切れずに発する熱気もいくばくかは含まれているのだろうか。
8畳ほどのワンルームの1室には、いく台かのサーバ(台数は非公開、一部はホスティングに運用を任せている)が並べられており、ハードディスクのアクセスランプが忙しげに点滅している。その横で、ジワジワと肌を包み込むような熱気と通奏低音に包まれながら話を聞いた。
転載許可のための飛び込み営業からスタートした
まずは、Weblioを「バーティカル検索」という面で見ていこう。というか、これはもう説明の必要はないだろう。ネット上に点在する辞書、百科事典、用語事典をここのサイトから一気に検索できるのだから、そのものズバリのサービスといえよう。
ただ、そのためには、元ネタとなる辞書、百科事典、用語事典を、転載するために集めなければならない。「Weblio登録辞書一覧」を見たとき、まさか勝手に情報を引っ張ってきてはいないと思うけれど……、と半信半疑でいたのだが、取材を始めて開口一番その点を聞いた。
「最初に集めた辞書は、飛び込み営業のような形で電話や訪問をして許可をもらってから、サイトに掲載した」(辻村社長)というから、IT企業といえどもリアルな世界では泥臭い営業マンさながらの動きをしていることに、ちょっと驚いた。
ただ、昨年の9月から準備を開始してサイトを公開するまでの2006年の1月の間は、先方に見せられる実体がないわけだから「やろうとしていることが全然理解してもらえなかった」(辻村社長)という苦労もあった。
実態としてのWeblioスタート後に急増した参加辞書
しかし、三省堂、読売新聞オンラインといったあたりは快諾してくれたそうだ。そして、1月から15種類の辞書、百科事典でサイトをスタートし、3月の30種類程度にまでなったころから、急激に参加辞書が増えてきた。
やはり、実際にサイトがスタートして、そこにさまざまな辞書や百科事典が集まっている様子を見せると、先方の理解も早くなるわけだから、当然であろうか。また、辞書を提供する側からすると、基本的にリスクはないわけだし、若いベンチャー起業家が足を運んで、仁義を切っているのだから、むげに断るわけにもいかないだろう。
辞書や百科事典の出所先にキッチリと許諾を得るあたりは、礼儀に厚い日本的ビジネス慣行の一例といえなくもない。というのは、「バーティカルサーチはGoogleBaseにどう対抗していくのか?」で紹介されている、米国のSimplyhired社などは、元ネタになる商売の情報が“求人情報”で辞書とは意味合いが異なるとはいえ、「グーグルも同じことをやっているから大丈夫」と、Monster.comやYahoo! Hotjobsなどの大手求人サイトだけでなく、企業の求人ページのデータをクローリングして許諾を得ないで集めているわけだから、考え方の落差を大いに感じるのだ。
辻村社長としては、米国の例のように元ネタである辞書などを勝手に自社ビジネスに使う気はないようだ。というのは、辞書によってはその内容に関する権利関係が複雑に入り組んでいるものもあり、トラブルが発生して出鼻をくじかれたくないという思いが強い。まあ、実際問題、権利関係でクレームが付いた場合の解決処理は、非常に消耗する。
そのようなわけで、モノによってはWeblioに掲載されるまでに、かなりの時間を必要とするものもある。例えばプロ野球12球団の情報が閲覧できる「12球団データベース」などは、各球団すべてに許諾を得に出向いたというから大変だ。ただ、そのかいあって、各球団の情報表示ページには、それぞれのロゴマークを載せることができるという、うれしい副産物もあった。ロゴマークがあるだけで、オーソライズド感が漂い信ぴょう性が増すというか、サイト内の情報に重みが出る。
情報掲載までの手間にかける想い
さて、「マッシュアップ」という視点でWeblioを見た場合は、どうだろうか。ネットのかいわいでマッシュアップというと、グーグルマップスAPIやアマゾンのWebサービスといったものを利用したサイトが真っ先に頭に浮かぶが、実際、マッシュアップの語源となった、音楽の「Mash Up」をひも解いてみると、もっともっと幅の広い意味に解釈できる。
Mash Upは、複数の有名アーティストのCDから気に入ったパートやフレーズなどを、デジタル楽器にサンプリングし、それをデジタル技術を駆使してリミックス(再編集)することで、新しい曲を作り出す方法をこう呼んでいる。つまり、音楽におけるMash Upの始まりは、他人が作った楽曲の一部を切り取って上手に組み合わせることで、自分のオリジナルを作ってしまおうというものだ。
ならば、Weblioも立派なマッシュアップだ。ネットに点在する辞書や百科事典という要素を組み合わせて、さらに付加価値の高いサービスを生み出そうという試みは、グーグルマップスという当たり前のマッシュアップよりも、アンダーグラウンドなクラブで、先端DJが自分のリミックスを、誇らしげにMash Upと呼んだときの息吹を感じすがすがしい。
Weblioで表示される内容はすべて、元ネタから引っ張ってきたものをただ機械的に表示しているのかと思っていたのだが、それは認識が間違っていた。「同じキーワードで複数の辞書内容を表示させる場合、その順番を決めたりするのは手作業による編集」(辻村社長)になるそうだ。そのために専任の編集担当がいる。
また、同じキーワードでもまったく意味の異なるものを同じページに表示させないようにするための作業も必要になる。例えば、「Windows」で引くと、マイクロソフトのそれを指す言葉と判断されて、それに関する説明が表示される。ただ、その一方で「Windows」(邦題は「エミリーの窓」)という外国映画の情報が映画関連の用語事典の中にあり、それがマイクロソフトのWindowsと同列に表示されたのではマズイ。
「同音異義語は、自然言語処理技術を用いて自動的に判別し、分けるようにはしているが、まだまだ精度が低いので手作業による編集が必要になっている」(辻村社長)と明かしてくれた。
1カ月に1回しかアクセスのない92%のページ
最後にWeblioを「ロングテール」的な見地から説明したい。実は、筆者はWeblioを見た瞬間ロングテールという言葉が真っ先に思い浮かんだ。というのは、これだけ辞書が並んでいると、その中にはめったに閲覧されないキーワードもあるだろうなと思ったからだ。
特に、掲載している辞書や百科事典が100を超えたいまは、盆栽用語集、ネイル用語辞典、香りの分子事典 などのニッチでマニアック系な用語事典も多数含まれているだけに、縦軸にアクセス数、横軸にキーワードを並べた場合、完全にロングテール型のグラフになるはずだとにらんだのだ。
案の定「現状で100万ページの言葉が蓄積されている中、約92%は1カ月に1回しかアクセスがない。しかし、それらの蓄積がいまの月間300万ページビューを支えている。グラフにすると完全にロングテール」(辻村社長)と教えてくれた。
Weblioのやり方はロングテール追求ビジネスの1つのお手本ではないかと思ったりもした。というのは、この手の、辞書や百科事典=コンテンツは、収集の段階で飛び込み営業や許諾を得るなどの手間やコストは発生するが、それさえクリアしてしまえば、その辞書や百科事典=商材は手離れして、後はシステムが面倒を見てくれる。つまり以後のコストは発生しないことになる。
となると、後は努力して辞書や百科事典=商材を集め、“テール”を延々と延ばすことでひたすらアクセス数を稼ぐことができると思うのだ。辻村社長によると「いまはまだ、日本で提供されている辞書や百科事典の1割も網羅できていないと思う」というくらいなので、今後も辞書などを取り込む努力を続けていけば、テールはどんどんと伸びていくことになる。
もちろん、アクセス数が増えると設備や回線のコストなどが上昇するであろうが、その前に、増加するアクセスを収益に変えることを急げばいいわけだ。
気になるサービス運営の行方
そうなると、気になるのが同サービスのビジネスモデルだが、「基本的に広告収入になるだろう」(辻村社長)という。現在同社では、検索結果のページに表示されるアマゾンの関連書籍によるアフィリエイト程度しか収益がないようだが、「年内の目標である1000万ページビューを達成したら本格的に広告を取り入れることも考えている」(辻村社長)そうだ。
また、広告だけでなく、「Weblioには、あらゆる日本の言葉が集まっているので、それを上手に利用して何かBtoBのビジネスに展開できないか」(辻村社長)という部分も模索している。
「自分たちで駆けずり回って集めた」(辻村社長)資本金1000万円で立ち上げた同社だが、事の発端は、「会社やりたいね。何しよう? 辞書を集めてみたらどう? それは便利だね」という学生時代の喫茶店での雑談から始まったという。
とはいえ、パソコンの前に座ったままのマッシュアップによる小手先のサービス構築に終始するのではなく、泥臭いアナログな飛び込み営業から始まるサービス運営をしている点がなぜかほほえましい。まだまだ日本にたくさんあるという未開の辞書や百科事典を、とことん集めてロングテール追求ビジネスを早々に完成させてほしいものだ。
- 能登半島地震、延べ1万人以上が通信インフラ復旧に従事 NTTドコモとKDDIが語る、復旧秘話
- 音楽生成AI「Suno」「Udio」「Sonauto」を制作者視点でレビュー。音楽制作のカタチは変わるのか
- 「SDV」がもたらすクルマ→モビリティへの変化 「クルマのソフトウェアアップデート」が楽しみになる時代がやってくる
- 「Apple Vision Pro」が採用した空間オーディオがもたらす没入感 Appleが凝らした工夫を考える
- テスラ車オーナーによる、衛星インターネット「Starlink」導入レポート! 気になる使い心地は?
- NFT市場は“うさんくさい”のか“夢がある”のか――NFTマーケットプレース Adam byGMOにクリエイター目線で聞いてみた
- 投資額別に「松・竹・梅」で見る、理想のリモートミーティング環境――数千円+Zoom設定変更から数万円コースまで
- タイトーに聞く、データ分析基盤の導入効果――スマホ向けゲームで年間480時間の工数削減
- ビッグデータ活用時代に再注目 進化を遂げた「磁気テープストレージ」の実力とは
- 「ローカル5G」は、エリアカバレッジがお寒い状況の「5G」を救い、日本のデジタル化を進めるか
- RSS、ライブドア、Weblio、7notes、FREETEL、神エクセル、みちびき――結局、モノになったのか? ならなかったのか?
- リモートワークの増加で日本のトラフィックはどう変わったのか? 動画サービスは?
- プライバシーは? 消費電力は? エストニアで成功した「医療ブロックチェーン」が日本でも実現可能な理由
- 「真のP2Pを実現した完全な水平分散型社会」を目指すNeukindの未来は、Libraか? Winnyか?
- 米英で疾病の「診断」を下すAIドクターが登場。日本ではどうなるのか
- 「IoTの導入=コストダウンや効率化」でこぢんまりしてていいの?――IoTネットワーク、LoRaWANビジネスの現状
- 固定回線でも「ギガ不足」におびえる時代が到来か、トラフィック急増により現場で起きている悲劇とは
- 日本版GPS“みちびき”が本格始動したら位置情報取得はどう変わる?――2018年AI IoT系記事閲覧数ランキング
- 機械翻訳は、翻訳家の仕事を奪うのか――「人工知能」を作る上での良質な栄養素とは?
- 成功した人が幸せになるのではなく、幸せな人が成功する――IoTで幸福度は定量化できるのか
- 「日本版GPS“みちびき”本格始動で数センチ級精度の位置情報取得が可能」は本当か
- 「スマートスピーカー」の中にある「人工知能」は何をしているのか、作り方から理解する
- なぜ人工知能研究でNVIDIAのGPUが使われるのか――安くて速いGeForceが尊ばれる理由
- ITエンジニアの副業はあり寄りのなし? なし寄りのあり?
- ボーカロイド教育版と「プログラミング的思考」は“AIリテラシー”を育むか
- スマホやIoT機器が生成するデータをお金に換える「IoTデータの証券取引所」と日本経済の行く末
- 「神エクセル」が役所ではびこる理由
- 日本の存亡を懸けた政府のIoT戦略。要は「セキュリティ」にあり
- 日本発の定額制音楽ストリーミングサービスは黒船勢をどう迎え撃つか
- ボランティアWi-Fiネットワーク構築集団「CONBU」の正体に迫る
- 今ならランキング上位が狙える? Apple TVアプリ開発のススメ
- 日本型シェアリングエコノミーのカタチ
- 情報サイトのマネタイズの難しさ。その光と影
- 作り手のモチベーションから見た「Apple Music」のカタチ
- ブラウザーだけでレコーディングできる時代がやってくる!
- 実機を触って分かった、“使われる”Apple Watchアプリのキモ
- “子持ちの働く主婦が2年の間に70のアプリを開発して得た収入でMacBook Proを購入した話”
- ニコ動のコミック版? 動いてしゃべってアフレコできる「モーションコミック」を追う
- 個人でもOKのLINE@、達人に聞く活用の極意
- 「ゲームギフト」とリワード広告アプリの違いは?
- 「KMDの森」で触る、感じる、描くを体験してきた
- 開発者視点で見る、あのドデカい「iPhone 6/6 Plus」
- Apple Watchが殺すかもしれないもの、それは……?
- アイデアを世に問う試金石? クラウドファンディングの可能性
- 固定回線とのセット割引、NTTドコモを縛るのは……
- 脱「1億総縛り」を目指すスマホメーカー
- スルー防止も? BLEがもたらすビジネスチャンス
- MVNOは死滅するのか? 大臣裁定申請を機に考えるその意義
- Amazonガチャ騒動から考える、サービス名と商標の関係
- タタミ12畳分の領域を「さあどうぞ、ご自由に」
- シンプルなUIにしたたかさも兼ね備えた世界に誇りたくなる日本発の音楽系サービス「nana」
- スマートフォン普及で爆発するトラフィックをさばけ!
- auスマートパスはAndroidアプリビジネスに新風を吹き込むか?
- ものになるモノ、ならないモノ
- エモーショナルな文字入力を可能にした「7notes」の秘密
- 「韓ドロイド」に見る1年後のAndroidアプリビジネス
- 年末でJetty(絶対)にできる Android携帯サーバ活用
- インディ開発者よ、「ドコモマーケット」で稼ごうぜ!
- フェムトセル無料配布で浮上した「ただ乗り」問題
- iPad発売記念!モバイルルータや電子書籍へのインパクトは?
- 5分で絶対に分かるリスティング広告+運用テクニック
- App Storeの運営方針は第2ステージへ
- 電子出版をめぐる4つの疑問
- Androidアプリはビジネスになるのか
- iPhoneアプリにアプリ内課金を導入してガッチリもうけるのだ
- マッシュアップを超えたマッシュアップを−Mashup Awards 5表彰式レポート
- iPhoneアプリに広告を挿入してガッチリもうけるのだ
- 2012年、2000万ユーザーのアクセスが2カ所の接続ポイントに集中するのか?
- 検索全盛の時代だから、ドメインの有用性を考えよう
- iPhone Skypeとケータイ、通話に向いてるのはどっちだ
- WiMAXの人口カバー率が7割になった2010年を想像してみよう
- ニッポンのiPhoneアプリヒットメーカーたちに続け!
- 霞ヶ関も導入する!?クラウドコンピューティングの本質を理解する
- Androidのオープン性でガラパゴスから脱出しよう
- 2010年、本当にプロバイダビジネスは崩壊するのか?
- Mashup Awards授賞式レポート マッシュアップ+ひとひねり=MA4の受賞作
- モバイル「レイヤ2」の付加価値がもたらすメリットとは
- 「着うた」とiTunes Storeの直接対決はあるのか
- iPhone 3Gでソフトバンクモバイルのネットワークが心配だ
- ニッポンのインディよ!iPhoneの「予想外」にカワイイ系で打って出よ
- ECネットワークは、ネット紛争の“遠山の金さん”
- モバイルビジネスのオープン化はこれからが本番
- マッシュアップの落とし穴。誰がために結び付けるのか
- Google Android用携帯アプリ作成のための基礎知識
- ケータイメールポータビリティは開国を迫る黒船となるか?
- 「はてな」を作り出す人的ネットワークの仕組みとは
- そろそろブログ+RSSアプリでも作ってみませんか?
- プロバイダが考える安全なファイル転送のかたち
- 次々と中小企業がネットビジネスから脱落する理由
- セカンドライフと実社会の経済格差=100倍の価値は
- FONはアクセスポイント持ち寄り型コミュニティを形成するか
- 電力線というありモノでLAN構築!の現在過去未来
- マイクロフォーマット=Web2.0の真打ちとなるか?
- 集合知を独自に検索して真実を導く、kizasi
- 国内の総合辞書検索屋への挑戦者、ウェブリオとは?
- Webちらし、国産RSSリーダーのいきさつと人工知能化の野望
- API公開のずいぶん前からすでにWeb2.0でした
- Pマークは暗黒な大人社会の印籠以上になれるか?
- ネットの“あちら側”から迫り来るスパイウェアという見えない亡霊にどう対処する?
- 一家に1つのレイヤ2ネットワークの時代はやってくるか
- 月額1000万円が300万になる新・映像配信って?
- IrDA、Bluetoothを反面教師にしたZigBeeの実力は?
- ライブドアの無線LANに疑問をぶつけてみました
- 1ギガ、本当に「現時点ではそんなもん不要」なのか?
- 社内ブログはナレッジマネジメントツールとして機能するか?
著者紹介
著者の山崎潤一郎氏は、テクノロジ系にとどまらず、株式、書評、エッセイなど広範囲なフィールドで活躍。独自の着眼点と取材を中心に構成された文章には定評がある。
「山崎潤一郎のネットで流行るものII」
Copyright © ITmedia, Inc. All Rights Reserved.