Claudeも選んだ分析データベース「ClickHouse」とは何者か? マツダも採用、創業5年で150億ドル企業:AI時代に存在感を増すDBMS、CEOに聞いた
生成AIやAIエージェントが普及する中、急速に存在感を高めているのが分析データベース「ClickHouse」だ。なぜAnthropicやマツダ、Teslaなどが採用するのか。創業5年で企業価値150億ドルの背景は。CEOアーロン・カッツ氏へのインタビューを踏まえて解説する。
データ量の増大と分析ニーズの高まり、さらには生成AIの台頭といった中で急速に存在感を高めてきたのが、高速性を特徴とする新興の分析データベース「ClickHouse」だ。企業のさまざまな分析基盤として利用され始めており、「Snowflake」や「Google BigQuery」「Amazon Redshift」などと比較されることが多い。
米国サンフランシスコでClickHouseが法人として設立されたのは2021年9月だが、それ以前からMicrosoftやUber、ドイツ銀行など多くの企業がオープンソース版のClickHouse(2016年にオープンソースで公開された)を本番環境で利用していた。2025年11月に現地法人が設立した日本でもマツダやLINEヤフー、KDDIアジャイル開発センター、さくらインターネットなどが利用している。ユースケースについては改めて後述する。
ClickHouseは幾つかの観点から“異例”の存在だと言える。その一つが2021年10月、創業とほぼ同時に3億ドル(1ドル=160円換算<以下同じ>で約480億円)を資金調達している点だ。創業直後としては異例となる大型の資金調達となっており、この分析データベースの将来性への期待だけでなく、先述のように既に企業の本番環境で採用されていた実績への評価でもあったと言える。
参考にSnowflakeのシリーズA(初期の資金調達ラウンド)は500万ドル、DatabricksのシリーズAは1400万ドルだったとされる。ClickHouseはシリーズA(5000万ドル)とシリーズB(2億5000万ドル)をほぼ同時に実施し、創業直後に3億ドルを調達した。
設立時からCEOを務めるアーロン・カッツ氏、ClickHouseの生みの親である開発者のアレクセイ・ミロヴィドフ氏、製品・エンジニアリングを率いるユーリ・イズライレフスキー氏の3人が共同創業者となっている。本稿ではカッツ氏へのインタビューと直近の活動を踏まえて、ClickHouseとはどのような分析データベースなのか、なぜ今の時代に関心を集めているのかを解説する。
創業から5年、企業価値150億ドルへ
「何千もの企業がオープンソース版のClickHouseを利用していたことに可能性を感じた」。創業の経緯についてそう話すカッツ氏。創業以前から、既にGitHubでは多くのコントリビューターが集まり、活発な開発コミュニティーが形成されていた。「ユースケースがあまりにも多様であるため、獲得可能な市場という点では間違いなくテクノロジー界でも極めて大きな市場」と捉え、開発者のミロヴィドフ氏やベンチャー投資家と共に創業に1年を費やした。
創業後はフルマネージドサービス「ClickHouse Cloud」の開発を本格化。それから5年で顧客数は4000社を超えた。先述の通り、創業時点で既に市場や投資家からは高評価を得ていたわけだが、ClickHouseへの期待はその後も膨らんでいる。2026年1月にはシリーズDラウンドで4億ドルを調達。企業価値は150億ドル(約2兆4000億円)と評価された。同時期にはLLM(大規模言語モデル)オブザーバビリティー(可観測性)の主要ツールの一つとして使われている「Langfuse」の買収にも踏み切ったことが注目を集めた。
「AI企業の台頭や企業がAIを採用するスピードは、業界の誰が予想するよりも速かった。一瞬にして完全に時代遅れになってしまったテクノロジーもある」(カッツ氏)。2022年11月に「ChatGPT」の登場が世間を沸かせたことを皮切りに、生成AIやAIエージェントの普及が急速に進んできたことは、ClickHouseにとっては追い風になったと言える。
なぜClickHouseが注目されるのか? Claudeが選んだ分析基盤
ここからはClickHouseが分析基盤として注目を集めるのはなぜなのか。他製品との違いや市場動向の観点で踏み込んでいこう。
ClickHouseの特徴を考える上で興味深いエピソードの一つが、生成AIツール「Claude」を提供するAnthropicにおける分析基盤の採用についてだ。Claudeの利用が急増し、同社のオブザーバビリティーチームが迅速なスケール対応を迫られた際、チームはClaudeに「どのデータベースを使うべきか」と尋ねた。その際の回答がClickHouseだった、というものだ。
カッツ氏は、AIが大きな影響をもたらすのはアプリケーションだけではなく、データベースやデータ基盤も同様だと言うが、ClaudeがClickHouseを選んだというのもそれを象徴するエピソードだと言える。これまでデータベースと対話していたのは主に人間だったが、それは今後ますますAIエージェントがその役割を担うようになる。バックエンドではLLMが複数のクエリを生成しながらデータベースとやりとりし、推論やコンテキスト取得を繰り返す。AIエージェントが業務に浸透するほどそのやりとりは増加する。「データ基盤側ではそれを処理する応答性能だけではなく、生み出される大量のイベントをリアルタイムに収集、保存、分析することが必要」で、データ量が増え続けていっても処理できる性能が重要になる。
「世界最速のOLAP(オンライン分析処理)データベース」を目指して開発されたというClickHouseだが、興味深いのは、現時点ではClickHouseが自らを“単なる分析データベース”としては位置付けていない点だ。同社はAI時代のデータスタック全体を支える基盤としてClickHouseを説明している。創業後間もなく生成AIやAIエージェントの普及が本格化したこともあり、分析データベースからAI時代のデータ基盤へと役割を広げながら成長してきた点は特徴的だ。
データレイクに蓄積されたデータ、トランザクション処理を担うデータベース、さらにはLLMやAIエージェントと連携しながら、高速な分析やオブザーバビリティーを支える中核的なレイヤーを担うという考え方だ。買収したLangfuseも、LLMオブザーバビリティーを担うツールであり、この考え方の一環として見ることができる。
「既存テクノロジーの遅さに耐えられなかった」
一方で分析基盤ということであればClickHouse以外にも候補は挙がるわけだが、ClickHouseはどのような点で差別化が図られるのだろうか。まずカッツ氏は「ClickHouseのポジショニングは、データベースのリアルタイム性、つまりデータからミリ秒単位でインサイト(洞察)を得られるという点にある」と語る。
ClickHouseを採用している企業について、カッツ氏は約3分の2は「より速く、より安価」という理由で既存環境から移行しているケースだとする。よく比較対象に挙がるツールとしてはSnowflakeやGoogle BigQuery、Teradata、Elasticなどがある。残り3分の1は、AnthropicやOpenAIなどもそうだが、AIワークロードなど新しいユースケースとして採用されているという。
検討する際のポイントになるのは、まずはリアルタイム分析のパフォーマンスだ。ClickHouseを開発したミロヴィドフ氏は、2026年4月末に東京で開催された日本法人設立記念イベントで、パフォーマンスについてこう語っている。「私がClickHouseの実装を始めたとき、既存のテクノロジーの遅さに耐えられなかった。そこで私は、最高速度でデータの壁を突き破るためのエンジンとしてClickHouseを構築した」
日本のユーザーに向けてミロヴィドフ氏は、品質において世界で最も高い基準を持っていると認識しているとした上で、「ClickHouseを壊すつもりで絶対的な限界まで追い込んでもらいたい。もし少しでも遅いと感じることがあれば、フィードバックしてほしい」と語っている。
ClickHouseは“数十億行のデータをミリ秒単位で処理する”高速クエリエンジンとして設計されている。実際にTeslaでは1秒間に10億件のイベントをClickHouseに取り込んでいるという。Teslaは車両やアプリケーション、製造施設から収集したデータをClickHouseに取り込んで、リアルタイムで分析し、何が起きているかを継続的に把握し、改善につなげている。
データ量が少なければどの分析DBも速い、1000億行で違い
ClickHouseのパフォーマンスにおいて特に違いが出てくる要素の一つは、カッツ氏によればスケーラビリティにある。データ量が増えても高速性を維持するという点だ。データ量が少ない環境では多くの分析基盤が十分な性能を発揮するが、データ規模が大きくなるにつれて差が広がる傾向にある。
イズライレフスキー氏が話したところによれば、100億行規模ではClickHouseも他の高速な分析基盤も同等の性能を発揮する一方で、1000億行規模を超えるような環境になると違いが出てくる。「ClickHouseのミリ秒単位の応答は継続する一方、他のプラットフォームではクエリのレイテンシ(遅延)が劇的に増加して限界を迎え始める」という。AIが普及する中では数兆行規模のデータを扱うケースも増えており、こうした大規模環境こそがClickHouseの主戦場だとする。
データ圧縮によるコスト削減も
ClickHouseのもう一つの特徴は、「列指向(カラム型)」のアーキテクチャにある。分析に必要な列だけを読み込むため、不要なデータアクセスを削減できる。同時に、高い圧縮率によって保存容量を抑えられることから、大量データを扱う環境でも高速性とコスト効率を両立できる。カッツ氏は「こうした特徴によって、代替のデータベースよりも大幅なコスト削減が可能になる」と説明する。
マツダも採用、4つの主要ユースケース
こうしたClickHouseの特性が生きるユースケースにはどのようなものがあるのか。既にTeslaやAnthlopicの例には触れたが、カッツ氏は主要な4分野を挙げる。
1つ目は既に競合するツールでも触れたデータウェアハウスの分野だ。「Snowflake、Databricks、Vertica、Google BigQuery、Amazon Redshiftなどの置き換えを想定している」とカッツ氏は話す。2つ目がオブザーバビリティ―。3つ目が大規模アプリケーション向けのリアルタイムの分析基盤で、「これはClickHouseにとって強力なユースケースの一つ」だという。4つ目が、AIエージェントを監視するLLMオブザーバビリティーだ。Langfuseもこの領域の代表的なツールとして知られる。
このうち3つ目に該当する事例としてClickHouseを活用している一社に、自動車メーカーのマツダがある。同社は2016年ごろから、データから価値を生むための活動を開始。大量のデータを蓄積しつつ、高速にデータを取り出すための技術を探しているとき、2018年ごろにClickHouseに出会い、採用することにした。分析の際のレスポンス、スケール、コストなどの課題を解決できているという。ClickHouseがオープンソースで公開されたのが2016年なので、マツダはかなり早い時期からClickHouseを採用していたことになる。
AIが技術選定や運用の主体になる
前述のClaudeがClickHouseを選んだというエピソードは、分析基盤としてのClickHouseの高速性を客観的に認めているということになるが、これはAIが意思決定の領域にいかに入り込んでくるのかを象徴する例として見ることもできる。
実際カッツ氏は、AIエージェントの普及によって、ソフトウェア開発やインフラ運用の在り方そのものが「今後12カ月もたたないうちに」変わり始めると予測する。AIエージェントはアプリケーションに適した技術を提案するだけでなく、アイデンティティー(ID)や予算を持ち、必要なストレージやコンピューティングのリソースを自ら確保し、サービスを構成するようになる。「どのテクノロジーを採用するかを人間が選択する形から、エージェントが選択する形へのシフトをサポートできる位置にあるデータベースがClickHouseだ」とも同氏は語る。
生成AIやAIエージェントの普及によって、企業内で処理されるデータ量やイベント数は爆発的に増加してくる。そうした中で分析の基盤にも、人間が分析するための基盤から、AIエージェントがリアルタイムで意思決定するための基盤へと急速にシフトするというニーズの変化がある。ClickHouseは創業後にも企業価値が急速に上昇してきた点にも触れたが、同社の急成長も一製品の成功とは別に、AI時代におけるデータ基盤や意思決定の在り方の変化を映し出す動きとして見ることができるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「SQLをAIが書く」時代、ClickHouseが語る“なぜデータベースの高速性が求められる”のか
クエリ処理が極めて高速なデータベースとして開発され、リアルタイム分析やオブザーバビリティーなどで活用が進んでいるClickHouse。LLMによるクエリ生成が今後増えると予測される中でどのような変化があり、同データベースの特性はどう生きてくるのか。
OLAPデータベースのClickHouse、Google Cloud東京リージョンで「ClickHouse Cloud」を提供開始
列指向のデータベース管理システムを提供するClickHouseは、Google Cloudの東京リージョンにおいて、クラウドサービス版の「ClickHouse Cloud」が利用可能になったと発表した。
生成AIの「弱点」をどう補う? AIエージェント時代に変化するデータベースの役割
チャットbotから自律型の「AIエージェント」へと、企業での生成AI活用が新たなフェーズに進みつつある。こうした中で、データベース領域にも大きな変化を予感させる動きが出始めている。なぜ今、データベースの重要性が高まっているのか。
COBOLも古いJavaももう“塩漬け”にしなくていい? AIを制御し「数年を数日まで」短縮できるレガシー刷新の今
老朽化し、仕様を知る担当者も退職するなどして塩漬けにされる「レガシーシステム」。調査だけで億単位のコストを要し、ビジネス変革の足かせになりかねない難題にAI駆動開発でどうアプローチできるのか。Scalarが取り組むAIエージェントを使ったモダナイゼーションについて聞いた。
「Visual Studio Code」上で「Amazon Redshift」を利用できるようにする拡張機能が登場
VS CodeマーケットプレースからAWS-Toolkit拡張機能をダウンロードすることでAmazon Redshiftと接続できるようになった。接続後はVS Code内でAmazon Redshiftを表示できるようになる。




