必ずしもデータベースに送られるわけではない「ログ」「センサーデータ」は、どこでどのように処理されるのか?:Database Watch(2016年8月版)(3/3 ページ)
ITの高度化に伴い、今、データ量が爆発的に増大しています。そのデータは、必ずしもデータベースに送られるわけではありません。今回は、IoTやセキュリティ対策の需要増を背景に、大量のログやセンサーデータがどのように扱われるか、最近の気になる動きを確認します。
データの「蓄積」と「流れ」の両方をカバーするプラットフォーム
続いて、「ホートンワークス」の動きを確認しましょう。ホートンワークスは、「Hortonworks Data Platform(以下、HDP)」と呼ばれるApache Hadoopのディストリビューターとして知られています。HDPはコミュニティー版のHadoopに近く、あまり独自性を出さないことをポイントにしているようです。
Hadoopはよくデータベース製品と同列に並べて語られますが、厳密にはデータベースではなく、分散処理技術であることは皆さんもご存じと思います。とはいえ近年では、データベース管理者が慣れたSQLコマンドで扱えるように「SQL on Hadoop」と呼ばれる、SQLコマンドでHadoopへアクセスする手段も登場しています。このため、実質的にはデータベースに近い存在と考えてよいとも思います。少なくとも、「データを大量に蓄積するための主要プラットフォーム」という位置付けとなるでしょう。
さて、ホートンワークスといえばHDPでしたが、それだけではなくなりました。2015年8月、ホートンワークスは「Apache NiFi(以下、NiFi)」を手掛けていたOnyaraを買収しました。2016年8月現在、NiFiと「Kafka(メッセージ処理)」など複数の技術を合わせて「Hortonworks DataFlow(以下、HDF)」として提供するようになりました。
HDFのベースとなるNiFiは、Hadoopとは異なるものです。Hadoopは「データを蓄積する」ためにあるのに対し、NiFiは「データを流す」ためにあります。
もともとNiFiは、NSA(米国国家安全保障局)が情報収集ツールとして約8年かけて開発した「Niagarafiles」がベースにあります。NSAはこれを2014年11月にApache財団に寄贈しました。NSAがオープンソースに寄贈した、初のソフトウェアでもあります。
NiFiは、「NSAの情報収集」という国家的に重要なミッションを遂行するために生まれました。情報収集と分析のために、あらゆるところからデータを収集し、分析にかけられる形へと変換し、蓄積する先へと送信する必要があります。しかし、システムログをはじめとする、各種サーバや装置が収集したデータは、それぞれフォーマットが異なります。場合によっては、データ元が同じでも、送信先ごとにデータ変換方法が異なるかもしれません。滝からとめどなく流れ落ちてくるかように大量に発生し続けるバラバラな形の「データ」を、適切な形に変換して「整理して適切に流す」ための作業やその設定を、GUI(Graphical User Interface)ツールで行えるのがNiFiです。
ホートンワークスでは、あらゆるデータ発生源から「流れてくる」データをHDFで受け、それらのデータをHDP(や、他のデータ処理先)に送ります。「流れていくデータ(Data in mortion)」と「蓄積するデータ(Data at rest)」の両方をカバーすることで、ホートンワークスはデータを包括的に扱えるプラットフォームを作り上げようとしています。これをホートンワークスでは、「Connected Data Platform」と呼んでいます。IoTの世界を明確に意識した戦略です。
実際のところ、ログデータをHDFで収集したとしても、配信先はHDPになることもあれば、前述したSplunkや他のログ分析プラットフォームになることもあるそうです。今後、IoTやセキュリティ分野で、どんなデータ管理プラットフォームが主導権を握るのでしょう。今後もウォッチしていきます。
関連記事
- 「SIEM」はどうすれば使いこなせるのか?
「ログ活用」を軸にIoT時代のセキュリティを考える本特集。第2回となる今回は、“導入するだけでは意味がない”SIEMなどのログ管理製品を活用するためのポイントを解説する。 - 眠る「マシンデータ」を処理、スプランクが国内でのビジネス戦略を発表
米スプランクが日本国内ビジネスの戦略を発表、2014年は「セキュリティ」「ビッグデータ」そして「学術」にフォーカスする。 - RSA Conference 2016に見る「可視化」「検出」「対応」を支援する製品たち
RSA Conference 2016の会場では、侵害は起こり得るものだという前提に立ち、システム内部に入り込んだ脅威をいち早く見つけ出し、速やかに対処することで、被害を最小限に抑えることを目指した製品が多数紹介された。 - HortonworksとPivotal、Hadoop管理ツールの「Ambari」で協業
HPの出資が話題となったばかりのHortonworksが、運用環境の整備でPivotalとの協業を発表した。エンタープライズデータプラットフォーム環境確立の流れが強まるようだ。 - HPがHortonworksと戦略提携、データプラットフォーム強化へ
HPがHortonworksとの提携を発表した。自社のデータプラットフォームとの連携を強化。エンタープライズアプリケーションを意識した環境整備が進んでいるようだ。
Copyright © ITmedia, Inc. All Rights Reserved.