カギは「データとビジネスロジックの近さ」――データ分析、活用に必要なものとは:増え続ける企業のデータ、どう活用する?
どの企業も自社の保有するデータを分析してビジネスに活用したいと考えている一方で、扱うシステムやデータは増え続け、日に日に複雑化している。自社のデータを一元的に管理、活用するためには何が必要なのだろうか。
企業は新しい分析テクノロジーに対応しなければいけない
どの企業でも自社が保有するデータを分析、活用してビジネスに活用したいと考えている。しかし、特に大企業では日々生み出されるデータが多過ぎてデータの保持や管理が煩雑になり、データ活用まで至らない場合もみられる。
そうした企業がデータ管理と活用のヒントを得られるイベントとして、インターシステムズジャパンは、「InterSystems Japan Virtual Summit 2022」を2022年3月にオンラインで開催した。
冒頭、インターシステムズジャパン カントリーマネージャーの林雅音氏があいさつした後、米国本社の創業者兼CEOのテリー・レーガン氏がビデオメッセージでデータ活用について語った。
レーガン氏は、「少し前までは、運用システムと、1カ月分のデータを保存できるデータウェアハウスがあれば、企業の優位性を保つ上で十分だった。だが多くの業界では、もうこれは通用しない。適切な判断を下し、迅速な行動を取るには、データからより深い洞察を得なければいけない。これができている企業ほど、大きな競争優位を取れている」と語る。
これまでは多くの人が分析を統計分析と考えており、仮説を立てたり、検証したりすることだと思っていた。だが今日、分析はさまざまな形があるとレーガン氏は言う。例えば医療現場で用いるMRI(磁気共鳴画像)診断装置は、有用な画像を生成するために、生データの処理が必要だ。診断のために、画像処理にAI(人工知能)を用いている。「大事なことは、新しい分析技術を導入できるように準備を進めておくことだ」(レーガン氏)
また、既存システムに影響なく、大きな変更をせずに新しい機能を追加できることも重要だと話した。
ビジネスに役立つ洞察を得るためのデータ基盤の構成とは
続いて、インターシステムズジャパン ロジスティクス営業部 部長の佐藤比呂志氏が、レーガン氏のメッセージを受けてより詳しく解説した。
まずレーガン氏が述べた「既存システムに影響を与えないデータプラットフォーム」の作り方を説明した。
シンプルなアプローチとしては、業務データベースやその他のさまざまなデータソースから、トランザクションのリアルタイムデータフィードを提供し、企業全体の統合ビューを得ることが考えられる。「InterSystems IRIS データプラットフォーム」(IRIS)は従来のデータウェアハウスとは異なり、データが常に最新の状態に更新されることが特長だ。
これは簡単に作れそうだが、実際にはそうたやすくないと、佐藤氏は言う。
「データのソースが違うと、それに付随する標準や規格も異なる。また業務用のデータベースのフォーマットでは、その後の分析では使い勝手が悪いということもある。そのため統合記録データベースにデータを渡す前に、データを理解して、整理し、変換できる『データハブ』と呼ばれる機能が必要になる」
データハブを通したデータを、同社は「健全なデータ」と呼んでいる。データハブからの健全なデータを新しい分析技術を用いた専用システムに提供することで、それぞれのシステムに合わせたデータ変換をして、分析できる。
インターシステムズジャパンはデータハブ、統合データベース、専門システムの全てに共通の機能を持ったデータプラットフォームで管理することを推奨している。それが同社製品のIRISに採用されているアーキテクチャだ。
このアーキテクチャを採用すると、目的に応じて最適なデータ処理の機能を、最適な位置に配置できる。例えば、即座に対応できるようなアラートを出すための機能は、前段のデータハブに設置するのが理にかなっており、専門システムには、全く異なるデータを提供可能になる。
「既存のアプリケーションのデータベースに影響を与えることなく、新しい分析機能を加えることもできる。ハードウェア資源を追加することで自在に拡張も可能で、スケーラビリティを持っている」(佐藤氏)
企業がインターシステムズを選ぶ理由
次に佐藤氏は、日本企業の事例を紹介し、どういった理由で同社の製品を選んだのかを説明した。
最初に紹介があったのはマテリアルハンドリングシステムメーカーの村田機械だ。1980年代から同社のユーザーであり、当初は自動倉庫の入出庫管理データベースとして利用していた。村田機械は今から約10年前に、シャトル型という新しいタイプの自動倉庫を開発した。「新しい方式の自動倉庫システムは今まで以上にデータベースの性能が求められたが、他社ツールとの比較でインターシステムズの製品がレスポンス、スループットなどの性能が安定して高いことが評価され、採用いただいた」(佐藤氏)
次に紹介があったのは自動車のIoTサービスを提供するBizBaseだ。新たな運行管理システムの開発時に、一般的なIoTサービスのデータベースを利用しようとしたところ、初期に3000台程度の車を管理するため、複数サーバを用いた大規模なシステムを構築しなければいけなくなった。その後の規模の拡大を考えると負担が大き過ぎると判断し、もっと軽く始められるシステムはないかと再検討して、インターシステムズの製品を採用した。BizBaseのシステムでは、車両3000台の運用を1台のサーバで余裕を持って対応できたという。
これらの企業をはじめ、多くの企業がインターシステムズを選ぶ第1の理由として、データベースの性能の高さがある。なぜ同社のデータベースは高性能なのか。その理由を佐藤氏は次のように話す。
「理由はシンプルで、『データとビジネスロジックが非常に近い位置にある』ことだ。具体的に言うと、データは基本的にメモリ上で処理される。ディスクやネットワーク上で処理されることはほぼない。当社のプログラム言語でデータにアクセスする限り、通信は発生しない。また、処理するデータが増えても、分散処理によってデータと処理の近さが失われないように自動的に管理されている。それによって、高い性能を維持したままスケーラビリティを維持できる」
新機能を続々とリリースするIRIS
次に、同社SEマネージャーの堀田稔氏が、IRISの新機能について講演した。
リリースから3年がたったIRISは、高いパフォーマンスのアプリケーションを開発するためのデータプラットフォームだ。データベースだけでなく、相互運用性確保のための機能、データ分析機能、機械学習機能が搭載されており、日々の業務で大量に生み出されるデータを収集、分析するためのアプリケーションを作る環境を提供する。製品はクラウドやオンプレミス、両者を組み合わせたハイブリッドの環境に対応する。
IRISはLinuxディストリビューションなどと同様に、メジャーバージョン(安定稼働版)の間に、機能更新のコンティニュアスリリースを挟む形でバージョンアップする。最新の安定稼働バージョンは「2021.1」で、計画的なメンテナンスリリース(問題修正などを含むアップデート)が提供される。このバージョンでは分析AI機能が追加された他、「Kubernetes Operator」というマイクロサービスへの対応機能、次世代の医療情報交換標準規格である「HL7 FHIR」(Fast Healthcare Interoperability Resource)への対応を強化した。APIマネジメントの機能も増えた。
こうした機能追加に加え、データベース機能の向上も図られている。前世代の製品「Caché 2016.2」と比べて、SQLクエリにかかる時間は3分の1以下に短縮している。「パフォーマンス向上は今後も製品開発のメインテーマ」と堀田氏は言う。
また、最新リリースの「2021.2」はコンティニュアスリリース版で、新しい機能をいち早くユーザーに届ける。今回のバージョンの注目機能は、後述する「Embedded Python」だ。また、次のバージョン「2022.1」のプレビュー版も既に提供されている。
堀田氏は、最新版で導入されたIRISの新機能のうち、3つについて概要を紹介した。
1つ目が、「アダプティブアナリティクス」だ。これは組織全体のデータを分析する仕組みで、複数のシステムから出力されるデータをリアルタイムにIRISが収集、分類し、「バーチャル・キューブ」から参照することで、「Tableau」「Microsoft Power BI」「Microsoft Excel」などの企業が使い慣れたツールでの分析を可能にする。「バーチャル・キューブはIRIS内で管理するため、例えばTableauで作った分析クエリをExcelで再利用できる」
2つ目は、医療分野の新機能「FHIR SQL Builder」。HL7 FHIRは、日本でも厚生労働省標準規格としての採用が進められている医療情報交換標準であり、これをいち早くサポートすることで医療機関のデータ活用を後押しする。FHIRのデータは通常のデータベースでは検索できないが、FHIR SQL BuilderによってSQLスキーマを生成し、SQLによるアクセスを可能にする。これによって、SQLをサポートするBI(ビジネスインテリジェンス)ツールなどからFHIR形式データを分析できる。データはコピーせず、元のFHIRのデータを利用する。
そして3つ目の「Embedded Python」は、新リリースの目玉といってよい機能追加だ。Pythonは、現在最も人気があるプログラム言語で、10万を超えるライブラリ、800万人の開発者がいるといわれている。PythonをIRISの開発ツールボックスに取り込むことで、IRISの中でPythonの豊富なライブラリをそのまま活用できる。
「インターシステムズが長年独自のプログラム言語『ObjectScript』で実現してきた考え方は、『Bring Code to Data』、つまりプログラムをデータのあるところで実行することだ。Embedded Pythonによって、PythonはObjectScriptと同等の高いパフォーマンスで大量のデータを処理できるIRISのネイティブ言語となった」(堀田氏)
ObjectScriptを知らなくても、Pythonが分かればIRISのデータ分析基盤を使った開発が可能になることは、企業の開発リソース確保にも貢献する。
堀田氏は別セッションで、Embedded Pythonのデモを2つ披露した。1つ目では、Pythonの標準的な開発ツール「Jupyter Notebook」を使って、IRISに格納されたデータを取り出して分析する様子を紹介した。あらかじめIRIS上でデータ変換や匿名化などの前処理をしておくことで、Pythonから呼び出して即座に分析が可能になる。デモでは、IRISに格納したワインの品質データをPythonで簡単に分析できた。
2つ目は反対のパターンで、IRISのプログラマーがPythonのライブラリを利用する方法をデモした。IRISのプログラム内に、Pythonコードを書き込んで「Google Maps」のAPIを呼び出し、地図上の2点間の距離を計測するプログラムを作成した。
また、Pythonが得意とするWebサイトのスクレイピング機能も、IRISの内部で実行できるようになる。デモではインターシステムズのWebサイトからFAQページの情報を読み込み、IRISのデータベースにSQLで格納できた。
「Pythonは今やIRISのネイティブ言語として機能し、IRISのアプリケーション開発の可能性は大きく広がった」と堀田氏は語った。
増え続ける企業のデータを活用するために、IRISのPython対応は心強い味方となりそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連リンク
提供:インターシステムズジャパン株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2022年5月7日