ビッグデータの保存、処理に特化したプラットフォーム「YTsaurus」がOSS化:「増加し続ける負荷に対応する大規模企業が最も恩恵を受ける」
Yandexは、ビッグデータを保存、処理するためのプラットフォーム「YTsaurus」のオープンソースソフトウェア(OSS)化を発表し、ソースコードを公開した。
Yandexは、2023年3月20日(米国時間)、同社が開発する「YTsaurus」のオープンソースソフトウェア(OSS)化を発表し、ソースコードを公開した。YTsaurusは、ビッグデータを保存、処理するためのプラットフォームだ。
同社によると、YTsaurusは、分析から数十億のパラメータを持つ複雑なモデルのトレーニングまで、幅広いタスクに適しているという。「Yandex Search」はYTsaurusを使用して検索インデックスを構築し、自動運転車はライドデータの処理やアルゴリズムを改善するためにYTsaurusを使用している。YTsaurusは、Yandexのスーパーコンピュータを管理し、計算能力を可能な限り効率的に使用するように負荷を分散するという。
「Yandexは2010年からYTsaurusを開発してきた。市場に出回っている単一のソリューションでは全ての要件を満たすことができないため、独自のビッグデータエコシステムの構築を開始した。2023年3月現在、YTsaurusはYandexの内部インフラストラクチャの重要な要素の1つ。何十人もの開発者がこのプラットフォームに取り組んでおり、その機能は常に拡張されている」と、分散コンピューティング技術部門の責任者を務めるマキシム・バベンコ氏は述べる。
「YTsaurusはYandex社内で実証し、誰でも利用できるようになった。数千台のサーバで膨大な量のデータを処理し、増加し続ける負荷に対応する大規模企業が最も恩恵を受けるだろう。私たちは、オープンソース化することで、他の製品と同様に新たな開発段階に進むと確信している」と、「Yandex Cloud」の責任者を務めるアレクセイ・バシュケフ氏は述べる。
YTsaurusのソースコードとドキュメントはGitHub上で公開されている。コードはApache 2.0ライセンスで配布されており、誰でもプラットフォームを利用したり、自分用に修正したりすることができる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Google、分散アプリケーションを構築・デプロイするOSSフレームワーク「Service Weaver」発表
Googleは、分散アプリケーションを構築、デプロイ(展開)するためのオープンソースフレームワーク「Service Weaver」を発表した。 - ビッグデータを視覚化し、さらに共有もできる「Azure Data Explorerダッシュボード」とは
Microsoftは、2019年2月から提供しているサービス「Azure Data Explorer」で、それまでプレビューとされていた「ダッシュボード」機能の一般提供を開始しました。この機能を利用すると、Azure Data Explorerで分析したクエリ結果をリアルタイムに視覚化し、チーム内で共有できます。 - マーケティング分析で使われるビッグデータ基盤をセキュリティ業務に応用した理由
マーケティング分析で用いられているデータ基盤サービスを活用した、リクルートの「次世代セキュリティDWH」の構築事例を中心に、最新のセキュリティログ基盤の動向を紹介する連載。初回は、その背景やきっかけ、考え方について解説する。