検索
ニュース

ビッグデータの保存、処理に特化したプラットフォーム「YTsaurus」がOSS化「増加し続ける負荷に対応する大規模企業が最も恩恵を受ける」

Yandexは、ビッグデータを保存、処理するためのプラットフォーム「YTsaurus」のオープンソースソフトウェア(OSS)化を発表し、ソースコードを公開した。

Share
Tweet
LINE
Hatena

 Yandexは、2023年3月20日(米国時間)、同社が開発する「YTsaurus」のオープンソースソフトウェア(OSS)化を発表し、ソースコードを公開した。YTsaurusは、ビッグデータを保存、処理するためのプラットフォームだ。

 同社によると、YTsaurusは、分析から数十億のパラメータを持つ複雑なモデルのトレーニングまで、幅広いタスクに適しているという。「Yandex Search」はYTsaurusを使用して検索インデックスを構築し、自動運転車はライドデータの処理やアルゴリズムを改善するためにYTsaurusを使用している。YTsaurusは、Yandexのスーパーコンピュータを管理し、計算能力を可能な限り効率的に使用するように負荷を分散するという。

 「Yandexは2010年からYTsaurusを開発してきた。市場に出回っている単一のソリューションでは全ての要件を満たすことができないため、独自のビッグデータエコシステムの構築を開始した。2023年3月現在、YTsaurusはYandexの内部インフラストラクチャの重要な要素の1つ。何十人もの開発者がこのプラットフォームに取り組んでおり、その機能は常に拡張されている」と、分散コンピューティング技術部門の責任者を務めるマキシム・バベンコ氏は述べる。

 「YTsaurusはYandex社内で実証し、誰でも利用できるようになった。数千台のサーバで膨大な量のデータを処理し、増加し続ける負荷に対応する大規模企業が最も恩恵を受けるだろう。私たちは、オープンソース化することで、他の製品と同様に新たな開発段階に進むと確信している」と、「Yandex Cloud」の責任者を務めるアレクセイ・バシュケフ氏は述べる。

 YTsaurusのソースコードとドキュメントはGitHub上で公開されている。コードはApache 2.0ライセンスで配布されており、誰でもプラットフォームを利用したり、自分用に修正したりすることができる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る