DuckDBチームはオープンソースの分析データベースシステム「DuckDB」の正式バージョンを公開した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
DuckDBチームは2024年6月3日(オランダ時間)、オープンソースの分析データベースシステム「DuckDB」の正式バージョン1.0.0を公開した。
DuckDBは、2018年にプロジェクトの最初のソースコードが作成された。現在のC++エンジンのコードは30万行を超える。速度、信頼性、ポータビリティ、使いやすさに重点を置いて設計されており、豊富なSQLの方言をサポートしている。サードパーティーによる拡張機能も複数構築、配布されている。
スタンドアロンのCLI(コマンドラインインタフェース)アプリケーションとして利用可能で、Python、R、Java、Wasmといったクライアントがあり、pandasやdplyrなどのパッケージと深く統合されている。
DuckDBチームは、DuckDBを信頼できるアプリケーション構築基盤とすることに注力してきた。DuckDB 1.0.0の開発に当たっては、ストレージフォーマットの前方および後方互換性と、安定性に重点を置いたと述べ、次のように説明している。
DuckDBは独自のデータストレージフォーマットを持っている。このフォーマットは、完全なトランザクションセマンティクスと最先端の圧縮機能を備えており、ユーザーが多数の大きなテーブルを単一のファイルで管理することを可能にする。
だが、このフォーマットには過去に大きな変更が加えられてきたことから、DuckDBの新バージョンがリリースされるたびに、旧バージョンで作成されたファイルを手動でアップグレードしなければならなかった。DuckDBチームは、2024年2月にリリースしたDuckDB 0.10.0でこの問題に対処し、ストレージフォーマットに後方互換性と限定的な前方互換性を導入した。
DuckDBチームは、DuckDB 1.0.0で作成されるDuckDBファイルについては、DuckDBの将来バージョンとの互換性を保証している。
DuckDBチームはDuckDB 1.0.0では、新機能の追加を極力控え、安定性を中核テーマに据えた。性能上の問題を特定するために多数のマイクロベンチマークや標準的ベンチマークスイートを実行した他、特殊な脆弱(ぜいじゃく)性を発見、根絶するために、多種多様なSQLクエリを作成するさまざまなファジングツールを使用してテストした。これらにより、DuckDB 1.0.0をリリースするために必要な信頼性が確保されたとしている。
またDuckDBチームは、DuckDB 1.0.0の安定性のもう1つの核心として、バージョン間の安定性を挙げ、ユーザーに影響する今後の変更はより慎重を期し、C APIとSQL方言の安定性の提供に重点を置く方針を示している。
DuckDBチームは、DuckDBの現在の開発、管理が順調に行われていることを以下のように説明している。
DuckDBチームは長期的な計画の一つとして、DuckDBのコアをスリムに保ちながら、サードパーティーによる拡張機能の開発を後押しすることを挙げている。コミュニティーにおける拡張機能の構築/配布プロセスの効率化を推進するという。
Copyright © ITmedia, Inc. All Rights Reserved.