機械学習関連で最も人気があるのはPython/NumPy/TensorFlow――GitHubが調査:C++も健闘
GitHubによれば、2018年に最もコントリビューションが多かった機械学習関連プロジェクトはTensorFlowだった。機械学習向けで人気のプログラム言語はPythonで、最も利用されているPython向けライブラリはNumPyだった。Julia言語へのコントリビューションも多かった。
ギットハブ・ジャパンは2019年1月29日、2018年内にコードのプッシュなどコントリビューションがあった機械学習向けプロジェクトに関する調査結果を、同社の公式ブログで公開した。
最もコントリビューションが多かったプロジェクトは「TensorFlow」。機械学習向けで最も多く利用されていたプログラミング言語はPythonだった。PythonはGitHub全体でも3番目に人気のある言語だという。
「machine-learning」というトピックでタグ付けされたリポジトリで多く使われているプログラミング言語のトップ10は次の通り。
Pythonの他、C++やJavaScript、Java、C#、Shell、TypeScriptは、GitHubで最もよく使われているプログラミング言語トップ10にも入っている。逆にJuliaやR、Scalaは機械学習以外の分野ではそれほど使われていないという。
パッケージの上位やコントリビューションの上位も調べた
次に、機械学習やデータサイエンスに関するプロジェクトのうち、Pythonにインポートされたパッケージのトップ10は次の通り。
ベクトル(多次元配列)処理用ライブラリのNumPyは、機械学習やデータサイエンスプロジェクトの75%で利用されていた。科学計算用ライブラリであるSciPyや、Excelのような表形式を扱うデータ構造処理ライブラリのpandas、グラフ表示など視覚化ライブラリのmatplotlibは、いずれも40%以上のプロジェクトで利用されていた。
最後に、「machine-learning」というラベルが付いたプロジェクトで、コントリビューションが多いものトップ10は次の通りだ。
1位のTensorFlowには、2位のscikit-learnに対して5倍のコントリビュータがいた。explosion/spaCyとRasaHQ/rasa_nluは自然言語処理のプロジェクトだ。
CMU-Perceptual-Computing-Lab/openposeと、thtrieu/darkflow、ageitgey/face_recognition、tesseract-ocr/tesseractは画像処理のプロジェクトである。機械学習向け言語で6番目に人気のJuliaは、コントリビューションの多さでも4位に入った。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GitHubに1年間で1億以上の新リポジトリ、懐かしの「Windows 95」も
GitHubのブログによると、2018年はオープンソースコミュニティーによって1億以上のリポジトリが作られた。コーディング初心者向けからWindowsアプリケーション開発まで幅が広く、「felixrieseberg/windows95」や「Microsoft/MS-DOS」など昔を懐かしむプロジェクトにも多くのスターやコントリビューターが集まった。 - GitHubが新プランを発表、プライベートリポジトリを無料で利用可能に
GitHubは2つの新プランを提供開始する。一つは、無料でプライベートリポジトリも利用できる「GitHub Free」、もう一つは有料の「GitHub Enterprise」だ。 - GitHubが「GitHub Actions」を発表、開発者が好きな機能を使ってワークフローを自動化
GitHubは2018年10月16日(米国時間)、米サンフランシスコで開催中のGitHub Universeで、ソフトウェア開発者のワークフローを自動化する機能「GitHub Actions」を発表した。開発者自身が、好きな機能やツールを組み合わせて、開発のパイプラインを効率化できるようにすることが目的だ。