ニュース
データ加工を無料で学べる「データサイエンス100本ノック」 データサイエンティスト協会がGitHubに公開:データサイエンスの「基礎的なデータ処理の修行場」として
データサイエンティスト協会は、「データサイエンス100本ノック(構造化データ加工編)」をGitHubに公開した。データと実行環境を構築するためのスクリプト、演習問題がDockerのコンテナとして実装されており、データ加工について無料で学べる。
データサイエンティスト協会は2020年6月15日、構造化データの加工について無料で学べる環境「データサイエンス100本ノック(構造化データ加工編)」を「GitHub」に公開したと発表した。データと実行環境を構築するためのスクリプトと演習問題をセットにして、データの加工や集計、統計学、機械学習を使用したモデリングの前処理などを学べるようにしたもの。対象はデータサイエンスの初学者。
対応言語はSQLとPython、R
データサイエンティスト協会は、「最近はデータ活用の重要性が広く認知され、書籍やWebサイトなどデータ分析のスキル向上に役立つ情報源が多く提供されているものの、学習者がそれを実践するためのデータやプログラミング実行環境を持ち合わせていないことが多い」としている。そのため、データ活用の実践力を身に付ける機会が限られているという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- データサイエンティストに優しいフレームワーク「Metaflow」、Netflixがオープンソース化
Netflixは、データサイエンスプロジェクトの構築や管理のフレームワークとして開発、利用してきた「Metaflow」をオープンソース化した。データサイエンティストに余分な負担を掛けずに利用できるよう設計されており、AWSを通じて大規模に展開しやすい。 - DataRobot概説: データサイエンティストでない人に、データサイエンティストっぽく働いてもらおう
データサイエンティスト不足が社会問題になっている。昨今、データサイエンティストでない人でも機械学習モデルを自動生成できるツールやサービスが多数登場しているが、その一つであるDataRobotにどのような機能があり、どのようにデータサイエンティスト不足問題を改善しようとしているかを解説する。 - 「データサイエンティストは経営幹部候補」? コニカミノルタジャパンとNTTドコモが語るキャリア
データサイエンティストが活躍する現場とはどのようなものなのか。2018年5月に開催された「SAS FORUM JAPAN 2018」で、データ分析関連人材の雇用や養成に積極的な企業のデータ関連部署担当者やデータサイエンティストが集まり、各社の事業におけるデータ分析の役割や、データ分析スペシャリストのキャリアについて、学生に向けて4セッション、約4時間にわたって説明した。本記事では、これらのセッションのうち、コニカミノルタジャパンとNTTドコモの講演をリポートする。