検索

Pythonデータ処理入門

「Pythonデータ処理入門」の連載記事一覧です。

Pythonデータ処理入門:

正規化と標準化はデータセットのスケーリングに大いに役立ちますが、今回は実際にどんなふうにスケーリングが行われるかについてちょっと見てみましょう。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

DataFrameオブジェクトの指定した列のヒストグラムを描画することで、データの分布を視覚的に把握できます。また、年齢層のような考え方を基に、列のデータを一定のグループにまとめる(ビニングする)ことが可能です。その方法を見ていきましょう。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

タイタニックデータセットを使って、欠損値の扱い方、不要な列の削除、カテゴリカルデータのエンコーディングなど、前処理の仕方を見ていきましょう。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

Pandasでデータを処理する際には避けては通れない欠損値。その概要と欠損値かどうかの判定方法、欠損値が行や列に含まれているかを確認する方法、それら数をカウントする方法、欠損値を含む行や列を削除したり置き換えたりする方法を紹介します。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

pandasのDataFrameオブジェクトの要素を選択するにはたくさんの方法があります。その中からat属性とiat属性、それからブーリアンインデクシングと呼ばれる方法を用いてアクセスする方法を紹介しましょう。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

pandasが提供するデータを格納/操作するための2種類のオブジェクト、SeriesとDataFrame。そのうちのSeriesオブジェクトを作成しながら、その基本的な特徴を紹介。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

NumPyには日付を扱うためのnumpy.datetime64クラスとnumpy.timedelta64クラスがあります。これら2つのクラスを使った日付の扱い方を紹介しましょう。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

PythonとNumPyを使って手作業で、回帰分析のモデルを表す回帰式を求め、その決定係数を計算してみましょう。回帰分析が初めての方でもステップバイステップで計算内容が理解できます。同じ計算を手軽に行えるNumPyのpolyfit関数も解説します。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

NumPyには最大値や最小値を求める関数/メソッドがとてもたくさん用意されています。それらの幾つかと最大値や最小値を求める際に注意が必要なNaN値の扱いについて見ていきます。

かわさきしんじ, Deep Insider編集部
Pythonデータ処理入門:

NumPyが提供する最重要な要素といえば多次元配列を表すndarrayオブジェクト。このオブジェクトを作成して、その基本となる特性を見てみよう。

かわさきしんじ, Deep Insider編集部
ページトップに戻る