検索
TOP
AIを作り動かし守り生かす
ロー/ノーコード
クラウドネイティブ
MS&Windows
Pythonデータ処理入門
Pythonデータ処理入門
Deep Insider編集部 かわさきしんじ
2025/12/26
更新
NumPy超入門 目次
第1回
Pythonでのデータ処理をNumPyから始めよう!
(2023/06/09)
本シリーズと本連載について
Pythonについては学んだけれどまだ勉強が必要なの?
・
簡潔なコードが書ける
・
面倒なことはNumPyがよろしくやってくれる
・
つまり……
NumPyとは?
第2回
多次元配列「ndarray」に触ってみよう
(2023/06/16)
NumPyのインストール
ndarrayが得意とするデータの種類
多次元配列を作成してみよう
・
numpy.array関数によるndarrayオブジェクトの作成
・
多次元配列が持つ属性
・
多次元配列を作成する関数たち
・
CSVファイルからデータを読み出す
第3回
インデックスやスライスなどを使って多次元配列「ndarray」を操作してみよう
(2023/07/07)
ndarrayの形状を変更してみよう
・
numpy.linspace関数
・
ndarrayオブジェクトの形状を変更してみる
ndarrayオブジェクトの加減乗除
インデックスによる要素の選択と変更
スライスによる要素の選択と変更
第4回
多次元配列「ndarray」の高度なインデックス指定に触れてみよう
(2023/07/21)
高度なインデックス指定またはファンシーインデクシング
2次元配列で高度なインデックス指定を使用する
高度なインデックス指定でブーリアン値を要素とする配列を使う
高度なインデックス指定と基本的なインデックス指定の混在
第5回
多次元配列から最大値/最小値を求めてみよう
(2023/08/18)
最大値の取得
・
numpy.amax関数
・
numpy.nanmax関数
・
numpy.ndarray.maxメソッド
・
numpy.maximum関数とnumpy.fmax関数
・
numpy.argmax関数とnumpy.ndarray.argmaxメソッド
最小値の取得
第6回
内積、行列積からコサイン類似度までNumPyを使って試してみよう
(2023/09/08)
ベクトルや行列の積にもいろいろある
numpy.multiply関数
numpy.matmul関数
numpy.dot関数
numpy.inner関数
行列の絶対値とコサイン類似度
第7回
逆行列、行列式、固有値と固有ベクトルを計算してみよう
(2023/09/22)
逆行列を求めるには
・
numpy.set_printoptions関数
行列式を求めるには
行列の固有値を求めるには
第8回
平均/中央値/最頻値や分散/標準偏差を求めてみよう
(2023/10/05)
基本統計量とは
最大値と最小値
合計値
平均値
中央値
最頻値
分散と標準偏差
第9回
データ処理の最初の一歩! 基本統計量からデータの特徴を把握しよう
(2023/10/27)
California Housingデータセット
データセットの読み込み
配列の結合
基本統計量の確認
第10回
箱ひげ図とヒストグラムを使ってデータセットを可視化してみよう
(2023/11/17)
CSVファイルの読み込み
・
numpy.loadtxt関数
・
numpy.savetxt関数
四分位数を求めてみる
Matplotlibによる箱ひげ図の描画
Matplotlibによるヒストグラムの描画
第11回
相関係数とヒートマップ、散布図を使ってデータセットをさらに可視化してみよう
(2023/12/08)
相関係数を求めて可視化する
散布図を使って2つの列に相関があることを確認しよう
・
numpy.where関数
・
外れ値の除去
次回に続く
第12回
Pythonで単回帰分析:手作業で計算してみよう
(2024/01/12)
単回帰分析とは
手作業で傾きを求めてみよう
カリフォルニア州の住宅価格データセットのモデルを作って回帰式を求めてみよう
決定係数を求めてみよう
NumPyが提供する機能を使ってモデルを求めてみよう
第13回
日付や時刻、その差分の扱い
(2024/01/26)
NumPyで日付を操作する
・
日付と時刻を表すオブジェクト:datetime64クラスのインスタンス
・
時間差を表すオブジェクト:numpy.timedelta64クラスのインスタンス
・
日付や時刻でないことを表すNaT(Not a Time)
第14回
異なる型のデータを格納する構造化配列を使ってみよう
(2024/02/16)
構造化配列とは
・
構造化データ型の定義
構造化配列の作成と操作
・
構造化配列の作成
・
構造化配列への代入
・
複数フィールドや行データの参照と代入
pandas超入門
第1回
Pythonでデータ分析を始めよう! データの読み書き方法
(2024/04/05)
本シリーズと本連載について
pandasとは
・
pandasのインストール
・
pandasで扱えるデータ
・
SeriesとDataFrame
データセットの読み込みと書き込み
・
CSVファイルの読み込み
・
pandas.read_csv関数
・
CSVファイルへの書き込み
・
pandas.DataFrame.to_csvメソッド
・
Excelファイルの読み込み
・
pandas.read_excel関数
・
Excelファイルへの書き込み
・
pandas.DataFrame.to_excelメソッド
読み込んだデータを調べてみよう
第2回
Seriesオブジェクトの作成とその基本
(2024/04/19)
Seriesオブジェクトとは
・
pandas.Seriesコンストラクタ
・
シンプルな作成例
・
indexパラメーターを指定する
・
copyパラメーターの指定
ベクトル化された演算とブロードキャスト
Seriesオブジェクトに格納できるもの
第3回
DataFrameオブジェクトの作成と行や列、要素の選択
(2024/05/10)
DataFrameオブジェクトとは
・
pandas.DataFrameコンストラクタ
・
シンプルな作成例
・
indexパラメーターを指定する
・
columnsパラメーターを指定する
loc属性とiloc属性による特定の行や列、要素の選択
・
列の選択
・
行の選択
・
要素の選択
選択で得られるデータの種類
第4回
DataFrameの情報(形状、要素数、要素のデータ型など)を調べてみよう
(2024/05/24)
DataFrameオブジェクトの要素の型/形状/次元数などを調べるには
・
dtypes属性
・
shape属性
・
size属性
・
ndim属性
・
columns属性
・
index属性
・
axes属性
・
values属性
・
T属性
・
infoメソッド
DataFrameオブジェクトを他のオブジェクトに変換する
・
to_numpyメソッド
・
astypeメソッド
・
to_listメソッド(Seriesオブジェクト)
第5回
DataFrameの要素を選択するさまざまな方法
(2024/06/07)
at属性/iat属性による特定要素の選択
・
ブラケットによる列選択と属性としての列選択
ブーリアンインデクシング
・
簡単な例
・
複数の条件を指定する
・
loc属性やiloc属性と組み合わせる
より高度な方法
第6回
DataFrameに対して行や列を追加したり削除したりしてみよう
(2024/06/28)
DataFrameオブジェクトに列や行を追加する
・
DataFrameオブジェクトに列を追加する
・
新規列名を指定して代入
・
assignメソッドを使って列を追加する
・
pandas.DataFrame.assignメソッド
・
insertメソッドを使って列を追加する
・
pandas.DataFrame.insertメソッド
・
DataFrameオブジェクトに行を追加する
・
DataFrameオブジェクトに列や行を追加する
・
pandas.concat関数
DataFrameオブジェクトから行/列を削除する
・
pandas.DataFrame.dropメソッド
第7回
DataFrameをソートしたり行や列を入れ替えたりしてみよう
(2024/07/19)
DataFrameオブジェクトのソート
・
pandas.DataFrame.sort_indexメソッド
・
pandas.DataFrame.sort_valuesメソッド
・
pandas.DataFrame.T属性
DataFrameオブジェクトの行/列の入れ替え/追加/削除
・
pandas.DataFrame.reindexメソッド
第8回
DataFrameをさまざまなオブジェクトに変換しよう
(2024/08/02)
DataFrameオブジェクトをNumPyの多次元配列に変換
・
pandas.DataFrame.to_numpyメソッド
・
dtypeパラメーターの指定
・
copyパラメーターの指定
・
na_valueパラメーターを指定する
DataFrameオブジェクトをPythonのリストに変換
・
pandas.DataFrame.iterrowsメソッド
DataFrameオブジェクトをPythonの辞書に変換
・
pandas.DataFrame.to_dictメソッド
DataFrameオブジェクトをJSON形式のデータに変換
・
pandas.DataFrame.to_jsonメソッド
第9回
欠損値とその処理
(2024/08/23)
欠損値とは
欠損値かどうかの判定
・
pandas.isna関数/pandas.isnull関数
・
pandas.notna関数/pandas.notnull関数
・
DataFrame.isnaメソッド/DataFrame.isnullメソッド
行や列に欠損値が含まれているかどうかを確認
・
pandas.DataFrame.allメソッド/pandas.DataFrame.anyメソッド
欠損値を含む行/列のカウント
・
pandas.DataFrame.sumメソッド
欠損値を含む行/列を削除する
・
pandas.DataFrame.dropnaメソッド
欠損値を別の値に置き換える
・
pandas.DataFrame.fillnaメソッド
第10回
探索的データ分析の基礎:タイタニックデータセットを調べてみよう
(2024/09/06)
タイタニックデータセット
DataFrameオブジェクトの概要を調べる
・
pandas.DataFrame.infoメソッド
・
pandas.DataFrame.describeメソッド
タイタニックデータセットをもう少しだけ調べてみる
第11回
データセットの前処理をしてみよう
(2024/09/20)
欠損値を含む列
・
'Embarked'列
・
pandas.DataFrame.groupbyメソッド
・
pandas.DataFrame.fillnaメソッド
・
'Age'列
列の削除
エンコーディング
・
pandas.get_dummies関数
第12回
ヒストグラムの描画とビニングを体験してみよう
(2024/10/04)
'Age'列のヒストグラムを作成してみよう
・
pandas.DataFrame.histメソッド
DataFrameオブジェクトのビニング
・
pandas.cut関数
plotメソッドによる'Age'列のヒストグラムの描画
第13回
データをスケーリングしてみよう(正規化と標準化)
(2024/10/18)
データのスケーリングとは
正規化
標準化
Titanicデータセットを正規化/標準化してみよう
第14回
正規化と標準化についてもうちょっと
(2024/12/20)
サンプルのデータセットの作成
正規化してみる
標準化してみる
一様分布の列を標準化してみる
正規化と外れ値
第15回
Diabetesデータセットを使って回帰分析してみよう(可視化編)
(2025/01/24)
使用するデータセット
データの読み込み
ヒートマップをプロットしてみよう
散布図をプロットしてみよう
第16回
Diabetesデータセットを使って回帰分析してみよう(前処理編)
(2025/02/14)
前回のまとめ
外れ値をチェックして、DataFrameオブジェクトから削除
target列の分布に偏りがないかどうかをチェック
平均0、標準偏差1となるようにスケーリング
第17回
Diabetesデータセットを使って回帰分析してみよう(単回帰分析編)
(2025/03/07)
前回のまとめ
回帰分析とは
データセットの分割
モデルの作成と学習
モデルとテストと決定係数
結果をプロットしてみる
これまでの処理を関数にまとめておく
第18回
Diabetesデータセットを使って回帰分析してみよう(重回帰分析編)
(2025/03/28)
前回のまとめ
単回帰分析をもう一度
BMIと血圧を特徴量とする
BMI/血圧/善玉コレステロールを特徴量とする
その他の特徴量をまとめて
Matplotlib超入門(pyplot編) 目次
[Matplotlib超入門:pyplot編]第1回
折れ線グラフ/散布図/棒グラフ/ヒストグラム/円グラフを作成してみよう
(2025/05/16)
Matplotlibとは
・
pyplotインタフェースとオブジェクト指向インタフェース
・
Matplotlibのインストールとインポート
pyplotで基本のグラフを描くには
・
折れ線グラフを作成するには:pyplot.plot関数
・
pyplot.plot関数
・
散布図を作成するには:pyplot.scatter関数
・
pyplot.scatter関数
・
棒グラフを作成するには:pyplot.bar関数
・
pyplot.bar関数
・
ヒストグラムを作成するには:pyplot.hist関数
・
pyplot.hist関数
・
円グラフを作成するには:pyplot.pie関数
・
pyplot.pie関数
作成したグラフを保存するには:pyplot.savefig関数
・
pyplot.savefig関数
第2回
見やすく伝わるグラフに仕上げよう(サイズ、ラベル、凡例、複数表示など)
(2025/06/06)
見やすく伝わるグラフを作るとは
グラフのサイズを調整するには:pyplot.figure関数
・
pyplot.figure関数
グラフにタイトルや凡例を付けるには
・
グラフタイトルを追加するには:pyplot.title関数
・
pyplot.title関数
・
軸ラベルを追加するには:pyplot.xlabel関数/pyplot.ylabel関数
・
pyplot.xlabel関数/pyplot.ylabel関数
・
目盛りを設定するには:pyplot.xticks関数/pyplot.yticks関数
・
pyplot.xticks関数/pyplot.yticks関数
・
凡例を表示するには:pyplot.legend関数
・
pyplot.legend関数
グラフにグリッドや注釈を追加するには
・
グリッド線を表示して見やすくするには:pyplot.grid関数
・
pyplot.grid関数
・
グラフ上にテキストを表示するには:pyplot.text関数
・
pyplot.text関数
・
注釈(矢印付き)を追加するには:pyplot.annotate関数
・
pyplot.annotate関数
複数のデータを分かりやすく描画するには
・
複数のグラフを描くには:グラフを描画する関数を複数回呼び出す
・
複数のグラフを並べて比較するには:pyplot.subplot関数
・
pyplot.subplot関数
第3回
DataFrameから箱ひげ図を描く方法と、pandas搭載のグラフ機能との比較
(2025/06/27)
pandasのデータをpyplotで可視化するには
・
MatplotlibにDataFrameオブジェクトを渡す
・
pyplot.boxplot関数
・
DataFrame/Seriesオブジェクトが持つplotメソッドを使う
・
DataFrame.plot属性
・
DataFrameオブジェクトが持つboxplot/histメソッドを使う
第4回
グラフの中で日本語を使おう
(2025/07/18)
日本語のテキストを含んだグラフを表示してみよう
・
pyplot.rcParams属性によるフォントの設定
・
fontlist.jsonファイル
・
フォントファイルのパスを使ってフォントを指定する
japanize-matplotlibによる日本語を使ったグラフの描画
OOインタフェース編 第1回
FigureオブジェクトとAxesオブジェクトを使ってみよう
(2025/09/12)
pyplotインタフェースとOOインタフェース
Figure/Axes/Artistsとは?
pyplot.figure関数とadd_subplotメソッド
Figure.subplotsメソッド
pyplot.subplots関数
まとめ
OOインタフェース編 第2回 グラフを実際に描画しながら2つのインタフェースの違いを見てみよう
(2025/11/14)
グラフを1つ描いてみる
グラフを2つ描いてみる
グラフに装飾を施してみる
・
タイトルやラベルを設定してみる
・
凡例とグリッドを追加してみる
[Matplotlib超入門:OOインタフェース編]第3回グラフを描くコードを関数にまとめて再利用しよう
(2025/12/26)
データの準備
pyplotインタフェースでFigureオブジェクトに複数のグラフを描画してみる
関数を使ってpyplotインタフェースのコードを再利用してみる
関数を使ってOOインタフェースのコードを再利用してみる
可視化をさらに自動化してみる
総合記事ランキング
「もう開発者はシークレットを使うな」 GitHubが「今日できる」4つのセキュリティ対策を紹介
「ソフトウェア産業は『未曾有の危機』に突入」 GMO Flatt Security米内氏に聞く“axios侵害”の教訓
実務をこなせるが危険な「OpenClaw」、AWSがVPSで一般提供する狙い
これなら分かる「LLM Wiki」 メモや資料をAIで整理し、使える知識に育てる新しい発想
CPythonはRustの夢を見るか Rust for CPythonがPython 3.16に向けた計画を公表
期待外れの生成AI、何が足りない? なぜ「コンテキストエンジニアリング」が必要か
【実録】自社に届いたCEO詐欺メールを徹底解析 狙われる企業に共通する3つの「隙」
多要素認証をすり抜ける、あなたの「承認」が命取りに。AI時代のデバイスコード悪用攻撃の巧妙な手口
2026年6月にWindows 11が起動不能に? 「セキュアブート証明書」期限切れリスクと対策
「サーバが簡単には手に入らない」 メモリ不足の原因と回避策、Broadcomが提示