[NumPy超入門]多次元配列「ndarray」に触ってみようPythonデータ処理入門

NumPyが提供する最重要な要素といえば多次元配列を表すndarrayオブジェクト。このオブジェクトを作成して、その基本となる特性を見てみよう。

» 2023年06月16日 05時00分 公開
[かわさきしんじDeep Insider編集部]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

「Pythonデータ処理入門」のインデックス

連載目次

 前回はNumPyの概要についてお話をしました。だいたい次のようなことです。

  • NumPyには多くの数値データを格納する多次元配列(ndarray)が用意されている
  • ベクトル化やブロードキャスト、ユニバーサル関数などの機構を使うことで、多次元配列の操作を簡潔に記述して、それを高速に実行できる
  • 基本的な統計関数を用いることで多次元配列に格納されているデータの分析が可能

 今回はNumPyのインストール手順を見た後で、一番上の多次元配列を実際に作成して、その基本的な属性などを調べてみます。

NumPyのインストール

 NumPyはPython処理系とは別に配布されているパッケージです。そのため、使う前にはPython環境にインストールする必要があります。例えば、python.orgからPython処理系をダウンロードして使用している場合には、NumPyのインストールにはpipコマンドを使用します。以下は仮想環境myenvを作成して、そこにNumPyをインストールするコードの例です(macOS/zsh)。

% python -m venv myenv
% source ./myenv/bin/activate
(myenv) % pip install numpy


NumPyを仮想環境myenvにインストール(macOS/zsh)

 Windowsなら以下のようになるでしょう。

> py -m venv myenv
> myenv\Scripts\activate
(myenv) > py -m pip install numpy


NumPyを仮想環境myenvにインストール(Windows/コマンドプロンプト)

 conda系統のディストリビューションを使用している場合は、Anaconda Navigatorを使うかconda installコマンドを使って自分が使う仮想環境にNumPyをインストールできます。これについてはNumPyのドキュメント「INSTALLING NUMPY」を参照してください。

 インストールをしたら、後はPythonのプログラムコードの中からNumPyを使えるようにするだけです。

import numpy as np

NumPyを使えるようにnumpyライブラリをインポート

 上記のコードはnumpyライブラリを「np」として参照できるようにしています(これは慣用句となっています)。これにより、NumPyが提供する機能を「np」に続けてドット「.」と機能名(クラス名や関数名など)によって使えるようになります。例えば、この後で紹介するndarrayオブジェクトを作成するarray関数は「np.array(引数)」のように記述可能です。ただし本連載では、NumPyが提供する機能をパッケージ名込みで紹介するときには「numpy.array」のように「np」ではなく「numpy」を含めることにします。

ndarrayが得意とするデータの種類

本節のまとめ

  • NumPyが提供するnumpy.ndarrayオブジェクトは配列、行列、テンソルなど、さまざまな種類のデータを格納できる
  • NumPyのnumpy.ndarrayオブジェクトは事前に定められた形式でデータが格納されている「構造化データ」の扱いが得意
  • 1つのndarrayオブジェクトが格納するデータの種類は全て同じ(例:整数値のみを格納する多次元配列、32ビット精度の浮動小数点数値のみを格納する多次元配列など)

Copyright© Digital Advantage Corp. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。