[NumPy超入門]多次元配列「ndarray」に触ってみよう:Pythonデータ処理入門
NumPyが提供する最重要な要素といえば多次元配列を表すndarrayオブジェクト。このオブジェクトを作成して、その基本となる特性を見てみよう。
前回はNumPyの概要についてお話をしました。だいたい次のようなことです。
- NumPyには多くの数値データを格納する多次元配列(ndarray)が用意されている
- ベクトル化やブロードキャスト、ユニバーサル関数などの機構を使うことで、多次元配列の操作を簡潔に記述して、それを高速に実行できる
- 基本的な統計関数を用いることで多次元配列に格納されているデータの分析が可能
今回はNumPyのインストール手順を見た後で、一番上の多次元配列を実際に作成して、その基本的な属性などを調べてみます。
NumPyのインストール
NumPyはPython処理系とは別に配布されているパッケージです。そのため、使う前にはPython環境にインストールする必要があります。例えば、python.orgからPython処理系をダウンロードして使用している場合には、NumPyのインストールにはpipコマンドを使用します。以下は仮想環境myenvを作成して、そこにNumPyをインストールするコードの例です(macOS/zsh)。
% python -m venv myenv
% source ./myenv/bin/activate
(myenv) % pip install numpy
Windowsなら以下のようになるでしょう。
> py -m venv myenv
> myenv\Scripts\activate
(myenv) > py -m pip install numpy
conda系統のディストリビューションを使用している場合は、Anaconda Navigatorを使うかconda installコマンドを使って自分が使う仮想環境にNumPyをインストールできます。これについてはNumPyのドキュメント「INSTALLING NUMPY」を参照してください。
インストールをしたら、後はPythonのプログラムコードの中からNumPyを使えるようにするだけです。
import numpy as np
上記のコードはnumpyライブラリを「np」として参照できるようにしています(これは慣用句となっています)。これにより、NumPyが提供する機能を「np」に続けてドット「.」と機能名(クラス名や関数名など)によって使えるようになります。例えば、この後で紹介するndarrayオブジェクトを作成するarray関数は「np.array(引数)」のように記述可能です。ただし本連載では、NumPyが提供する機能をパッケージ名込みで紹介するときには「numpy.array」のように「np」ではなく「numpy」を含めることにします。
ndarrayが得意とするデータの種類
本節のまとめ
- NumPyが提供するnumpy.ndarrayオブジェクトは配列、行列、テンソルなど、さまざまな種類のデータを格納できる
- NumPyのnumpy.ndarrayオブジェクトは事前に定められた形式でデータが格納されている「構造化データ」の扱いが得意
- 1つのndarrayオブジェクトが格納するデータの種類は全て同じ(例:整数値のみを格納する多次元配列、32ビット精度の浮動小数点数値のみを格納する多次元配列など)
Copyright© Digital Advantage Corp. All Rights Reserved.