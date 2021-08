import numpy as np

from pathlib import Path



# numpy.loadtxt関数



# 読み込むCSVファイルの内容を確認

filename = 'test0.csv'

print(Path(filename).read_text())

#0 1 2 # 数値が空白文字で区切られている

#3 4 5

#6 7 8



# loadtxt関数の基本的な使い方

myarray = np.loadtxt(filename) # デフォルトでは空白文字が区切り文字

print(myarray) # デフォルトでは読み込んだ値は浮動小数点数値となる

#[[0. 1. 2.]

# [3. 4. 5.]

# [6. 7. 8.]]



# データ型を指定

myarray = np.loadtxt(filename, dtype=int) # 全てのフィールドが整数と指定

print(myarray)

#[[0 1 2]

# [3 4 5]

# [6 7 8]]



# 読み込むCSVファイルの内容を確認

filename = 'test1.csv'

print(Path(filename).read_text())

#0,1,2 # 数値がカンマで区切られている

#3,4,5

#6,7,8



# 区切り文字を指定

myarray = np.loadtxt(filename, delimiter=',') # 区切り文字としてカンマを指定

print(myarray)

#[[0. 1. 2.]

# [3. 4. 5.]

# [6. 7. 8.]]



myarray = np.loadtxt(filename) # ValueError:デフォルトは空白文字が区切り文字



# 読み込むCSVファイルの内容を確認

filename = 'test2.csv'

print(Path(filename).read_text())

#col1 col2 col3 # ヘッダーあり。数値が空白文字で区切られている

#0 1 2

#3 4 5

#6 7 8



# 先頭行を読み飛ばす

myarray = np.loadtxt(filename, skiprows=1) # 先頭の1行を読み飛ばす

print(myarray)

#[[0. 1. 2.]

# [3. 4. 5.]

# [6. 7. 8.]]



# 読み込むCSVファイルの内容を確認

filename = 'test3.csv'

with open(filename, encoding='utf8') as f:

print(f.read())

#一色 25 170 # 文字列/数値/数値が空白文字で区切られている

#かわさき 80 168



# 読み込む列を指定する

myarray = np.loadtxt(filename, usecols=[1, 2], encoding='utf8')

print(myarray)

#[[ 25. 170.]

# [ 80. 168.]]



# 列ごとに内容を取り出す(転置)

ages, heights = np.loadtxt(filename, unpack=True, usecols=[1, 2], encoding='utf8')

print(ages) # [25. 80.]

print(heights) # [170. 168.]



# numpy.genfromtxt関数



# 読み込むCSVファイルの内容を確認

filename = 'test4.csv'

with open(filename, encoding='utf8') as f:

print(f.read())

#name age height # ヘッダーあり。文字列/数値/数値が空白文字で区切られている

#一色 25 170

#かわさき 80 168



# 基本的な読み込み

myarray = np.genfromtxt(filename, encoding='utf8')

print(myarray)

#[[ nan nan nan] # 数値以外はnanとされている

# [ nan 25. 170.]

# [ nan 80. 168.]]

print(myarray.dtype) # float64



# 各フィールドの値からデータ型を判定

myarray = np.genfromtxt(filename, encoding='utf8', dtype=None)

print(myarray)

#[['name' 'age' 'height']

# ['一色' '25' '170']

# ['かわさき' '80' '168']]

print(myarray.dtype) # <U6(全てが6文字以下の文字列と判定された)



# 1行目をヘッダーとして扱い、各列のデータ型を明示的に指定

myarray = np.genfromtxt(filename, names=True, dtype='U4,f,f', encoding='utf8')

print(myarray) # [('一色', 25., 170.) ('かわさき', 80., 168.)]

print(myarray.dtype) # [('name', '<U4'), ('age', '<f4'), ('height', '<f4')]



# 読み込むCSVファイルの内容を確認

filename = 'test5.csv'

with open(filename, encoding='utf8') as f:

print(f.read())

#0,,2 # 各行に欠損している値がある

#,4,5

#6,,8



# 欠損値をnanで埋める

myarray = np.genfromtxt(filename, delimiter=',', encoding='utf8')

print(myarray)

#[[ 0. nan 2.] # 欠損している部分の値はnanになる

# [nan 4. 5.]

# [ 6. nan 8.]]



myarray = np.loadtxt(filename, delimiter=',', encoding='utf8') # ValueError



# 欠損値を埋める値を指定する

myarray = np.genfromtxt(filename, delimiter=',', filling_values=-1, encoding='utf8')

print(myarray)

#[[ 0. -1. 2.]

# [-1. 4. 5.]

# [ 6. -1. 8.]]