# NaNは浮動小数点数値の演算結果を適切な数値として表現できないことを意味する

inf = float('inf')

print(inf * 0) # nan

print(inf - inf) # nan

print(inf / inf) # nan

print(inf + inf) # inf



# NaNはfloat('nan')やfloat('NaN')、numpy.nanで得られる

nan = float('nan')

print(nan) # nan



import numpy as np

print(np.nan) # nan



# データが欠損している箇所をNaNとして表現

from pathlib import Path



print(Path('test.csv').read_text())

# 出力結果:

#0,,2

#3,4,



a = np.genfromtxt('test.csv', delimiter=',')

print(a)

# 出力結果:

#[[ 0. nan 2.]

# [ 3. 4. nan]]



# NaNと数値の四則演算の結果は常にNaN

nan = float('NaN')



result = 1 + nan

print(result) # nan



result = nan ** 0

print(result) # 1



# NaNとNaNの比較演算では、「nan != nan」を除き、その結果は常にFalse

print(nan == nan) # False

print(nan > nan) # False

print(nan < nan) # False

print(nan != nan) # True



# 変数の値がNaNかどうかを調べるのに比較演算子は使えない

nan = float('NaN')

x = float('nan')



if x == nan:

print(f'{x} is not a number')

else:

print(f'{x} is a number')

# 出力結果:

#nan is a number



# mathモジュールのisnan関数を使う

from math import isnan



x = float('nan')



if isnan(x):

print(f'{x} is not a number')

else:

print(f'{x} is a number')

# 出力結果:

#nan is not a number



# math.isnanはコンテナオブジェクトには使えない

import numpy as np



a = np.array([[0.0, nan, 2.0], [3.0, 4.0, nan]])

print(a)

# 出力結果:

#[[ 0. nan 2.]

# [ 3. 4. nan]]



result = isnan(a) # TypeError



# numpy.isnan関数を使う

result = np.isnan(a) # OK

print(result)

# 出力結果:

#[[False True False]

# [False False True]]



result = isnan(np.nan)

print(result) # True



nan = float('nan')

result = np.isnan(nan)

print(result) # True



# pandas.DataFrame.isnaメソッドを使う

import pandas as pd



df = pd.DataFrame(a, columns=['col0', 'col1', 'col2'])

print(df)

# 出力結果:

# col0 col1 col2

#0 0.0 NaN 2.0

#1 3.0 4.0 NaN



result = df.isna()

print(result)

# 出力結果:

# col0 col1 col2

#0 False True False

#1 False False True



# NaNが幾つあるかを調べる

a = np.array([[0.0, nan, 2.0], [3.0, 4.0, nan]])

result = np.isnan(a) # OK



count = result.sum()

print(count) # 2(NaNの総数)



count = result.sum(axis=0)

print(count) # [0 1 1](列ごとのNaNの総数)



count = result.sum(axis=1)

print(count) # [1 1](行ごとのNaNの総数)



df = pd.DataFrame(a, columns=['col0', 'col1', 'col2'])

tmp = df.isna()

result = tmp.sum() # df.isna().sum()

print(result)

# 出力結果:

#col0 0

#col1 1

#col2 1

#dtype: int64