import pandas as pd

from sklearn.cluster import KMeans

from sklearn.preprocessing import StandardScaler



# データの読み込み

df = pd.read_excel("https://github.com/Gessys/data_analysis/raw/main/11b.xlsx", sheet_name="年齢と利用時間")

data = df.loc[:, "Age":"Minutes"] # 年齢と時間だけを取り出す



# データを標準化する(年齢と時間では値の大きさが異なるので)

sc = StandardScaler()

data_sc = sc.fit_transform(data)



# k-means法によるクラスタリング

model = KMeans(n_clusters=6, random_state=0, n_init="auto") # 6グループに分ける

model.fit(data_sc)



# 元のデータにクラスター番号を追加する

cluster_no = pd.DataFrame(model.labels_, columns=["Group"])

dfresult = pd.concat([df, cluster_no], axis=1)



# Excelファイルに書き出す

dfresult.to_excel("11b_add.xlsx", index=False)