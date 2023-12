import pandas as pd

from sklearn.cluster import KMeans

from sklearn.preprocessing import MinMaxScaler



# データの読み込み

df = pd.read_excel("https://github.com/Gessys/data_analysis/raw/main/12a.xlsx",

sheet_name="ワインの売り上げ(1)", skiprows=2, usecols="A:F")

data = df.loc[:, ["価格", "評価", "売上金額"]]



# データをスケーリングする(値の大きさが異なるので、0〜1になるように調整する)

sc = MinMaxScaler()

data_sc = sc.fit_transform(data)



# k-means法によるクラスタリング

model = KMeans(n_clusters=6, random_state=0, n_init="auto")

model.fit(data_sc)



# 元のデータにクラスタ番号を追加する

cluster_no = pd.DataFrame(model.labels_, columns=["グループ"])

dfresult = pd.concat([df, cluster_no], axis=1)