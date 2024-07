import numpy as np

import pandas as pd



def levenshtein_distance_matrix(x, y):

# 表を作成

n, m = len(x), len(y)

dp = np.zeros((n + 1, m + 1), dtype=int)



# 初期化

for j in range(m + 1):

dp[0][j] = j

for i in range(n + 1):

dp[i][0] = i



# 各セルで計算していく

for i in range(1, n + 1):

for j in range(1, m + 1):

if x[i - 1] == y[j - 1]:

dp[i][j] = dp[i - 1][j - 1] # 【変更なし】

else:

dp[i][j] = min(dp[i - 1][j] + 1, # 【削除】

dp[i][j - 1] + 1, # 【挿入】

dp[i - 1][j - 1] + 1) # 【置換】



# 逆方向にたどって操作を記録(この部分は検証用で、実際には不要)

steps = []

i, j = n, m

while i > 0 or j > 0:

if i > 0 and j > 0 and x[i - 1] == y[j - 1]:

steps.append(f"変更なし: {x[i - 1]}")

i -= 1

j -= 1

elif i > 0 and (j == 0 or dp[i][j] == dp[i - 1][j] + 1):

steps.append(f"削除: {x[i - 1]}")

i -= 1

elif j > 0 and (i == 0 or dp[i][j] == dp[i][j - 1] + 1):

steps.append(f"挿入: {y[j - 1]}")

j -= 1

else:

steps.append(f"置換: {x[i - 1]} → {y[j - 1]}")

i -= 1

j -= 1



return dp[n][m], steps[::-1], dp



# 「おはようございます。」と「おはやいですね。」の編集距離と手順を計算

x = "おはようございます。"

y = "おはやいですね。"

distance, steps, matrix = levenshtein_distance_matrix(x, y)



print("レーベンシュタイン距離:")

print(distance)

print("

操作手順:")

for step in steps:

print(step)

print("

距離の計算行列:")

matrix_df = pd.DataFrame(matrix, index=[""] + list(x), columns=[""] + list(y))

print(matrix_df)



# レーベンシュタイン距離:

# 6



# 操作手順:

# 変更なし: お

# 変更なし: は

# 置換: よ → や

# 削除: う

# 削除: ご

# 削除: ざ

# 変更なし: い

# 置換: ま → で

# 変更なし: す

# 挿入: ね

# 変更なし: 。



# 距離の計算行列:

# お は や い で す ね 。

# 0 1 2 3 4 5 6 7 8

# お 1 0 1 2 3 4 5 6 7

# は 2 1 0 1 2 3 4 5 6

# よ 3 2 1 1 2 3 4 5 6

# う 4 3 2 2 2 3 4 5 6

# ご 5 4 3 3 3 3 4 5 6

# ざ 6 5 4 4 4 4 4 5 6

# い 7 6 5 5 4 5 5 5 6

# ま 8 7 6 6 5 5 6 6 6

# す 9 8 7 7 6 6 5 6 7

# 。 10 9 8 8 7 7 6 6 6