Windowsのシステムロケール「日本語(日本)」はやっぱり特殊?その知識、ホントに正しい? Windowsにまつわる都市伝説(203)

本連載第189回では、日本語環境が生み出した「Windows Admin Center」のバグの謎について解説しました。今回も日本語環境が関係する謎を見つけたので紹介します。原因は謎のまま、日本語環境では回避できません(というか、MS-DOSや16bitアプリ向けの互換機能なので、実は何の悪影響もありません)。

» 2022年02月09日 05時00分 公開
[山市良テクニカルライター]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

「Windowsにまつわる都市伝説」のインデックス

Windowsにまつわる都市伝説

「©」はUnicodeなのにUnicodeではない?

 WindowsのNTFSファイルシステムは、MS-DOSや16bitアプリケーション向けに、「8.3(8dot3)」形式の短いファイル名を自動生成する互換機能を提供しています。とある、有名なWindowsの専門書籍(英語)には、その生成方法が説明されています。

 例えば、スペース(空白)やUnicode文字など、MS-DOSで使えない文字、前後のピリオド、最後のピリオドを除く埋め込まれたピリオドを削除するなどです(この後に3つの手順が続きます)。

 書籍に例示されているファイル名で実際にファイルを作成し、「DIR /X」コマンドで8.3形式の短いファイル名を確認してみたところ、3つの例外を除いて、書いてある通りに自動生成されました。

 3つの例外とは、Unicode文字を含む場合です(表1)。書籍には短いファイル名が自動生成されると書いてあるのですが、「©」は短いファイル名が自動生成されず、他の2つはUnicode文字が削除されず、一部がそのまま残ってしまいました(画面1)。

ファイル名 短いファイル名
© 6E2D~1
UnicodeName.φΔЛɅ UNICOD~1
25¢.two characters 255440~1.TWO
表1 8.3形式の短いファイル名が自動生成されない例外
画面1 画面1 Unicode文字を含む3つのファイルが、想定した8.3形式の短いファイル名を自動生成しなかった

 短いファイル名を生成しなかった「©」を含む、書籍で例示されていたUnicode文字は、日本語版WindowsではUnicode文字としては認識されず、通常の文字(MS-DOSで使える文字、実際に使えるかどうかではありません)としてそのまま受け入れているように見えます。ただし、全てのUnicode文字で同様の問題が発生するというわけではなく、「™」や「℗」はUnicode文字として認識され、期待通りの短いファイル名を自動生成しました(画面2)。

画面2 画面2 画面2 「™」や「℗」はUnicode文字として認識され、期待通りの短いファイル名を自動生成した

 これはどういうことでしょうか? この書籍は第7版まで出ている歴史の長い書籍であり、8.3形式の自動生成については、かなり古い版から存在する内容のようです。

 Windowsの新しいバージョンで仕様が変わったのか、それとも、そもそも記述に誤りがあったのかとしばらく悩みましたが、Azure仮想マシンの英語環境で同様の実験をしてみたところ、書籍に書いてある通りに短いファイル名が自動生成されました。どうやら、日本語環境、それもいろいろ試してみて分かったことは、システムロケールが「日本語(日本)」であることが原因のようなのです。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。