- PR -

2バイト文字の出現回数について

1
投稿者投稿内容
oki
ベテラン
会議室デビュー日: 2004/12/18
投稿数: 55
投稿日時: 2005-04-20 11:55
お世話になります。松本と申します。

【環境】Redhat9

シェルコマンドでファイルの中にある2バイト文字の出現回数を
調べる方法をご存知方おられましたら、ご教授お願い致します。
angel
ぬし
会議室デビュー日: 2005/03/17
投稿数: 711
投稿日時: 2005-04-22 00:06
こんばんは。

文字コードによっても様々なので、汎用的な解決は難しいのではないかと思います。

日本語EUC限定なら、次の手が使えるかも知れませんが。

$ perl -pne 's/[\x01-\x7f]//g' 対象ファイル | wc -c

※2バイト文字だけのバイト数が出るので、2で割れば文字数になります。

なお、即興で考え付いた方法なので、保証はしません。ご注意を。
ほろりん
ベテラン
会議室デビュー日: 2004/11/24
投稿数: 98
お住まい・勤務地: あそこ
投稿日時: 2005-04-22 00:50
angelさんのおっしゃるとおり、条件を限定しないと回答は得られないと思います。
1.文字コードはなにか?
2.「出現回数」の定義。
  文字数のことか?あるいは1バイトコードと2バイトコードが混じっていて、2バイト文字が出現してからそれが終わるまで何文字あってもそれを1回と数えるのか?
3.特定文字だけか、2バイトコードすべてか?

_________________
1

スキルアップ/キャリアアップ(JOB@IT)