Excelなどで作成した表形式ファイルのデータ部を、ほかのアプリケーションに引き渡したい場合に、最もシンプルな方法の1つがテキストファイル化です。
この時、用いられる代表的な形式が2つあり、セルとセルの区切りを現す方法によって使い分けられています。それが「カンマ区切り(CSV)ファイル」と「テキスト(タブ区切り)ファイル」です。例えば、Excelでは、この2つの形式のどちらでも保存できるようになっています。
これに対して、Javaには、なんらかの区切り文字を含むデータをトークンと呼ばれる単位に分解する機能を持つクラスがいくつかあります。その中で、文字列を対象とするシンプルなものがStringTokenizerクラスです。
使い方は簡単で、StringTokenizerのコンストラクタに、区切り文字を含む文字列と、区切り文字を与え、hasMoreTokens()メソッドがfalseを返すまで、nextToken()メソッドでトークンを得るという仕組みです。
サンプルとして、カンマ区切り(CSV)の文字列と、タブ区切りの文字列をそれぞれトークンに分割して表示するプログラムは下記のようになります。
CSVファイルからHTMLを作成したい場合、Excelで読み込んで「名前を付けて保存」を実行し、ファイルの種類を「Webページ」とすれば簡単にできます。しかし、HTMLの構成を思いとおりにしたり、ほかの処理をするプログラムからダイナミックに作成したい場合などは、StringTokenizerを使うと便利です。
一例として、CSVファイルを読み込んで、行番号を加えてテーブル化したHTMLを出力するプログラムを示します。下記のCSVファイル「a.csv」があるとします。
JREのバージョン,脆弱性有り,解消
1.3.1,1.3.1_18,1.3.1_19
1.4.2,1.4.2_12,1.4.2_13
1.5.0,1.5.0_09,1.5.0_10
このCSVファイルを、Java TIPS「java.ioパッケージのReader系クラスの使い分け」で紹介しましたLineNumberReaderクラスを用いて読み込み、StringTokenizerで分解し編集・出力するプログラムは以下のようになります。
出来上がったHTMLファイルをブラウザで表示すると、下図のようになります。
Copyright © ITmedia, Inc. All Rights Reserved.