構造化Excelテク:目視前提で省略された項目名を補完して、表を構造化データにする:Tech TIPS
Excelで作成された表の中には、項目名の一部が省略されており、機械判読をしようとすると前処理が必要になるものがある。こうした表は、並べ替えも正しく行えず、活用に支障をきたしてしまう。そこで、省略されている項目名を補完し、機械処理が可能な形式にしよう。その手順を紹介する。
対象:Excel 2013/2016/2019/2021/365
Excelの表で項目名が省略されていると機械処理が難しくなる
Excelで作成された表の中には、項目名の一部が省略されている場合がある。こうした表は、機械処理や並べ替えが難しく、データの活用に支障をきたしてしまう。そこで、省略されている項目名を補完し、活用可能な形式にしよう。
「Microsoft Excel(エクセル)」で作成された表の中には、一部の項目名が省略されており、機械判読を行うとすると前処理が必要になるものがある。こうした表は、人間ならば、セルの前後や左右の関係から判読できても、機械で処理を行う際には補完が必要になり、自動化を難しくしてしまう。また、項目名の一部が省略されていると、並べ替えも正しく行えず、データの活用も困難になってしまう。
総務省統計局が公開した各府省が政府統計の総合窓口(e-Stat)に掲載する統計表の表記方法の統一ルール「統計表における機械判読可能なデータの表記方法の統一ルールの策定」の11ページ「チェック項目1-6 項目名等を省略していないか」においても、「ヒトであれば省略されている部分の意味を判断できるが、ソフトウェアなどのプログラムでは判断ができない」としており、「項目名などを省略しないこと」としている。
既に項目名などに省略された部分がある表は、機械処理が可能なように項目名を補完しておくとよい。逆に人間が見やすいように余計な文字列などが挿入されているような表を数値のみにする方法は、Tech TIPS「Excel構造化テク:単位などの文字列混入で泥沼化しているセルを数値のみにする」を参照してほしい。
省略された表の項目名を補完する
下画面のように項目名が省略されていても、人間が見る場合は、セルの上下関係から省略されていることが分かる。これを機械でも自動処理できるように、省略された部分を補完し、各行の項目名が省略のない状態にしよう。
それには、表の一番右側を作業用の列として使い、この列に「="<補完したい文字列>"&<データの始まるセル位置>」を入力する。例えば、画面の例では、補完したい文字列は「鎮静剤A-」なので、省略されているセルの先頭行である「D3」セルに「="鎮静剤A-"&A3」を入力する。
入力した後、「D3」セルの右下部分にマウスポインターを重ねポインターが太い「+」になったら下側に表の最後までドラッグする。マウスを離すと、D列に補完した状態の項目名が並ぶ。
ただし、この項目名は数式になっているので、このままA列にコピーしてしまうと、エラーになってしまう(参照しているセルを上書きしようとするため)。
Copyright© Digital Advantage Corp. All Rights Reserved.