【Excel】生データの分析にはこれを使え! −− 「データ分析」と「スライサー」の使い方:Tech TIPS
アクセスログの生データなどを集計、分析するのは意外と面倒だ。Excelの「データ分析」や「スライサー」を利用すると、簡単に集計が行える。その方法を紹介しよう。
対象:Excel 365
生データを集計するのは意外と面倒?
東京都の新型コロナウイルスの患者データは、「東京都_新型コロナウイルス陽性患者発表詳細(年別分割版_2022年)」で提供されている。こうした生データから患者数の推移などを割り出すには、通常、COUNTIF関数で同じ日付を集計するなどの必要がある。実は、Excelの「データ分析」を利用すると、簡単に集計できる。その方法を紹介しよう。
アクセスログなどの生データは、そのままの状態では何が起きているのか分からないことが多い。人が理解するためには、集計、分析を行い、傾向が分かるようにしなければならない。ただ、こうしたデータを集計、分析するのは結構手間がかかる。
Excelの「データ分析」を使うことで、簡単に集計が可能だ。その使い方を紹介しよう。
本Tech TIPSでは、東京都が公表している新型コロナ患者のデータを用いて説明する。このデータは、各患者の番号(No)、公表年月日、発症年月日、患者の年代、性別、職業などが一覧になったものだ。ここからは、患者が増えているのか減っているのか、年代別に感染傾向に違いがあるのか、感染に男女差はあるのか、といったことは簡単に分からない。
データを公表年月日で集計したり、さらに年代別や男女別で集計したりすることで、傾向などを分析してみることにする。なお、記事に利用したデータはオープンデータとして公開されており、「東京都_新型コロナウイルス陽性患者発表詳細(年別分割版_2022年)」でCSVファイルがダウンロード可能だ。
「データ分析」を使ってワンクリックで集計
公表年月日ごとに患者数を集計するには、COUNTIF関数を使って同じ日付を数えるという方法が考えられる。
ただ、これを年代別や男女別に行っていくとなると、少々面倒に感じるのではないだろか。
Microsoft 365版のExcel(Excel 365)を利用しているのであれば、[ホーム]タブにある「データ分析」(以前は「アイデア」という機能名だった)を利用することで、ワンクリックで集計が行える。
ただし、「データ分析」はデータの数が多いと集計に時間がかかる上、場合によってはエラーとなって集計が行えない場合がある点に注意してほしい。また、想定した結果にならないこともあるので、データの数を絞って実行するのがよい。
データの絞り込みは「フィルター」よりも「スライサー」が便利
データの数を絞り込む際、列を選択し、[データ]タブの[フィルター]を実行して特定の値のみにしてから集計しているのではないだろうか。上述の「データ分析」を行う場合でも、データ数が多いと分析が行えないので、絞り込みを行うとよい。
ただ、幾つかの値で絞り込むであれば、「フィルター」よりも「スライサー」を使った方が便利だ。特に複数の列の値を組み合わせて絞り込みを行う場合は、「スライサー」で該当する値を選択すればいいので楽である。
「スライサー」を有効にするには、データを「テーブル」に変換しておく必要がある。テーブルに設定したい列を選択し、[ホーム]タブの[テーブルとして書式設定]をクリックし、適当な「テーブルスタイル」を選ぶ(選択する列は連続している必要がある)。[テーブルに変換するデータ範囲を選択してください]ダイアログが表示されるので、テーブル範囲を確認し、[OK]ボタンをクリックする。
Copyright© Digital Advantage Corp. All Rights Reserved.