【やさしいデータ分析】ベイズ統計入門～古典的な統計との違いと使い分け：やさしい推測統計（ベイズ統計編）

初歩から応用までステップアップしながら学んでいく『やさしいデータ分析』シリーズ第5弾がスタート。ベイズ統計を学ぶに当たって、知っておくべきキーワード、連載の予定を紹介します。データ分析を実践的に役立てるための基礎をしっかり学んでみませんか？

» 2026年05月20日 05時00分公開

[羽山博，著]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

連載目次

　データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載『社会人1年生から学ぶ、やさしいデータ分析』のシリーズとして、「記述統計と回帰分析編」「確率分布編」「推測統計（区間推定編）」「推測統計（仮説検定編）」に続いて、今回から「ベイズ統計」を開始します。2023年から始まった連載もおかげさまでいよいよ第5シーズン、完結編に突入です。

　近年、いわゆる頻度論による古典的な仮説検定に代わって、データ分析の世界でベイズ統計が本格的に利用されるようになってきました。この連載では、初めてベイズ統計に触れる方はもちろんですが、これまで仮説検定に慣れていた方にも分かりやすく、ベイズ統計の考え方や分析の手順を解説していきます。

　ここで、「仮説検定に慣れていた方」とわざわざ書いたのは、古典的な仮説検定の考え方に慣れていると、かえってベイズ統計が難しく感じられるからです。……というのは個人的な感想ではあるのですが、筆者自身、頻度論の考え方にどっぷり漬かっていたので、最初はかなり戸惑いました。しかし、手を動かしながら実際に試してみると、むしろ仮説検定よりも分かりやすく、しかも、柔軟で便利な道具だということに気が付きました。これまでの制約の多さから解き放たれた思いでした。

　今回は初回なので、ベイズ統計の考え方について、簡単な事例を見ながら、大きな流れを確認していきたいと思います。新しい用語や考え方が幾つも出てきますが、全てを理解しなくても大丈夫です。連載の中で登場するたびに、分かりやすく丁寧に説明します。今回は、これまでの仮説検定との違いや、ベイズ統計で何が分かるか、どんな手順で分析を進めるのか、といった大きな流れを捉えてください。

連載：

『社会人1年生から学ぶ、やさしい推測統計（ベイズ統計編）』

　この連載では、データをさまざまな角度から分析し、その背後にある有益な情報を取り出す方法を学ぶ『社会人1年生から学ぶ、やさしいデータ分析』シリーズの「記述統計と回帰分析編」「確率分布編」「推測統計（区間推定編・仮説検定編）」に続く「ベイズ統計編」です。

　これまでの推測統計を土台に、近年活用が広がっているベイズ統計の考え方と分析手順を、古典的な手法との違いを整理しながら解説します。初めての方でも無理なく理解できるよう具体例を通して進めるとともに、ベイズ的なアプローチの特徴やメリットを実感できる構成とし、「どのように考え、どう使い分けるのか」に重点を置いて解説していきます。

羽山博

筆者紹介： IT系ライターの傍ら、かつて、非常勤講師として東大で情報・プログラミング関連の授業を、一橋大でAI関連の授業を担当。まだ発展途上のようだが、生成AIへの質問と回答を分野ごとにまとめ、体系的に整理、補足しつつ、さらに個別の学びを促す記述を加えた資料を一貫して作成できるツールが実用レベルで本格的に使えるようになると、書籍の概念が変わるのではないかと思ったりしている。一斉授業だったものが、ユーザーに合った個別指導のできる書籍といったイメージ。そうなると、出版社のビジネスモデルも大きく変わり、私の仕事もなくなってしまいそうだけど、まあ、そのときは、縁側でお茶でもすすりながら、庭の景色を眺めて暮らすことにしようと思う。ウチには縁側も庭もないけど。

ベイズ統計とは～古典的な統計とベイズ統計の違い

　この「やさしいデータ分析」シリーズ全体の構成として、これまでの連載では図1のようなチャートを掲載していました。ベイズ統計編の位置付けも記してあります。

図1　この連載ではベイズ統計を取り扱う
白い字で書かれたものがこれまでの連載で学んできたもの。確率分布は推測統計の基礎となり、区間推定の考え方は仮説検定と密接に関連している。ベイズ統計は統計的推定と仮説検定とは別のものとして描かれているが、これはあくまで連載のシリーズとしての分け方によるもの（後述）。

　今回から始まるベイズ統計編で、この図が完成するわけですが、図1はあくまで、連載の各シリーズがどのように分けられているかという区別を反映したものなので、ベイズ統計がどのような目的のために使われるかを考えるに当たっては、誤解を招くかもしれません。図1をよく見てみると、統計的推定と仮説検定は「何をしたいか」という目的を表しているのに対して、ベイズ統計は手法を表しています。というわけで、推測統計の部分だけを取り出し、目的と手法を明確にしてみます（図2）。

図2　推測統計の目的と手法（古典的な手法とベイズ的な手法）
目的（やりたいこと）は母集団の平均などを点推定したり、区間推定すること、あるいは、平均の差を検定する、といったこと。そのために使う手法として、古典的（頻度論的）な手法とベイズ的な手法がある。

　そもそも、私たちがやりたいことは、大きく分けて以下の2つでした。

母数（パラメーター）の推定： 母集団の平均や分散などの母数を推定すること
仮説検定： モデルの選択

　これらをベイズ的な手法でやっていこうというわけです。つまり、「ベイズ統計」という全く別の分野がある、ということではなく、同じような目的に対して、これまで見てきた古典的な手法に代わるような、ベイズ的な手法がある、ということです。「ベイズ的な手法による推測統計」を略して、ベイズ統計と呼んでいる、と考えてもいいですね。

　ベイズ統計では、事前分布や事後分布、周辺尤度（ゆうど）、MCMC法、ベイズ因子など、あまりなじみのない用語や計算方法が登場するので、あたかもこれまでの統計学とは全く別の統計学というイメージを抱いてしまうという面もあります。そして、それがベイズ統計に対する心理的なハードルを上げる原因にもなっているものと思われます（実は、かつての筆者がそうでした）。

　しかし、目的はあくまで、母数の推定やモデルの選択など「私たちが知りたいことを知る」ということに他なりません。聞き慣れない用語や言い回し、なじみのない式などが登場しても、そこであまり悩まず、軽くスルーしてもらってけっこうです。完全に理解してから先に進もうとすると、いつまでたっても先に進めないという悲劇を招くことがあります。事例などを見ているうちに、少しずつ理解できるようになります。ぜひ、気楽に読み進めてください。

　なお、古典的な手法で、仮説検定をモデルの選択と言ってしまうと語弊があるのですが、ベイズ的な手法ではモデルの選択と言っても違和感はありません。が、そもそも「モデルの選択」ってどういうこと？　と思われますよね。それについては、追々お話ししていくので、今はあまり気にしないでください。要するに、ベイズ的な手法でも、母数の推定や仮説検定と同じようなこと（のみならず、さらに便利なこと）ができる、というわけです。

具体例で見る古典的な統計とベイズ統計の違い

　では、古典的な手法とベイズ的な手法ではどのような違いがあるのでしょうか。古典的な手法に代えて、ベイズ的な手法を使う理由はどのようなものなのでしょうか。

　これについては、実例を見ないと実感が湧かない部分もあります。そこで、古典的な手法では母数が決まった値（定数）であると考えるが、ベイズ的な手法では母数を変数と考えるという一点を押さえておいた上で、簡単な例を基に、それらの違いを見ていきましょう。まずは、図3の事例を見てください。

図3　クーポンの当選確率はホントに2分の1なのか？
店員は、スマホで買い物をすると1/2の確率でクーポンが当たると言っているが、実際に30回買い物をした結果、23回アタリで、7回ハズレだった。どうやら、ホントの確率は1/2（＝2分の1）ではなさそうなので、それを検証したい。

　某喫茶店に行くと、メニューの見本よりも実際の品の方がとてつもなく大きく、「これは逆詐欺だ」という、うれしい悲鳴をよく聞きます。図3の例も、公表されている確率よりも、実際の当選確率を高くして、お客様に喜んでもらおうという戦略なのかもしれません。まずは、この事例を基に、上で触れた私たちの「やりたいこと」を確認しておきましょう。

推定： ホントの当選確率θはどれぐらいなのか？
検定： 当選確率θは1/2（＝2分の1）と等しいのか？

ということでしたね。このように、確率θで目的の事象が起こる（成功する）場合、n回の試行でk成功する確率は、二項分布に従います（確率分布編の第2回でお話ししました）。

　というわけで、二項分布の成功確率θを推定する方法について、古典的な手法とベイズ的な手法の違いを見てみましょう。なお、確率は一般にpやPなどの文字で表すことがよくありますが、ここでは分布の母数であることを強調するために、母数を表すために使われるθという文字を使います。

推定：古典的な手法とベイズ的な手法の違い

　推定には、母平均の推定値などを1つの値で表す「点推定」と、ある範囲で表す「区間推定」があります。ここでは区間推定の例で、古典的な推定とベイズ的な推定の違いを見てみましょう。といっても、具体的に計算するのではなく、考え方の違いを見ます。古典的な手法での区間推定では信頼区間を求めましたが、ベイズ統計では、それに対応するものを信用区間または確信区間と呼びます。後の図4とも併せて見てください。

古典的な手法： θは定数であるものと考える。
- 試行回数nの試行を行って、成功回数kを求め、信頼区間を計算する
- それを何度も繰り返すと、全体の95％の回で信頼区間の中にθが入っている
- つまり、θは動かないが、信頼区間は毎回異なる
- n＝30,k＝23の場合の[0.577, 0.901]は、そのような考え方で求めた信頼区間の一つ
ベイズ的な手法： θは変数であるものと考える。
- 買い物をする前：（2回に1回当たるとは言われているが）まだ確信がないので、ここでは、θは0～1の範囲のどの値も同じぐらい起こりやすいと考えることにする（この場合、事前分布は一様分布となるが、事前にθの値について、より確信の持てる別の分布が考えられるなら、その分布を使ってもよい。例えば、店員の発言にある程度の信ぴょう性があるのなら、θ＝1／2あたりに山のあるα＝2、β＝2のベータ分布とするなど）
- 買い物をした後：アタリが23回、ハズレが7回だったという情報を基に事前分布を事後分布に更新し（後で見るように、θの分布は0.75～0.8ぐらいに山のある分布になる）、θの信用区間を求める
- θは95％の確率で信用区間[0.580,0.881]に入っている

　「事前分布」「事後分布」という用語にとまどう方もおられると思いますが、これは、私たちが日常でごく普通にやっていることと同じです。関西人あるあるですが「これまでは納豆なんて臭くて食べられないと思っていたが（事前分布）、最近の納豆を実際に食べてみると（データの観測）、全然臭くなかった（事後分布）」といった話と同じです。

　図にしてみると、以下のような違いになります（図4）。図中の数値は実際に計算した結果ですが、先ほども触れたように、今回は計算の方法については触れないことにします（早く知りたいとウズウズしている方もいらっしゃると思いますが、ゆっくり進めます）。

図4　ホントの当選確率はどれぐらい？
古典的な手法では、信頼区間を何回も求める（横方向のブルーの棒やオレンジの棒が毎回求めた信頼区間の範囲）と、そのうちの（例えば）95％の回に、母数が信頼区間に含まれる、と考える。n＝30, k＝23というのは、そのような試行の1つ。［0.577, 0.901］という範囲の中にθの値が95％の確率で含まれているというわけではない。
一方、ベイズ的な手法では、事前分布を、観測されたデータを基に更新し、事後分布とする。そして、それを基に信用区間を求める。横軸はθの値なので、θは95％の確率で信用区間の中にある、と素直に解釈できる。

　古典的な手法では、母数θは定数なので動きません。実際にはその値は分かりませんが、図4の左のグラフで決まった位置にθがありますね。

　一方、ベイズ的な手法では、母数θは変数です。従って、図4の右のグラフでは横軸がθの取り得る値です。そのため、古典的な手法では信頼区間の解釈が難しいのに対して、ベイズ的な手法では、信用区間は直感的に「母数が95％の確率で信用区間の中に入っている」と解釈できます。

　なお、図4のグラフとこの後で登場する図5のグラフを作成するためのプログラムはこちらに置いてあります。今回は解説しませんが、興味のある方はご参照ください。リンクを開くとPythonのプログラムが表示されるので、コードセルをクリックし、［Shift］＋［Enter］キーを押してプログラムを実行すると、グラフや計算結果が表示されます。

　蛇足ながら、古典的な手法では、二項分布の信頼区間を正規近似またはクロッパー・ピアソン法（Clopper-Pearson法）で求めます。上で示した値はクロッパー・ピアソン法によるものです。Excelであれば「=BETA.INV(0.025, k, n-k+1)」で下限の値が、「=BETA.INV(0.975, k+1, n-k)」で上限の値が求められます。

　一方、ベイズ的な手法の場合は、事後分布がα＝1＋k, β＝1＋n－kのベータ分布となるので、下限の値が「=BETA.INV(0.025, α, β)」、上限の値が「=BETA.INV(0.025, α, β)」で求められます。nに30、kに23という値を当てはめれば（α＝24, β＝8です）、実際に計算できます。なぜそのような計算になるのかは、また改めて。

　ベイズ的な手法では、図4のグラフの横軸がθの値であることに注目してください。θは定数ではなく、変数なので、0～1の範囲を「動く」ということです。ここで、θがクーポンの当選確率だったことを思い出してください。「確率」ということは、取り得る値は0～1の範囲です。ベイズ的な手法のグラフを見ると、ちゃんと横軸の範囲が0～1になっていますね。そして、θという母数がどのような値を取るかが、確率的に分布するというわけです。上の注釈でもさりげなく登場していますが、ベータ分布は、台（変数の取り得る値の範囲）が0～1なので、確率θの分布を表すのにうってつけだというわけです。なお、ベータ分布については、確率分布編の第13回でお話ししました。

　母数θが変数であり、その確率分布が求められたので、例えばθが0.5以下である確率、なども求められます（ベータ分布で、0.5までの累積分布関数の値を求めればいいですね。Excelであれば「=BETA.DIST(0.5, α, β,TRUE)」で求められます。α＝24, β＝8なので、答えは0.0017です。確率はかなり小さいですね）。このように、素直に確率で表せることがベイズ統計の大きなメリットです。

検定：古典的な手法とベイズ的な手法の違い

　私たちがやりたいことのもう一つは検定でした。この例であれば、当選確率θは1/2と等しいのか、ということです。帰無仮説H₀と対立仮説H₁は以下のようになります。

H₀： θ ＝ 1/2
H₁： θ ≠ 1/2

　これについても、古典的な手法とベイズ的な手法の考え方を比較しておきましょう（ここでは計算結果だけを示します。詳細な計算方法については、次回以降ということにします）。

　ベイズ的な手法では、対立仮説H₁は、正確には「θはパラメーターα,βのベータ分布に従う」なのですが、ここでは古典的な手法に合わせて簡略化した書き方にしています。

古典的な手法：
- θ＝1/2の二項分布で、n＝30回の試行でk＝23回以上当選する累積確率を求める
- 累積確率は0.0026となる。ただし、この例は両側検定なので、2倍してp＝0.0052<0.01となる。帰無仮説H₀を棄却し、対立仮説H₁を採用する（θは1/2とは異なるという結論になる）
ベイズ的な手法：
- 前述したように、事前分布を一様分布とする（実際はα＝1, β＝1のベータ分布）
- 事後分布は（実際に計算すると）、α＝1＋k, β＝1＋n－kのベータ分布となる
- ベイズ因子BF₁₀を求める。これは、H₁の方がH₀よりも、観測されたデータをどの程度よく説明できるかという値。この例では、BF₁₀＝17.014となり、Jeffreysの評価尺度と呼ばれる目安（次回お話しします）では「H₁を支持する強い証拠」となっている

　この違いについて、図でイメージをつかみましょう（図5）。

図5　当選確率が2分の1と等しいかどうかを検定する
古典的な手法では、θ＝1/2と仮定した場合に、k＝23以上の値がどの程度現れるかを求める。その確率が小さければ、θ＝1/2という仮定が間違っていることになる。ベイズ的な手法では、仮説の「尤もらしさ（もっともらしさ）」を比較する。この図はSavage-Dickey法と呼ばれる方法によって求めたベイズ因子を可視化したもの。ベイズ因子は、対立仮説と帰無仮説の尤もらしさの比を表す係数のようなもの。

　今は細かい数値などを気にする必要はありません。ここで注目すべきことは、古典的な手法では、帰無仮説が棄却できないとき、帰無仮説をどの程度支持するかということについては何も言えないということです。

　一方のベイズ的な手法では、帰無仮説をどの程度支持するかということも表現できます。上の例で示したベイズ因子BF₁₀は対立仮説を（帰無仮説と比較して）どの程度支持するかということを表していますが、その逆数BF₀₁＝1/BF₁₀を求めれば、帰無仮説がどの程度支持されるかを表せます（この例では、対立仮説の1/BF₁₀＝1/17.014＝0.059倍支持される＝つまり、支持されないとなる）。このこともベイズ統計の大きなメリットです。

　ベイズ因子（ベイズファクターとも呼ばれます）は、事前分布と事後分布の周辺尤度の比で求められます（ただし、図5の右側はそれを可視化したものではありません）。Savage-Dickey法を使うと、（幾つか制約はありますが）周辺尤度が求められない場合でも、ある点（例えばθ＝0.5）での、事前分布の確率密度関数の値÷事後分布の確率密度関数の値でベイズ因子の値を求めることができます。それについては、また回を改めて少しずつ解説します。

まとめ：古典的な手法のデメリットとベイズ的な手法のメリット

　ここまで、簡単な推定と検定の例で、古典的な手法とベイズ的な手法を比較しましたが、いかがでしょう。古典的な手法で「雁字搦め（がんじがらめ）」になっていた経験を持つ方は、ちょっとワクワクしてきませんか。それらも含めて、ベイズ的な手法のメリットを表にまとめておきます。ただ、以下の表1の意味については、連載を読み進めていくうちに少しずつ理解が深まると思うので、今は、ざっと眺めておくだけで構いません。


	古典的な手法のデメリット	ベイズ的な手法のメリット
	信頼区間の解釈が難しい	信用区間が直感的に解釈できる（母数がその範囲に入る確率であると素直に解釈できる）
	p値による二分法的な判断に陥りやすい	確率が直感的に解釈でき、証拠の強さを連続的に（どの程度なのかと）評価ができる
	サンプルサイズに強く依存する（サンプルサイズが大きいと実質的に意味のない差でも有意になりやすい）	サンプルサイズが大きくなると推定の精度が上がる（差がどの程度であるかを直接評価できる）
	（有意にするために）後からデータを追加するのは御法度	データが追加されれば推定の精度が上がる

表1　古典的な手法のデメリットとベイズ的な手法のメリット
大まかに捉えると、古典的な手法は手続き上の前提条件を整えるのに手間がかかり、結果の解釈も慎重に行う必要があるということ。
一方、ベイズ的な手法では、モデルを適切に選択すれば、直感的に解釈しやすい結果が得られる。他にも幾つかのポイントが挙げられるが、具体的なお話をする前に、概念的な話ばかりになっても実感が湧かないので、この程度にとどめておく。

　表の1行目は上の「推定」の例で触れた話ですね。また、表の2行目は「検定」の例で触れたことです。古典的な手法では、帰無仮説は棄却できるか、できないか、ということしかいえません。また、帰無仮説が棄却できない場合でも、帰無仮説が支持されるとはいえません。しかし、そのことを、帰無仮説が支持されたものと誤って解釈する危険があります。それに対して、ベイズ的な手法では、帰無仮説や対立仮説がどの程度支持されるかといった証拠の強さが評価できます。

　3行目と4行目については、この連載の仮説検定編で幾度となく登場した仮説検定の面倒くさいところです。そのあたりもベイズ統計ではかなりスッキリします。

　もちろん、ベイズ的な手法にも、モデルが複雑になると処理に時間がかかる、事前分布の選択によって結果が異なる、Excelなどで手軽に計算できない（プログラムを書かないといけない）、といったデメリットはあります。しかし、高速に結果を得るためのモデルの選択方法（共役事前分布の利用など）や計算方法（Savege-Dickey法など）、事前分布の選択による頑健性のチェック（感度分析など）により、そういった問題に対処することができます。また、GUIに対応したベイズ統計のためのソフトウェア（JASPなど、便利過ぎて鼻血が出そうなくらいです）も登場しており、プログラミングの知識が全くなくてもベイズ統計が利用できる環境が整ってきています。

　……が、これらの話や、ここで登場した用語については今のところはあまり気にしないでください。やはり、連載の中で少しずつ解説するので、楽しみにしていてください。

連載の予定

　さて、今回の締めくくりと次回以降の展望です。この連載では、おおむね表2のようにお話を進めていくつもりです。話の流れによっては内容や事例などを変更することがあるかもしれませんが、それについてはご容赦ください。


回	テーマ	主な内容
1（今回）	推測統計（ベイズ統計編）の連載開始！	ベイズ統計のメリット、ベイズ推定やベイズ検定とは、ベイズ推定の進め方
2	ベイズ二項検定の考え方と手順	背中をさするなどのケアは癒やしに役立つのか？
3	平均と標準偏差のベイズ推定／検定	シュークリームの重さを検証するには？
4	ベイズ統計による将来の予測	規格外製品の廃棄コストはどれぐらい？
5（番外編）	ベイズ統計を簡単に行うGUIのアプリ	統計ソフトウェアJASPの紹介
6	独立した平均の差のベイズt検定	運動部と非運動部の体力差はあるのか？
7	対応のある平均の差のベイズt検定	ホラー映画を観ると握力は上がるのか？
8	相関係数のベイズ検定	年齢と原付事故の死傷者数の関係は？
9	独立性のベイズχ²検定	雨男や雨女は本当に存在するのか？
10（番外編）	PyMC早わかり	おさらいをかねてPyMCの基本的な使い方をまとめる
11	ベイズ回帰分析による回帰式の適合性	さまざまな指標から株価はどれぐらい予測できるか？
12	ベイズ回帰分析による回帰式の選択と予測	株価を予測するにはどの指標を使えばいいのか？
13	ベイズ分散分析による平均の差の検定（一元配置）	人は他者の意見にどれぐらい引きずられるか？
14	ベイズ分散分析による主効果と交互作用（二元配置）	他者の意見と自分の知識は判断にどう影響するか？

表2　連載の内容（予定）
内容や事例については、都合によって変更することがあるかもしれないが、取り上げるベイズ統計の手法については、おおむね、この表の流れにそって見ていくこととする。手法については、一度に全てを解説せず、単純なものから始めて、回を重ねるごとに少しずつ詳細なものを追加していくことにする。

　今回は、古典的な手法とベイズ的な手法の違い、ベイズ推定とベイズ検定の概要などについて、おおまかな流れをお話ししました。次回から本格的にベイズ統計に取り組みます。といっても、無理なくステップアップできるように、単純なものが少しずつ積み上げていくつもりです。

　次回は、「背中をさするなどのケアは癒やしに役立つのか？」と題して、成功確率のベイズ推定とベイズ二項検定を行います。つまり、今回、例として取り上げた二項分布の母数を推定する具体的な手順の解説となります。どうぞ、お楽しみに！

「やさしい推測統計（ベイズ統計編）」