S80の統計備忘録

頑張って統計の勉強をしています。

【確率分布】負の2項分布の確率関数、確率母関数、期待値、分散

今回は負の2項分布です。負の二項係数や項別微分がやや複雑だなと思いましたが、納得できるとすっきりします。

目次です。

負の2項分布とは

成功確率を pとした時の、 r回成功するまでの失敗回数 kについての確率分布です。

以下の資料を参考にしました。 https://www.slideshare.net/simizu706/ss-50994149?from_m_app=ios

なぜこんな確率分布を考える必要があるのか、今時点ではよく分かっていません。勉強したいと思います。

コイン投げのケースで考えると、負の2項分布の考え方は概ね以下の手順となります。

  •  r回目の表が出るまでに、 k回の裏が出ると考える。
  •  r回目の表が出た時には、  r回の表と  k回目の裏で、合計  r+k回、コインを投げたことになる。
  •  r+k-1回目まで、つまり最の  rが出る直前までに裏は  k回、  r+k回目に最後の rが出る。

確率関数

上記より、負の2項分布の確率関数は  r+k-1回までで裏が  k回出る確率と  r+k回目の表の確率  pの積で求められるため、以下のように表現できます。

2項分布に式の形が似ています(当然ですが)。

2項分布はこちらで過去に紹介しましたので、良ければご覧ください。

 \begin{eqnarray}
P(X = k) &=& {}_{n + k - 1} C_k (1 - p)^k p^{r - 1} p\\
&=& {}_{n + k - 1} C_k (1 - p)^k p^r
\end{eqnarray}

ここで、上式の和が  1になることを確認し、確率を与えるものであることを確認しておきます。

 
0 < p < 1\\
q = 1 - p\\

として、 p^ {-r} = (1 - q)^{-r}テイラー展開すると、以下の結果が得られます。

 \begin{eqnarray}
(1 - q)^{-r} &=& 1 + rq + \frac{r(r + 1)}{2!}q^ 2 + \cdots\\
&=& \sum_{k = 0}^ \infty  {}_{r + k - 1} C_k q^k
\end{eqnarray}

上式の両辺に  p^ rを掛けると以下になり、確率関数の和が1になることを確認できます。

 \begin{eqnarray}
\sum_{k = 0}^ \infty  {}_{r + k - 1} C_k q^k p^r &=& (1 - q)^{-r} p^ r\\ &=& p^{-r} p^r \\&=&1
\end{eqnarray}

なおこの式はガンマ関数を用いれば、  r(r+1) \cdots (r+k-1) = \frac{\Gamma(r+k)}{\Gamma(r)}と書けます。なので、確率関数は以下のように表すこともできます。

 \begin{eqnarray}
P(X=k) &=& \frac{\Gamma(r+k)}{\Gamma(r) k!}(1-p)^k p^r
\end{eqnarray}

確率母関数

確率関数から、確率母関数を導出します。

負の2項定理について扱う必要がありますので、ここで確認しておきます。

 \begin{eqnarray}
\sum_{k = 0}^ \infty  {}_{r + k - 1} C_k q^k p^r
&=& \sum_{k = 0}^ \infty  {}_{-r} C_k (-q)^k p^r
\end{eqnarray}

上記の式変形を前提に確率母関数を導出します。

 \begin{eqnarray}
G(s) 
&=& E[s^ X]\\ 
&=& \sum_{k = 0}^ \infty s^k {}_{r + k -1} C_k p^r q^k\\
&=& \sum_{k = 0}^ \infty s^k {}_{-r} C_k p^r (-q)^k\\
&=& p^r \sum_{k = 0}^ \infty {}_{-r} C_k p^r (-sq)^k\\
&=& p^r (1 - sq)^{-r}\\
&=& (\frac{p}{1-sq})^r\\
&=& \bigl(1 - (s - 1) \frac{q}{p}\bigr)^{-r}
\end{eqnarray}

期待値

上記の確率母関数を1回微分することで期待値を求めます。

 \begin{eqnarray}
\frac{dG(s)}{ds} 
&=& E[X]\\ 
&=& (-r )(-\frac{q}{p}) \bigl(1 - (s-1)\frac{q}{p}\bigr)^{-r-1}\mid_{s = 1}\\
&=& \frac{r(1-p)}{p}
\end{eqnarray}

分散

続いて分散を求めるため、まずは確率母関数を2回微分します。

 \begin{eqnarray}
\frac{d^2 G(s)}{d^2 s} 
&=& E[X(X-1)]\\ 
&=& (-r-1)(\frac{rq}{p}) \bigl(1 - (s-1)\frac{q}{p}\bigr)^{-r-2}(-\frac{q}{p})\mid_{s = 1}\\
&=& \frac{r^2 q^2}{p^2} + \frac{r q^2}{p^2}
\end{eqnarray}

この式を用いて、以下の通り分散を求めることができます。

 \begin{eqnarray}
Var(X) &=& E[X(X-1)] + E[X] - (E[X])^2 \\
&=& \frac{r^2 q^2}{p^2} + \frac{r q^2}{p^2} + \frac{rq}{p} -  \frac{r^2 q^2}{p^2} \\
&=& \frac{r(1-p)}{p^2}
\end{eqnarray}

参考図書

いつものです。頑張っています。

新装改訂版 現代数理統計学

新装改訂版 現代数理統計学