学習メモ(主に統計学)

学習したことのメモを記載しています。

【統計学】負の二項分布の期待値と分散

統計学を学習していて色々な確率分布の期待値、分散を導出したので備忘録として記載していきます。

誤りがあればお知らせいただけると助かります。

 

・負の二項分布

成功確率 pのベルヌーイ試行について、 r回成功するまでに要した失敗回数 Xの確率分布が負の二項分布になります。

合計 r+x回の試行のうち、成功が r回で失敗が x回とする。最後は成功で終わるので r+x-1回中 x回の失敗を取り出せばよい。

よって、確率関数 P

  P = {}_{r+x-1} \mathrm{C}_x p^r q^x \quad (x = 0,1,2,...,) \tag{1} 

となる。 1-p=qと置いています。

 

 Pが確率関数であることを確かめる

まず f(q) = \dfrac{1}{1-q}マクローリン展開を考えます。

マクローリン展開の定義式は以下です。

\begin{align}
f(q) &= \sum_{x=0}^{\infty} f^{(x)}(0) \dfrac{q^x}{x!}  \tag{2}\\
\end{align}

 

 f(q)の両辺を q微分していくと、

\begin{align}
f^{\prime}(q) &= \dfrac{1}{(1-q)^2} \\
\end{align}

\begin{align}
f^{\prime\prime}(q) &= \dfrac{2}{(1-q)^3} \\
\end{align}

\begin{align}
f^{\prime\prime\prime}(q) &= \dfrac{6}{(1-q)^4} \\ \vdots
\end{align}

となるので、それぞれ q=0を代入すると (2)式は

\begin{align}
f(q) &= f(0) + f^{\prime}(0)\dfrac{q^1}{1!} + f^{\prime\prime}(0)\dfrac{q^2}{2!} + f^{\prime\prime\prime}(0)\dfrac{q^3}{3!} + \cdots \\ &= 1 + q + q^2 + q^3 + \cdots \\ &=\sum_{x=0}^{\infty}q^x\\
\end{align}

よって、

\begin{align}
\dfrac{1}{1-q} &=\sum_{x=0}^{\infty}q^x \tag{3} \\
\end{align}

と書ける。

 (3)式を両辺 q微分する。

\begin{align}
\dfrac{1}{(1-q)^2} &=\sum_{x=0}^{\infty} xq^{x-1} \\ &= \sum_{x=1}^{\infty} xq^{x-1} \\ &=\sum_{x=0}^{\infty} (x+1)q^{x} \\
\end{align}

※後のことを考えて q^xの形にしておく。

もう一回両辺 q微分する。

\begin{align}
\dfrac{2}{(1-q)^3} &=\sum_{x=0}^{\infty} (x+1)\cdot xq^{x-1} \\ &= \sum_{x=1}^{\infty} x(x+1)q^{x-1} \\ &=\sum_{x=0}^{\infty} (x+2)(x+1)q^{x} \\
\end{align}

よって、左辺をあえて書き換えると

\begin{align}
\dfrac{2!}{(1-q)^{(2+1)}} &=\sum_{x=0}^{\infty} (x+2)(x+1)q^{x} \\
\end{align}

となる。

更にもう一回両辺 q微分すると、(途中式は省略)

\begin{align}
\dfrac{6}{(1-q)^4} &=\sum_{x=0}^{\infty} (x+3)(x+2)(x+1)q^{x} \\
\end{align}

となる。

これも左辺を書き換えると

\begin{align}
\dfrac{3!}{(1-q)^{3+1}} &=\sum_{x=0}^{\infty} (x+3)(x+2)(x+1)q^{x} \\
\end{align}

となる。

よって、両辺を q微分し続けると、r-1回微分したときは以下のようになる。

\begin{align}
\dfrac{(r-1)!}{(1-q)^{(r-1)+1}} &=\sum_{x=0}^{\infty} (x+r-1) \cdots (x+1)q^{x} \\ 
\end{align}

左辺を1にするために整理すると、

\begin{align}
1 &=\sum_{x=0}^{\infty}\dfrac{(x+r-1) \cdots (x+1)}{(r-1)!} (1-q)^r q^{x} \\ &= \sum_{x=0}^{\infty}\dfrac{(x+r-1) \cdots (x+1) \cdot x \cdot (x-1) \cdot (x-2) \cdots}{x \cdot (x-1) \cdot (x-2) \cdots (r-1)!} p^r q^{x} \\ &= \sum_{x=0}^{\infty}\dfrac{(x+r-1)!}{x! (r-1)!} p^r q^{x} \\ &= \sum_{x=0}^{\infty} {}_{r+x-1} \mathrm{C}_x p^r q^x \\ &= \sum_{x=0}^{\infty} P \\
\end{align}

となるので、 Pは確率関数である。

※2行目から 1-q = pと置いています。

 

期待値  E[X]

確率母関数  G(s) を使って計算します。

 X:確率変数。その実現値  x は整数  x=0,1,2...とします。

 p(x) X=xとなる確率 P(X=x)

とします。

\begin{align}
G(s) &= E[s^X] \\
          &= \sum_{x=0}^{\infty} s^x p(x) \\ &= \sum_{x=0}^{\infty} s^{x} {}_{r+x-1} \mathrm{C}_x p^r q^x \\ &= \sum_{x=0}^{\infty} {}_{r+x-1} \mathrm{C}_x p^r (sq)^{x}
 \\ &= \dfrac{p^r}{(1-sq)^r} \sum_{x=0}^{\infty} {}_{r+x-1} \mathrm{C}_x (1-sq)^r (sq)^x \\ \end{align}

 1-sq = p_a sq = 1-p_a = q_aとおくと、右辺の和記号の中身は負の二項分布の確率関数となり、その和は1になるので

\begin{align}
G(s) &= \dfrac{p^r}{(1-sq)^r}  \\ \tag{4} \end{align}

となる。

両辺を s微分すると、

\begin{align}
G^{\prime}(s) &= \dfrac{p^r \cdot r(1-sq)^{r-1} \cdot q}{(1-sq)^{2r}} \\ &= \dfrac{rqp^r}{(1-sq)^{r+1}} \\ \end{align}

となるので、期待値は s=1 を代入して、

\begin{align}
E[X] &= G^{\prime}(1)\\ &= \dfrac{rqp^r}{(1-q)^{r+1}} \\ &= \dfrac{rqp^r}{p^{r+1}} \\ &= \dfrac{rq}{p} \\
\end{align}

となる。

 

分散  V[X]

まず、 (4)式の両辺を sで二階微分すると、

\begin{align}
G^{\prime\prime}(s) &= \dfrac{rqp^r \cdot (r+1)(1-qs)^r \cdot q}{(1-sq)^{2(r+1)}} \\ &= \dfrac{r(r+1)q^2p^r}{(1-qs)^{r+2}}
\end{align}

となるので、

\begin{align}
E[X(X-1)] &= G^{\prime\prime}(1) \\ &= \dfrac{r(r+1)q^2p^r}{(1-q)^{r+2}} \\ &= \dfrac{r(r+1)q^2p^r}{(p^{r+2}} \\ &= \dfrac{r(r+1)q^2}{p^2}
\end{align}

となる。

よって、分散 V[X]

\begin{align}
V[X] &= E[X(X-1)] + E[X]- {(E[X])}^2 \\
          &=  \dfrac{r(r+1)q^2}{p^2} + \dfrac{rq}{p} - \dfrac{r^2q^2}{p^2} \\
          &= \dfrac{r^2q^2+rq^2+rpq-r^2q^2}{p^2} \\
          &= \dfrac{rq(p+q)}{p^2} \\
          &= \dfrac{rq}{p^2} \\
\end{align}

となる。

 

参考文献: