음이항 분포
음이항 분포(negative binomial distribution)는 성공률이 \(p\)인 베르누이 시행을 반복할 때 \(r\)번째 성공이 나올 때까지 시행 중 실패의 수의 분포이다. 실패의 수를 확률변수 \(X\)라고 하면 pmf는
\[
f_X(x) = P(X=x) = \binom{r+x-1}{x}p^r(1-p)^{x}, \quad x=0,1,\cdots
\]
이다. 성공 \(r\)번, 실패 \(x\)번이므로 총 \(r+x\)번 시행하였고 마지막 시행이 성공일 때 실험이 끝나는 것으므로 가능한 조합의 수는 \(r+x-1\)개 중 \(x\)개를 고르는 수와 같다.
음이항 분포라는 이름이 붙은 이유
\(r>0\), \(0< p <1\), \(q=1-p\)이라고 하면 일반화된 이항정리에 따라
\[
1 = p^r p^{-r} = p^r(1-q)^{-r} = p^r\sum_{k=0}^\infty \binom{-r}{k}(-q)^k
\]
이 성립함을 알 수 있다. 여기에서
\[
p^{-r} = \sum_{k=0}^\infty (-1)^k \binom{-r}{k}q^k
= \sum_{k=0}^\infty (-1)^k \binom{-r}{k}(1-p)^k
\]
임을 알 수 있다. 여기에서 음이항 표기의 정의에 따르면
\[
(-1)^k\binom{-r}{k} = \binom{r+k-1}{k}
\]
이 성립함을 알고 있으므로
\[
p^{-r} = \sum_{k=0}^\infty \binom{r+k-1}{k}(1-p)^k
\]
라고 바꾸어 쓸 수 있다. 따라서
\[
\sum_{k=0}^\infty \binom{r+k-1}{k}(1-p)^k p^{r} = 1
\]
이 성립한다는 것을 알 수 있다. 따라서
\[
f(x) = \binom{r+x-1}{x} (1-p)^x p^r, \quad r \in\mathbb{Z},\, 0 < p < 1
\]
이 pdf(pmf)임을 알 수 있고 이것이 바로 음이항 분포의 pmf이다.
일반화된 이항정리
이항정리(Binomial Theorem)
\[
(x+y)^n = \sum_{k=0}^n \binom{n}{k} x^k y^{n-k}
\]
일반화된 이항정리 (Generaliazed Binomial Theorem)
\[
(1+
x)^{\alpha} = \sum_{k=0}^\infty \binom{\alpha}{k} x^k, \quad \alpha \in \mathbb{R}, -1 < x < 1
\]
이때
\[
\binom{\alpha}{k} = \frac{\alpha(\alpha-1)\cdots(\alpha-k+1)}{k!}
\]
로 정의한다. 이 식에서 \(\alpha\)가 자연수이면 이항정리와 동일하게 된다.
테일러 급수와 관계
실수 \(\alpha\)에 대해 함수 \( f(x)=(1+x)^\alpha,\; -1 < x < 1 \)의 \(x=0\)에서의 테일러 급수 전개를 하면
\[
(1+x)^\alpha = f(0) + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + \frac{f'''(0)}{3!}x^3 + \cdots
\]
인데, 이때 \(f(x)\)를 \(k\)번 미분한 \(f^{(k)}(x)\)는
\[
f^{(k)}(x) = \alpha(\alpha-1)\cdots(\alpha-k+1)(1+x)^{\alpha-k}
\]
가 된다. \(f(0)=1\)이고 \(f^{(k)}(0) = \alpha(\alpha-1)\cdots(\alpha-k+1)\)이다. 이것을 집어넣으면
\[
(1+x)^\alpha = 1 + \frac{\alpha}{1!}x + \frac{\alpha(\alpha-1)}{2!}x^2 + \frac{\alpha(\alpha-1)(\alpha-2)}{3!}x^3 + \cdots
= \sum_{k=0}^\infty \binom{\alpha}{k}x^k
\]
이다.
음이항
일반화된 이항정리의 특수한 경우의 하나로 음이항(negative binomial)을 생각할 수 있다.
실수 \(\alpha\) 대신 자연수 \(n\)으로 한정하면 음이항은
\[
\binom{-n}{k} = \frac{(-n)(-n-1)\cdots (-n-k_1)}{k!}
\]
으로 정의되고
\[
\frac{(-n)(-n-1)\cdots (-n-k+1)}{k!}
= (-1)^k \frac{n(n+1)\cdots (n+k-1)}{k!}
= (-1)^k\binom{n+k-1}{k}
\]
와 같은 등식이 성립한다.
감마함수를 이용한 표현
\(\alpha > 0 \)인 경우에
\[
(1-x)^\alpha = \sum_{k=0}^\infty \binom{-\alpha}{k}(-x)^k = \sum_{k=0}^\infty \binom{\alpha+k-1}{k}x^k = \sum_{k=0}^\infty = \frac{\Gamma(k+\alpha)}{k!\Gamma(\alpha)} x^k
\]
이 성립한다. 감마함수의 성질에 따라
\[
\Gamma(\alpha + k) = (\alpha+k-1) (\alpha+k-2) \cdots (\alpha+2)(\alpha+1)\alpha \Gamma(\alpha)
\]
이기 때문이다.
댓글 없음:
댓글 쓰기