블로그 보관함

2011년 4월 8일 금요일

음이항 분포

음이항 분포

음이항 분포(negative binomial distribution)는 성공률이 \(p\)인 베르누이 시행을 반복할 때 \(r\)번째 성공이 나올 때까지 시행 중 실패의 수의 분포이다. 실패의 수를 확률변수 \(X\)라고 하면 pmf는 \[ f_X(x) = P(X=x) = \binom{r+x-1}{x}p^r(1-p)^{x}, \quad x=0,1,\cdots \] 이다. 성공 \(r\)번, 실패 \(x\)번이므로 총 \(r+x\)번 시행하였고 마지막 시행이 성공일 때 실험이 끝나는 것으므로 가능한 조합의 수는 \(r+x-1\)개 중 \(x\)개를 고르는 수와 같다.

음이항 분포라는 이름이 붙은 이유

\(r>0\), \(0< p <1\), \(q=1-p\)이라고 하면 일반화된 이항정리에 따라 \[ 1 = p^r p^{-r} = p^r(1-q)^{-r} = p^r\sum_{k=0}^\infty \binom{-r}{k}(-q)^k \] 이 성립함을 알 수 있다. 여기에서 \[ p^{-r} = \sum_{k=0}^\infty (-1)^k \binom{-r}{k}q^k = \sum_{k=0}^\infty (-1)^k \binom{-r}{k}(1-p)^k \] 임을 알 수 있다. 여기에서 음이항 표기의 정의에 따르면 \[ (-1)^k\binom{-r}{k} = \binom{r+k-1}{k} \] 이 성립함을 알고 있으므로 \[ p^{-r} = \sum_{k=0}^\infty \binom{r+k-1}{k}(1-p)^k \] 라고 바꾸어 쓸 수 있다. 따라서 \[ \sum_{k=0}^\infty \binom{r+k-1}{k}(1-p)^k p^{r} = 1 \] 이 성립한다는 것을 알 수 있다. 따라서 \[ f(x) = \binom{r+x-1}{x} (1-p)^x p^r, \quad r \in\mathbb{Z},\, 0 < p < 1 \] 이 pdf(pmf)임을 알 수 있고 이것이 바로 음이항 분포의 pmf이다.

일반화된 이항정리

이항정리(Binomial Theorem) \[ (x+y)^n = \sum_{k=0}^n \binom{n}{k} x^k y^{n-k} \]
일반화된 이항정리 (Generaliazed Binomial Theorem) \[ (1+ x)^{\alpha} = \sum_{k=0}^\infty \binom{\alpha}{k} x^k, \quad \alpha \in \mathbb{R}, -1 < x < 1 \] 이때 \[ \binom{\alpha}{k} = \frac{\alpha(\alpha-1)\cdots(\alpha-k+1)}{k!} \] 로 정의한다. 이 식에서 \(\alpha\)가 자연수이면 이항정리와 동일하게 된다.

테일러 급수와 관계

실수 \(\alpha\)에 대해 함수 \( f(x)=(1+x)^\alpha,\; -1 < x < 1 \)의 \(x=0\)에서의 테일러 급수 전개를 하면 \[ (1+x)^\alpha = f(0) + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + \frac{f'''(0)}{3!}x^3 + \cdots \] 인데, 이때 \(f(x)\)를 \(k\)번 미분한 \(f^{(k)}(x)\)는 \[ f^{(k)}(x) = \alpha(\alpha-1)\cdots(\alpha-k+1)(1+x)^{\alpha-k} \] 가 된다. \(f(0)=1\)이고 \(f^{(k)}(0) = \alpha(\alpha-1)\cdots(\alpha-k+1)\)이다. 이것을 집어넣으면 \[ (1+x)^\alpha = 1 + \frac{\alpha}{1!}x + \frac{\alpha(\alpha-1)}{2!}x^2 + \frac{\alpha(\alpha-1)(\alpha-2)}{3!}x^3 + \cdots = \sum_{k=0}^\infty \binom{\alpha}{k}x^k \] 이다.

음이항

일반화된 이항정리의 특수한 경우의 하나로 음이항(negative binomial)을 생각할 수 있다. 실수 \(\alpha\) 대신 자연수 \(n\)으로 한정하면 음이항은 \[ \binom{-n}{k} = \frac{(-n)(-n-1)\cdots (-n-k_1)}{k!} \] 으로 정의되고 \[ \frac{(-n)(-n-1)\cdots (-n-k+1)}{k!} = (-1)^k \frac{n(n+1)\cdots (n+k-1)}{k!} = (-1)^k\binom{n+k-1}{k} \] 와 같은 등식이 성립한다.

감마함수를 이용한 표현

\(\alpha > 0 \)인 경우에 \[ (1-x)^\alpha = \sum_{k=0}^\infty \binom{-\alpha}{k}(-x)^k = \sum_{k=0}^\infty \binom{\alpha+k-1}{k}x^k = \sum_{k=0}^\infty = \frac{\Gamma(k+\alpha)}{k!\Gamma(\alpha)} x^k \] 이 성립한다. 감마함수의 성질에 따라 \[ \Gamma(\alpha + k) = (\alpha+k-1) (\alpha+k-2) \cdots (\alpha+2)(\alpha+1)\alpha \Gamma(\alpha) \] 이기 때문이다.

댓글 없음:

댓글 쓰기