전체 글 (14) 썸네일형 리스트형 [일반통계학] 14. 큰 수의 법칙과 중심극한정리 확률부등식 1. (마르코프 부등식) 확률변수 $X$와 함수 $u(x) \ge 0$에 대해 기댓값 $\mathbb{E}[u(X)]$가 존재할 때, 임의의 상수 $c >0$에 대해 다음이 성립한다. $$ P[u(X) \ge c] \le \frac{\mathbb{E}[u(X)]}{c}$$ 이를 마르코프 부등식(Markov's inequality)이라고 한다. (증명) $A = \{x: u(x) \ge c \}$라 두자. $X$의 확률밀도함수를 $f(x)$라 하면 $$\begin{align} \mathbb{E}[u(X)] &= \int_{-\infty}^{\infty} u(x)f(x)\ dx \\ &= \int_{A} u(x)f(x)\ dx + \int_{A^c} u(x)f(x)\ dx \\ &\ge \int_.. [일반통계학] 13. 확률변수의 수렴 확률수렴과 분포수렴 1. 실수열 $a_n$이 $a \in \mathbb{R}$로 수렴한다는 것은 어떠한 $\epsilon >0$을 생각하더라도 그에 따른 적절한 $N(\epsilon) \in \mathbb{N}$이 존재하여 그보다 큰 $n$에 대해서는 $a_n$과 $a$ 사이의 거리가 $\epsilon$보다 작아진다는 것이다. 즉, $$ \forall \epsilon >0,\ \exists N(\epsilon) \in \mathbb{N}\ \text{such that} \\n > N \implies \vert a_n - a \vert < \epsilon$$일 때 $$\lim_{n \to \infty} a_n = a$$로 표기한다. 2. 그러나 확률변수의 열 $X_n$에서는 위와 같이 수렴을 정의하는 것이.. [일반통계학] 12. 표본분포 랜덤표본과 통계량 1. 유한모집단에서의 랜덤표본(random sample)이란 단순랜덤비복원추출을 통해 얻은 표본을 말한다. 일반적으로 비복원추출의 결과는 서로 종속적이나, 초기하분포의 이항근사에서 알 수 있듯이 모집단의 크기가 충분히 클 경우 이러한 종속성이 희석되고 각각의 추출 결과가 서로 독립에 가깝게 된다. 이에 착안하여 무한모집단에서의 랜덤표본을 서로 독립이고 모집단과 동일한 분포를 따르는 확률변수들로 정의한다. 2. 모집단 분포에 대한 모형을 설정할 때 사용되는 매개변수, 즉 모집단 분포를 결정짓는 미지의 특성치를 모수(population parameter)라고 하며, 흔히 $\theta$로 나타낸다. 가능한 모수 전체의 집합을 모수공간(parameter space)이라고 하며 $\Omega$.. [일반통계학] 11. 확률변수의 함수의 분포 본 포스팅에서는 확률변수 $X$의 분포가 알려져 있을 때 확률변수 $Y=u(X)$의 분포를 구하는 방법에 대해 다룬다. 이산형 확률변수의 경우 1. 공정한 동전을 2회 던졌을 때 앞면이 나오는 횟수를 $X$라 하자. $X$의 확률밀도함수는 다음과 같다. $$f_X(x) = \begin{cases} \cfrac{1}{4}, & x = 0,2 \\ \cfrac{1}{2}, & x = 1 \end{cases}$$ 이로부터 $Y = (X-1)^2$의 확률밀도함수를 구해 보자. $Y$가 취할 수 있는 값은 $0$ 또는 $1$이고, 이에 대응하는 확률은 각각 $$\begin{align} P(Y=0) &= P(X=1) = \frac{1}{2} \\ P(Y=1) &= P(X=0) + P(X=2) = \frac{1}{2.. [일반통계학] 10. 야코비안 야코비안 1. 일급 다변수 벡터함수 $\mathbf{f}:D(\subset \mathbb{R}^n) \to \mathbb{R}^m$가 $\mathbf{x} = (x_1, \ x_2,\ \cdots, \ x_n) \in D$를 다음과 같이 변환시킨다고 하자. $$\begin{align} \mathbf{f}(\mathbf{x}) &= \left(f_1(\mathbf{x}),\ f_2(\mathbf{x}),\ \cdots, \ f_m(\mathbf{x}) \right) \\ &= (y_1, \ y_2, \ \cdots, \ y_m) = \mathbf{y} \in \mathbb{R}^m \end{align}$$ 이 때 아래의 $m \times n$ 행렬을 $\mathbf{f}$의 야코비 행렬(Jacobian m.. [일반통계학] 9. R을 이용한 분포의 계산 여러 가지 분포의 확률밀도함수, 적률생성함수, 기댓값 및 분산 Distribution PMF or PDF MGF Expectation Variance $\text{Bernoulli}(p)$ $\begin{gathered} f(x) = p^xq^{1-x} \\ x \in \{0, 1\} \end{gathered}$ $\begin{gathered} M(t)=pe^t + q \\ t \in \mathbb{R} \end{gathered}$ $p$ $pq$ $\text{B}(n, p)$ $\begin{gathered} f(x) = \frac{n!}{x!(n-x)!}p^{x}q^{n-x} \\ x \in \{0, 1, \cdots, n \}\end{gathered}$ $\begin{gathered} M(t) = (.. [일반통계학] 8. 정규분포 감마함수 양수 $\alpha$에 대하여 $$\Gamma(\alpha) = \int_{0}^{\infty} x^{\alpha -1}e^{-x}\ dx$$로 정의된 함수를 감마함수(gamma)함수라고 한다. 감마함수는 다음과 같은 성질을 가진다. $$\begin{align} \text{(1)}\ \ &\Gamma(n) = (n-1)!\ \ \text{for}\ \ n \in \mathbb{N} \\ \text{(2)}\ \ &\Gamma(\alpha+1) = \alpha\Gamma(\alpha)\\ \text{(3)}\ \ &\Gamma(\textstyle{\frac{1}{2}}) = \sqrt{\pi} \end{align}$$ 즉, 감마함수는 계승(factorial)의 정의역을 (복소수 범위로) 확장한 것.. [일반통계학] 7. 베르누이과정의 극한으로서의 푸아송과정 푸아송분포와 이항분포의 관계 발생률 $\lambda$인 푸아송과정에서 시각 $t$까지의 사건 발생 횟수를 $X$라 하면 $X \sim \text{Pois}(\lambda t)$임을 살펴보았다. 푸아송분포를 이항분포의 극한으로 이해하기 위해 구간 $(0, t]$를 $n$개의 부분구간 $(0, \frac{t}{n}]$, $(\frac{t}{n}, \frac{2t}{n})$, $...$, $(\frac{(n-1)t}{n}, t]$로 나누어 보자. 이 때 각 부분구간에서의 사건 발생은 서로 독립이고 $i$번째 부분구간에서의 사건 발생 횟수 $X_i$의 확률분포는 다음과 같다. $$\begin{align}P(X_i=0) &= 1-\tfrac{\lambda t}{n} + o(h) \\ P(X_i = 1) &= \t.. 이전 1 2 다음