2012년 8월 17일 금요일

원소가 추가된 경우 분산 구하는 방법

\( N \) 개의 원소로 이루어진 벡터 \( \mathbf{X} \)가 있다고 하자.
\[ \mathbf{X}=\left [ x_1 , x_2 , \cdots , x_N \right ] \]
the 1st raw moment(평균) : \( \overline{\mathbf{X}} = \frac{1}{N}\sum_{i=1}^{N}{x_i} \)
the 2nd raw moment : \( \overline{\mathbf{X}^2} = \frac{1}{N}\sum_{i=1}^{N}{x^{2}_{i}} \)
the 2nd central moment(분산) : \( \sigma^{2}_{\mathbf{X}}=\overline{\mathbf{X}^2}-\overline{\mathbf{X}}^2 \)

그런데 만약 거기에 새로운 원소 하나가 추가되어 \(  \mathbf{Y}=\left [ x_1 , x_2 , \cdots , x_N , x_{N+1} \right ] \) 라는 새로운 벡터가 된다면, 이것의 평균과 분산은 어떻게 구할 수 있을까.

위 계산식처럼 처음부터 다시 구할 수도 있지만, \( \mathbf{X} \)를 몰라도 본디의 '평균'과 '분산', 그리고 '원소의 개수'만 알고 있어도 계산이 가능하다.
\begin{eqnarray}

\overline{\mathbf{Y}} = \frac{N\cdot \overline{\mathbf{X}}+x_{N+1}}{N+1}\\
\overline{\mathbf{Y}^2} = \frac{N \cdot \overline{\mathbf{X}^2}+x^{2}_{N+1}}{N+1}\\
= \frac{N \cdot \left( \sigma^{2}_{\mathbf{X}}+\overline{\mathbf{X}}^2 \right) +x^{2}_{N+1}}{N+1}\\
\sigma^{2}_{\mathbf{Y}} = \overline{\mathbf{Y}^2}-\overline{\mathbf{Y}}^2.\\

\end{eqnarray}
같은 원리로 '평균'과 '분산', '원소 개수'만 알고 있는 또 다른 벡터가 합쳐진다고 해도 병합된 벡터의 평균과 분산을 쉽게 구할 수 있다.

댓글 없음:

댓글 쓰기