Distribution
Basic Statistics
(a)
(b)
(c)
(d)
작은 크기의 표본을 히스토그램으로 나타낼 경우, 그림 (a)에서처럼 어떤 통계적 정보가 갖고 있지 않는
히스토그램이 만들어진다. 그러나, 표본의 크기를 점점 늘려갈 경우 (b)를 거쳐 (c)와 같은 조밀한 히스토
히스토그램을 만들게 된다. (c)에서는 상대적으로 중간위치에 데이터들이 집중적으로 모이고, 이 위치를
중심으로 점차 대칭적인 분포의 경향을 보이게 된다. 표본의 크기가 계속 커지면, (d)와 같은 정규분포가
생겨나게 된다. 정규분포에서는 중간을 경계로 하여 좌우가 완전하게 대칭을 이루게 된다.
정규분포에서 분포의 중심에 있는 위치를 라는 기호를 사용하여 나타낸다. 만약 이 의 위치가 다를 경우
왼쪽그림과 같이 서로 다른 분포를 가진 정규분포가 만들어지게 된다. 또한, 오른쪽 그림과 같이 의 위치가
같지만, 분포의 폭이 서로 다른 경우, 표준편차 를 사용하여 서로 다른 분포를 가진 모집단들을 구분한다.
Basic Statistics
표준편차는 분포의 중심으로부터 데이터가 어느 정도로 퍼져있는지 나타내는 통계변수로 모집단과 표본집단의
표준편차는 위와 같이 나타낸다. 평균이 주어지는 모집단과 달리 표본에서는 표준편차를 구하기 위해 표본평균을
알아야 하기 때문에 자유도가 N-1이 된다. 분산은 표준편차를 제곱하면 얻어지는 통계적 변수이다.
자유도(Degree of freedom)는 통계적 결과를 얻기 위해 반복실험을 할 때, 시행한 데이터의 크기와 관련있다.
로 표기되는 자유도는 특정한 통계값을 구할 때 신뢰도와 관계된 변수로, 보통 표본의 크기가 클 경우 자유도가
커지고, 신뢰도 역시 커지게 된다. N회 시행한 표본에서 표준편차를 구할 경우, 표준편차를 구하기 위해 평균을
구해야 하므로 자유도는 N-1이 된다.
s
Basic Statistics
RSD RSD
.... |