40
제8장 통계적 추정 : 한 모집단 전광희 교수 [email protected] 1

Marketing Planning & the Internet - KOCWcontents.kocw.net/KOCW/document/2015/chungnam/... · 2016-09-09 · 24 모평균의신뢰구간추정 모표준편차σ를모르는경우(소표본)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

제8장 통계적 추정 : 한 모집단

전광희교수

[email protected]

1

2

Contents

점추정과 신뢰구간 추정

추정량

신뢰구간 추정

모평균의 신뢰구간 추정

t 분포

모비율의 신뢰구간 추정

표본크기 결정

모분산의 신뢰구간 추정

3

점추정과 신뢰구간 추정

통계적 방법

통계분석

기술통계학 추리통계학

통계적 추정 가설검정

4

점추정과 신뢰구간 추정

추정량과 추정치

추정량(estimator): 표본정보에 의존하는 확률변수로서 모수를추정하는 데 사용되는 표본통계량

추정치(estimate): 표본자료를 이용하여 계산한 통계량의 특정한값(수치)

점추정과 신뢰구간 추정

점추정(point estimation) : 표본을 추출하고 필요한 계산을 하여얻는 하나의 수치인 점추정치(point estimate)로 모수를 추정하는방법

신뢰구간 추정(confidence interval estimate) : 모수의 참 값이포함되리라고 기대하는 추정치를 일정한 범위로 나타내는 방법

점추정과 신뢰구간 추정

신뢰구간의 범위(폭)

신뢰하한 점추정치 신뢰상한

모집단

확률분포

평균= 50

표본

모평균 μ는

모른다.

모평균은40에서

60사이일것이라고

나는95%신뢰한다.

6

추정량

모수의 좋은 추정량이 되기 위한 조건

불편성(unbiasedness)

효율성(efficient estimator)

일치성(consistency)

충족성(sufficient estimator)

7

점추정과 신뢰구간 추정

불편추정량 점추정량 의 표본분포의 기대값이 모수 와 같을 때 점

추정량 은 모수의 불편추정량(unbiased estimator)이라고한다.

8

추정량

효율추정량 불편추정량 중에서 분산이 작은 추정량을 효율추정량(efficient

estimator)이라고 한다.

9

추정량

일치추정량 표본크기가 증가할수록 추정량 이 모수 에 더욱 근접하는

추정량을 일치추정량(consistent estimator)이라고 한다.

10

추정량

충족추정량 충족추정량(sufficient estimator)이란 모수 를

추정하기 위하여 추출하는 동일한 크기의

표본으로부터 가장 많은 정보를 제공하는 추정량을

말한다.

11

추정량

모수의 추정량

12

신뢰구간 추정

신뢰구간 추정 모수가 포함되리라고 보는 범위(구간)를 실수할 확률을

가지고 제시함으로써 추정치에 대한 불확실성을 표현한다.

신뢰구간 추정치 : 하한 ≤ 점추정치 ≤ 상한

신뢰구간(confidence interval) 점추정치를 중심으로 특정 확률로 모수가 포함될 것이라고

기대하는 하한부터 상한까지의 구간

신뢰하한과 신뢰상한을 신뢰한계(confidence limits)라고도한다.

13

신뢰구간 추정

신뢰구간 신뢰수준(level of confidence)또는 신뢰도(degree of

confidence) : 미지의 모수의 참 값이 신뢰한계 안에 포함될

확률

모수 μ에 대한 95% 신뢰구간 : 모수 μ가 이 구간 속에 들어갈

확률이 95%라는 것을 의미하지 않고 표본크기 n을 반복하여

추출하여 설정하는 100개의 신뢰구간 중에서 95개(95%)는

모수 μ를 포함하고 5개(5%) 정도는 포함하지 않을 것이라는

것을 의미한다. 실제로 하나의 신뢰구간을 설정하기 때문에

모수 μ가 이 구간 속에 포함될 것으로 95% 신뢰한다고 말한다.

14

신뢰구간 추정

오차율(probalility of error)

설정된 신뢰구간이 모수의 참값을 포함하지 않을 확률

= 1 - 신뢰수준

신뢰수준 = 1 -

오차율 의 값이 작을수록 신뢰수준은 높게 되고신뢰구간의 폭은 증가한다.

보통 =0.05, 95% 신뢰구간이 사용된다.

15

신뢰구간 추정

신뢰구간 설정 오차한계(margin of error) : 표본오차로서 표본평균과

모평균 사이의 차이

신뢰구간 추정치의 한계 = 점추정치 ± 오차한계

= 점추정치 ± Z(추정의 표준오차)

Z는 임계치(critical value) 또는 신뢰요인(factor) 이라고 하는데 오차율 또는 신뢰수준에 따라 결정된다.

신뢰구간

신뢰하한 신뢰상한점추정치(표본통계량)

오차한계

16

신뢰구간 추정

신뢰구간

모평균

σ²기지

모분산모비율

σ²미지

17

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우 가정(assumption)

모집단은 정규분포를 따른다.

모표준편차 σ 는 알고 있다.

모평균의 신뢰구간

모평균 μ의 신뢰구간의 한계 = ± Z

= ± Z

18

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우 모평균 μ의 신뢰구간

Z 는 각 꼬리에 의 확률을 갖는 표준정규분포의 임계치이다.

오차한계 ME =

신뢰수준에 따른 Z값

19

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우 모평균 μ의 신뢰구간

= 0.05 신뢰수준 = 95%

20

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우 모평균 μ의 신뢰구간

모평균 μ의 신뢰구간의 영향요소 : σ, (1- ), n

오차한계 축소 = 신뢰구간 범위의 축소

ME =

모표준편차 σ를 줄여야 한다.

신뢰수준(1- )를 낮추어야 한다.

표본크기 n을 증가시켜야 한다.

에서

21

모평균의 신뢰구간 추정

모표준편차 σ를 아는 경우 모평균 μ의 신뢰구간 : 예 8-1

모평균 소요시간이 35.2분에서 54.8분 사이일 것이라고 95%

신뢰한다.

모평균 소요시간이 이 구간 속에 포함이 안될지라도 이런 방법으로

설정한 구간들의 95%는 모평균 참 값을 포함한다.

22

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(대표본) 가정 모집단이 정규분포를 따른다.

모표준편차 σ 를 모른다.

표본크기 n≥30이다.

예 8-2

} σ 대신 s를 이용한다.

23

모평균의 신뢰구간 추정

Z분포와 t분포 사용의 결정방법

24

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본) 가정

모집단이 정규분포를 따른다.

모표준편차 σ를 모른다.

표본크기 n<30 이다.

t 분포(t distribution) 평균 μ인 정규모집단으로부터 크기 n의 표본을 무작위로 추출하였을

때 평균 , 표본표준편차 s일 표본통계량 t는

으로 자유도 (n-1)인 t 분포를 따른다.

25

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본) t 분포의 특성

t 분포는 표준정규분포와 같이 평균=0을 중심으로

좌우대칭이며 종모양이다.

t 분포의 밀도함수는 표준정규분포보다 큰 분산을 갖는다.

동일한 신뢰수준에서 t통계량을 사용한 신뢰구간의 범위가

Z통계량 사용시보다 넓다.

t 분포는 자유도 (n-1)에 따라 분포모양이 결정된다.

자유도(표본크기)가 증가할수록 t 분포는 표준정규분포에

근접한다.

26

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본) t 분포의 특성

27

모평균의 신뢰구간 추정

Z분포와 t분포의 비교(신뢰수준 95%, 표본크기 5)

28

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본) t 분포표 이용

확률이 아닌 t값

29

모평균의 신뢰구간 추정

모표준편차 σ를 모르는 경우(소표본) t 분포를 이용한 모평균 μ의 신뢰구간

t 분포를 이용한 모평균 μ의 신뢰구간 : 예 8-5

30

모비율의 신뢰구간 추정

가정(대표본) 확률표본이 추출된다.

이면 표본비율 은 정규분포에 근접한다.

표본비율 의 표본분포

으로 표준오차 을 추정한다

모비율의 신뢰구간 추정

모비율 p에 대한 100(1- )% 신뢰구간(대표본)

모비율 p의 신뢰구간 : 예 8-6

32

표본크기 결정

모평균을 추정하는 경우 모표준편차 σ를 아는 경우

모평균을 추정하는 데에 필요한 표본크기 결정 임계치 Z값을 결정하는 신뢰수준(1- )를 알아야 한다.

오차한계(표본오차) e를 알아야 한다.

모표준편차 σ를 알아야 한다.

표본크기의 결정 : 예 8-7

33

표본크기 결정

모평균을 추정하는 경우 모표준편차 σ를 모르는 경우

표본크기의 결정 : 예 8-8

표본크기 결정

모비율을 추정하는 경우 표본비율을 아는 경우

표본비율을 모르는 경우

표본크기 결정 : 예 8-9

35

모분산의 신뢰구간 추정

분포

분포(chi-square distribution)

평균 μ, 분산 σ²인 정규모집단으로부터 크기 n의 표본을무작위로 반복하여 추출하고 각 표본에 대해 분산 s²을계산하였을 때 확률변수 은

으로 자유도 (n-1)인 분포를 따른다.

36

모분산의 신뢰구간 추정

분포 분포의 특성

t분포와 같이 자유도 (n-1)에 따라 분포의 모양이 변한다.

표본크기가 클수록 정규분포에 근접한다.

t분포, 정규분포와 달리 좌우대칭이 아니며 오른쪽 꼬리를 갖는다.

확률변수 은 언제나 양수이고 가장 왼쪽에서 0을 갖는다.

37

모분산의 신뢰구간 추정

분포 분포표 이용

38

모분산의 신뢰구간 추정

모분산 σ²의 신뢰구간 가정

모집단은 정규분포를 따른다.

분포의 신뢰구간

39

모분산의 신뢰구간 추정

모분산 σ²의 신뢰구간 분포를 이용한 모분산 σ²의 신뢰구간

분포를 이용한 모분산 σ²의 신뢰구간 : 예 8-13

40

E N D