2009. 10. 20. 21:13
메신저로 배우는 통계와 추정 Math2009. 10. 20. 21:13
동생이랑 메신저로 나눈 대화.
처음에 상황 자체를 반대로 이해한 데다, 중간중간 약간의 오류도 있어서 다소 혼란스럽지만, 동생의 공부를 위해(-_-;) 올려둔다.
[Park] 님의 말:
질문 하나
Start! 님의 말:
?
[Park] 님의 말:
어떤 행동을 취했을 때 A가 발생할 확률이 30%이고 B가 발생할 확률이 70%라고 할때
[Park] 님의 말:
이걸 5천번 했을 때 나온 결과 신뢰도가 어케되지?
[Park] 님의 말:
다 까무서 모르겠다
Start! 님의 말:
질문이 이상한데?
Start! 님의 말:
일단...........
Start! 님의 말:
발생하는 사건은 딱 두 개, A와 B?
[Park] 님의 말:
어
Start! 님의 말:
그럼 일단 이항분포로 해결되겠네
Start! 님의 말:
신뢰도는 측정 결과로부터 무언가를 추정할 때, 그 결과를 얼마나 믿을 수 있느냐인데
Start! 님의 말:
지금 질문은 확률을 정해 놓고서 아무 결과도 없이 "신뢰도"를 물으니 당연히 이상한 질문이지
[Park] 님의 말:
그럼 질문을 다시
[Park] 님의 말:
5천번 했을 때 A가 발생한 빈도가 28%일 확률?
[Park] 님의 말:
이라고 하면 될려나
Start! 님의 말:
1000번 시행했더니 A가 298번, B가 702번 나왔다. A가 발생할 확률이 28~32%라고 한다면, 이것은 신뢰도 얼마로 생각한 것인가?
Start! 님의 말:
이래야 말이 되지
[Park] 님의 말:
머 그런얘기임
[Park] 님의 말:
지금 논란중인게 A가 발생할 확률이 30%인데
[Park] 님의 말:
실제로 5천번해보니 28%밖에 안나왔다
[Park] 님의 말:
근데 5천번으로는 못믿겠다 백만번 해라
[Park] 님의 말:
이런 소리거덩
Start! 님의 말:
ㅋㅋ
Start! 님의 말:
5000*.28 = 1400인가?
Start! 님의 말:
산수가 안 된다............
[Park] 님의 말:
1400맞네
Start! 님의 말:
(스스로 감탄 중)
[Park] 님의 말:
ㅋㅋ
Start! 님의 말:
그러면, 30% 확률로 5천번 해서 1400번 나오는 확률을 구해 봐
[Park] 님의 말:
음~~~~
Start! 님의 말:
5000 C 1400 (0.3)^1400 (0.7)^3600 = ?
[Park] 님의 말:
허거
Start! 님의 말:
손으로는 힘들지
Start! 님의 말:
그러니까, 저렇게 구하는 건 너무하고
Start! 님의 말:
정규분포를 써서 신뢰도 95% 정도로 추정해야지.
[Park] 님의 말:
흠
Start! 님의 말:
B(5000,30%)라 하면....
Start! 님의 말:
이건 거의 N(5000*.3,5000*.3*.7)과 같고
Start! 님의 말:
계산 좀 해 줘
[Park] 님의 말:
어케계산하지
Start! 님의 말:
5000*.3,5000*.3*.7
[Park] 님의 말:
1500, 1050
Start! 님의 말:
그러니까.... 잘 들으시오
Start! 님의 말:
지금 하려는 것은
Start! 님의 말:
이항분포 B(5천,30%)라는 분포를 따르는 어떤 시행이 있을 때,
Start! 님의 말:
신뢰도 95% 정도 되는 구간이 얼마인지 알아보려는 것
Start! 님의 말:
다시 말해, a < 발생 횟수 < b 의 확률이 95%가 되는 a,b를 구하려는 것
Start! 님의 말:
OK?
[Park] 님의 말:
ㅇㅇ
Start! 님의 말:
이걸 무식하게 5000 C a 어쩌구 + 5000 C (a+1) 어쩌구 + ... + 5000 C b 어쩌구
Start! 님의 말:
이렇게 구하는 건 거의 불가능
[Park] 님의 말:
ㅇㅇ
Start! 님의 말:
아까 봐서 알겠지만.
Start! 님의 말:
그래서 B(5천,30%) 대신
Start! 님의 말:
이것과 거의 같은 분포인 정규분포 N(1500,1050)을 사용.
Start! 님의 말:
시행횟수가 5000쯤 되면 "거의"는 떼도 될 정도니까 걱정할 필요 없다.
Start! 님의 말:
저걸로 시비 거는 사람 있으면
Start! 님의 말:
"그럼 5000 C a 어쩌구 + 5000 C (a+1) 어쩌구 + ... + 5000 C b 어쩌구를 계산해 보든가"라고 답하면 된다
[Park] 님의 말:
ㅎㅎ
Start! 님의 말:
N(1500,1050)는 불행히도 분포표가 없으니까, 정규분포 N(0,1)로 고쳐야지
Start! 님의 말:
기억나나?
[Park] 님의 말:
거의안난다
Start! 님의 말:
ㅋㅋ
Start! 님의 말:
Z = (X-m)/sigma
Start! 님의 말:
난 아직도 기억난다
[Park] 님의 말:
ㅎㅎ
Start! 님의 말:
그러면, Z = (X-1500)/sqrt(1050)으로 놓고
Start! 님의 말:
에.... 신뢰도 95% 구간이 얼마지?
Start! 님의 말:
이건 나도 기억 안 난다
Start! 님의 말:
인터넷이 좋구만. 검색하니 표가 나오네
[Park] 님의 말:
ㅋㅋ
Start! 님의 말:
0.95/2 = 0.475
Start! 님의 말:
맞나?
Start! 님의 말:
표를 보니 1.96이면 되네.
Start! 님의 말:
그러니까, 아까 그 Z에 대해,
Start! 님의 말:
-1.96 < Z < 1.96 이 되면, 확률은 95%가 된다.
Start! 님의 말:
1 500 + (1.96 * sqrt(1 050)) = 1 563.51126 라고 구글신께서 알려주시니
Start! 님의 말:
또, 1 500 - (1.96 * sqrt(1 050)) = 1 436.48874 라고 말씀하시니
Start! 님의 말:
1437 <= X <= 1563 이면 95% 신뢰도로 충분히 생길 수 있는 오차
[Park] 님의 말:
그렇군
Start! 님의 말:
1437/5000 = 0.2874 로구먼
Start! 님의 말:
안 됐지만, 백만번 해야할 듯
[Park] 님의 말:
ㅋㅋ
Start! 님의 말:
28.74%만 넘으면 95%를 넘는 신뢰도로 믿을 수 있다고 우길 수 있는데.... 아깝다.
[Park] 님의 말:
그러면 좀 더 정확히해서
[Park] 님의 말:
30.31% 확률에
[Park] 님의 말:
1409번 나온거라면
Start! 님의 말:
30% 확률에 1400번도 위태한데 30.31%에 1409번?
[Park] 님의 말:
1515.5, 1056.2
Start! 님의 말:
1515.5 - 1.96 * sqrt(1056.2) < ? < 1515.5 + 1.96 * sqrt(1056.2)
[Park] 님의 말:
1451.80151 < ? < 1579.19849 인가보네
Start! 님의 말:
그렇네
[Park] 님의 말:
1409번 나오기는 어렵다고 봐야?
[Park] 님의 말:
지금 논의되는게 실제로는 A확률이 30.31%가 아닌 28.31% 정도일 것이다 라는 얘기거덩
Start! 님의 말:
전화중 먄
Start! 님의 말:
복귀
Start! 님의 말:
문제가 뭐여?
Start! 님의 말:
저 발생 횟수로부터 발생 확률을 추정해야 하는 거야?
[Park] 님의 말:
그런건 아니고
[Park] 님의 말:
아까 말했듯이 5천번 한거는 못믿겠다는거
Start! 님의 말:
30.31% 확률에 1409번 나왔다면 못 믿을 수도 있지.
[Park] 님의 말:
사람들은 실제 30.31이 아닌 28.31% 정도가 맞을거다 라고 다들 공감하는데 30.31%에 1409번 나올 수도 있다 고 주장하는 사람이 있음
[Park] 님의 말:
1만번 해본 사람도 있고 해서
[Park] 님의 말:
까이는 분위기이긴 함 ㅎㅎ
Start! 님의 말:
유의수준이 5%니까 아주 불가능한 일은 아니지
[Park] 님의 말:
머 그렇긴 하지만
Start! 님의 말:
0.99/2=?
[Park] 님의 말:
저사람 혼자만 실험한거도 아니고
[Park] 님의 말:
꽤 많은 사람들이 실험해본듯
[Park] 님의 말:
0.495
Start! 님의 말:
그럼 2.58로 계산해서
Start! 님의 말:
1515.5 - 2.58 * sqrt(1056.2) < ? < 1515.5 + 2.58 * sqrt(1056.2)
[Park] 님의 말:
1431
Start! 님의 말:
1432는 돼야 신뢰도 99%
Start! 님의 말:
(1409-1515.5)/sqrt(1056.2) = ?
Start! 님의 말:
헉, 3.27700064는 정규분포표에도 없네
[Park] 님의 말:
ㅋ
Start! 님의 말:
무슨 sigma6도 아니고.....
[Park] 님의 말:
그럼 사실상 불가능이라고 봐야겠군
Start! 님의 말:
로또 사라고 해.
[Park] 님의 말:
ㅎㅎ
Start! 님의 말:
신의 손 같은데
Start! 님의 말:
암튼....
Start! 님의 말:
발생 확률로 추정하는 것도 있지만, 지금 하려는 건 어차피 횟수로 따지니까 아까 한 것처럼 하는 게 이해하기 쉬울 듯
[Park] 님의 말:
ㅇㅇ
[Park] 님의 말:
아무튼 좋은 공부가 되었음
Start! 님의 말:
좋은 포스팅 거리가 되었음.
[Park] 님의 말:
ㅋㅋ
[Park] 님의 말:
다시 요약하면 실험한 사람이 못믿는게 아니라
[Park] 님의 말:
실험한 사람은 실제확률이 30%는 아니다 라고 주장하고 못믿는 사람은 그래도 30%가 맞다고 우기는 상황
[Park] 님의 말:
이상 끝
Start! 님의 말:
근데 무슨 실험이기에...?
[Park] 님의 말:
게임 얘기임 ㅎㅎ
Start! 님의 말:
무슨 게임을 5000번이나....
[Park] 님의 말:
보스몹 때리는게 있는데
[Park] 님의 말:
치명타로 적중할 확률이 30.31%인데
[Park] 님의 말:
실제로 해보니 아니더라~ 이런 얘기임
Start! 님의 말:
그런 확률은 정해져 있는 거 아냐?
[Park] 님의 말:
그게 사람들 가진 캐릭마다 다 달라서
Start! 님의 말:
설마 테스트&디버깅을 5000번의 실험으로.....!!
[Park] 님의 말:
내 세팅에 30.31%가 나와야 할거 같아서 5천번 몹을 때려보니
[Park] 님의 말:
1409번이 치명타로 들어가고 나머지는 보통으로 들어갔다
[Park] 님의 말:
그래서 30.31%보다 낮을거다 라고 추정하는 중임
Start! 님의 말:
제대로 추정했네
Start! 님의 말:
(포스팅을 위해) 다시 죽 보니 하나 틀린 게 있다.
Start! 님의 말:
그러면, 30% 확률로 5천번 해서 1400번 나오는 확률을 구해 봐
[Park] 님의 말:
음~~~~
Start! 님의 말:
5000 C 1400 (0.3)^1400 (0.7)^3600 = ?
Start! 님의 말:
여기에서, 5000 C 1400 (0.3)^1400 (0.7)^3600 만 계산하면 안 되고
Start! 님의 말:
그냥 이것만 계산하면 거의 0이지
Start! 님의 말:
5000 C 1400 (0.3)^1400 (0.7)^3600 + 5000 C 1401 (0.3)^1401 (0.7)^3599 + ... + 5000 C 5000 (0.3)^5000 을 계산해야 한다.
[Park] 님의 말:
흐미
Start! 님의 말:
5000번 해서 칼같이 1400번 나온다면야 아까 하나만 하면 되지만, 지금은 그런 뜻이 아니니까
Start! 님의 말:
엄밀하게는 양측검정, 단측검정을 따져야 할 듯.
[Park] 님의 말:
어렵군
[Park] 님의 말:
포스팅하면 다시 봐야지 ㅎㅎ
[Park] 님의 말:
재밌게 써주삼
Start! 님의 말:
이거 그냥 긁어 붙일 건데....
반응형
'Math' 카테고리의 다른 글
수학자 Legendre의 얼굴 (9) | 2009.11.17 |
---|---|
삼중적분 (6) | 2009.11.13 |
EBS 수학 다큐 (8) | 2009.10.19 |
2009년 정수론 중간고사 (12) | 2009.10.15 |
수학 문제 푸는 요령 (16) | 2009.09.24 |