통계적 오해의 일곱 가지 치명적인 죄를 피하는 법

통계는 우리 주변의 패턴을 이해하는 데 유용한 도구입니다. 그러나 우리의 직관은 그러한 패턴을 해석 할 때 우리를 종종 못하게합니다. 이 시리즈에서는 통계, 확률 및 위험을 생각할 때 자주 범하는 실수 중 일부를 살펴보고이를 피하는 방법을 살펴 봅니다.대화

1. 작은 차이가 의미 있다고 가정합니다.

주식 시장의 일일 변동성의 대부분은 의미있는 것보다 기회를 나타냅니다. 일당이 한두 단계 앞선 경우의 여론 조사의 차이는 통계적인 소음 일 때가 많습니다.

수치와 관련하여 "오류 마진"을 요구함으로써 이러한 변동의 원인에 대한 잘못된 결론을 내릴 수 있습니다.

차이가 오류 마진보다 작 으면 의미있는 차이가 없을 가능성이 높으며 그 변동은 아마도 임의 변동에 따릅니다.

통계적 오해의 일곱 가지 치명적인 죄를 피하는 법오류 막대는 점수의 불확실성 정도를 나타냅니다. 오류의 여백이 겹칠 경우 그 차이는 통계적 잡음으로 인한 것일 수 있습니다.


내면의 구독 그래픽



2. 통계적 유의성을 실제 중요성과 동일시 함.

우리는 종종 남성이 육체적으로 강하면서도 여성이 더 많이 양육된다는 점에서 두 그룹이 어떻게 다른지에 대한 일반화를 듣습니다.

이러한 차이점은 종종 고정 관념과 민속 지혜에 의존하지만 두 그룹 간의 유사성과 그룹 내 사람들의 유사성을 종종 무시합니다.

무작위로 두 명의 남성을 선택하면 체력에 상당한 차이가있을 것입니다. 그리고 한 남자와 한 여자를 골라 내면 양육 측면에서 매우 유사하게 끝나거나 남자보다 여자가 더 양육 될 수 있습니다.

이 차이는 그룹 간 차이의 "효과 크기"를 묻는 것으로 피할 수 있습니다. 이것은 한 그룹의 평균이 다른 그룹의 평균과 얼마나 다른지 측정 한 것입니다.

효과 크기가 작 으면 두 그룹이 매우 유사합니다. 효과 크기가 크더라도 두 그룹은 여전히 ​​그 안에 많은 편차가있을 수 있으므로 한 그룹의 모든 구성원이 다른 그룹의 모든 구성원과 다를 수는 없습니다.


3. 극단을 보지 않으려 고 함

효과 크기의 플립 사이드 (flipside)는 당신이 초점을 맞추고있는 것이 "정규 분포"(때때로"종 곡선 "이라고도 함). 이것은 대부분의 사람들이 평균 점수에 가깝고 작은 그룹 만이 평균보다 훨씬 높거나 낮습니다.

그런 일이 생기면 그룹의 성과가 조금씩 바뀌어 평균적인 사람에게는 아무런 의미가 없지만 (포인트 2 참조) 차이가 발생하지만 극단의 성격이 크게 바뀝니다.

극한을 다루고 있는지 아닌지를 반영하여이 오류를 피하십시오. 평균적인 사람들을 상대 할 때 소그룹 차이는 종종 중요하지 않습니다. 극단에 대해 많이 신경 쓰면 작은 그룹 차이가 문제가 될 수 있습니다.

통계적 오해의 일곱 가지 치명적인 죄를 피하는 법두 집단이 정상 분포를 따를 때, 이들 집단 간의 차이는 평균보다 극단에서 더 분명해질 것이다.


4. 우연의 일치

거기에 상관 관계 미국에 매년 물속에 빠져 익사 한 사람들의 숫자와 Nicholas Cage의 영화 수가 나타 났습니까?

통계적 오해의 일곱 가지 치명적인 죄를 피하는 법그러나 인과 관계가 있습니까? tylervigen.com

당신이 충분히 열심히 보면 우연의 일치에 의한 흥미로운 패턴과 상관 관계를 발견 할 수 있습니다.

동시에 두 가지 일이 동시에 일어나거나 비슷한 패턴으로 변하기 만해도 관련성이있는 것은 아닙니다.

관찰 된 연관성이 얼마나 신뢰할 수 있는지 질문하여이 오류를 피하십시오. 일회성입니까 아니면 여러 번 그런 일이 있습니까? 미래의 협회를 예측할 수 있습니까? 한 번만 본 적이 있다면 무작위로 인한 것일 수 있습니다.


5. 인과 관계 거꾸로하기

실업과 정신 건강 문제와 같은 두 가지 상관 관계가있을 때 정신 건강 문제가 실업으로 이어진다는 것은 "명백한"인과 관계가 있다는 것을 유혹 할 수 있습니다.

그러나 때로는 인과 관계가 정신 건강 문제를 일으키는 실업과 같은 다른 방향으로 간다.

연관성을 볼 때 역 인과 관계에 대해 생각하는 것을 기억함으로써이 오류를 피할 수 있습니다. 영향이 다른 방향으로 갈 수 있을까요? 또는 두 가지 방법으로 진행하여 피드백 루프를 만들 수 있습니까?


6. 외부 원인을 생각하는 것을 잊어 버림

사람들은 종종 두 가지 사이의 연관성을 만들 수있는 가능한 "제 3 요인"또는 외부 원인을 평가하지 못합니다. 둘 다 실제로는 세 번째 요소의 결과이기 때문입니다.

예를 들어 식당에서의 식사와 심혈관 건강 증진 사이에는 연관성이있을 수 있습니다. 그러면 둘 사이에 인과 관계가 있다고 믿게 될 것입니다.

그러나 식당에서 음식을 먹을 수있는 사람들은 정기적으로 사회 경제적으로 높은 점수를받으며 더 나은 건강 관리를받을 수 있으며 더 나은 심혈관 건강을 제공하는 건강 관리가 될 수 있습니다.

상관 관계를 볼 때 세 번째 요소에 대해 생각해 보면이 오류를 피할 수 있습니다. 한 가지 일을 가능한 원인으로 후속 조치를 취한다면 무엇이 차례대로 그 일을 일으키는 지 스스로에게 물어보십시오. 세 번째 요인이 관찰 된 결과 모두를 유발할 수 있습니까?


7. 사기성 그래프

그래프의 수직 축의 스케일링과 라벨링에는 많은 장난이 발생합니다. 라벨에는보고있는 모든 의미있는 범위가 표시되어야합니다.

그러나 때로는 그래프 제작자가 작은 차이 또는 연관성을 더욱 두드러지게 만드는 좁은 범위를 선택하기도합니다. 0에서 100까지 두 개의 열이 동일한 높이로 보일 수 있습니다. 그러나 52.5에서 56.5로만 표시되는 동일한 데이터를 그래프로 표시하면 크게 달라질 수 있습니다.

축을 따라 그래프의 레이블을 기록하는 데주의하여이 오류를 피할 수 있습니다. 특히 레이블이없는 그래프에 회의적입니다.

통계적 오해의 일곱 가지 치명적인 죄를 피하는 법그래프는 이야기를 말할 수 있습니다 - 차이를 규모에 따라 더 크게 또는 더 작게 만듭니다.

저자에 관하여

Winnifred Louis, 부교수, 사회 심리학, 퀸즐랜드 대학교 Cassandra Chapman, 사회 심리학 박사 과정, 퀸즐랜드 대학교

이 기사는 원래에 게시되었습니다. 대화. 읽기 원래 기사.

관련 도서 :

at 이너셀프 마켓과 아마존