상호 관계와 원인 사이의 혼란 제거 

여기 당신이 알고 있지 않을지도 모르는 역사적인 맛있는 가사가 있습니다. 수년간 1860과 1940 사이에 뉴 잉글랜드에 살고 있던 감리교 목사의 수가 늘어남에 따라 보스톤으로 수입 된 쿠바 럼의 양도 증가했습니다. 둘 다 매우 비슷하게 증가했습니다. 따라서 감리교 목사들은 그 기간에 럼주를 많이 사야했을 것입니다!

사실, 그건 바보 같은 결론입니다. 실제로 진행되고있는 것은 감리교 목사와 쿠바 럼이 모두 인구 증가와 같은 다른 요인들에 의해 위쪽으로 몰렸다는 것입니다.

그 잘못된 결론에 도달하면서, 우리는 너무 일반적인 실수를 저질렀습니다. 인과 관계와 혼동되는 상관 관계.

차이점이 뭐야?

2 개의 양은 상관 관계  (양의 상관 관계가있는 경우) 또는 다른 하나가 감소 할 때 하나가 증가하는 경우 (반대의 경우도 마찬가지) ( "음의 상관 관계가 있음").

상관 관계는 통계 분석을 통해 쉽게 감지됩니다. 피어슨 상관 계수1 (완벽하게 음의 상관 관계)에서 0 (전혀 상관 관계가 없음)에서 1 (완벽하게 양수 상관)까지의 두 수량이 얼마나 긴밀하게 잠겨 있는지를 나타냅니다.


내면의 구독 그래픽


 causation1tylervigen.com

그러나 두 양이 상관 관계가 있다고해서 반드시 하나가 직접적으로 의미하는 것은 아닙니다. 일으키는 다른 하나는 바뀔 것이다. 상관 관계는 인과 관계를 의미하지 않습니다.흐린 날씨가 강우를 의미하지 않는 것처럼, 그 반대가 사실 임에도 불구하고.

두 가지 양이 상관 관계가있는 경우 진정한 인과 관계 (예 : 강우량 및 우산 판매)가있을 수 있지만 다른 변수가 (예 : 해적 수와 지구 온난화), 아니면 그냥 우연 일 수도 있습니다 (예 : 미국 치즈 소비와 교살 별 배지).

인과 관계가 존재하는 곳이라 할지라도 우리는 그 원인을 그 효과와 섞지 않도록 조심해야합니다. 그렇지 않으면 예를 들어 히터 사용이 증가하면 더 추운 날씨를 초래할 수 있다고 결론 내릴 수 있습니다.

인과 관계를 수립하기 위해서는 통계를 뛰어 넘어 (과학적 또는 역사적 성격의) 별도의 증거와 논리적 인 추론을 찾아야합니다. 상호 연관성은 우리가 처음에 이러한 증거를 찾는 것을 촉구 할 수 있지만 결코 그 자체의 증거는 아닙니다.

미묘한 문제

위의 예제가 분명히 어리석은 것이지만, 상관 관계는 종종 현실 세계에서 즉시 명백하지 않은 방식으로 인과 관계로 오인됩니다. 통계를 읽고 해석 할 때 데이터와 통계가 의미하는 바를 정확히 이해해야하며 더 중요한 것은 그들이 무엇인지를 잘 이해해야합니다 지원 함축하고있다.

 causation2

데이터를 해석 할 때주의를 기울여야 할 필요성에 대한 최근의 예는 금년 초에 눈에 띄는 획기적인 작업을 둘러싼 흥분입니다. 중력파 탐지 - 발표 된 발표 성급하게, 데이터에 영향을 미치는 모든 변수가 설명되기 전에.

유감스럽게도 통계, 확률 및 위험을 분석하는 것은 인간의 직감, 그리하여 너무 쉽게 길을 잃을 수밖에 없습니다. 전체 도서 통계가 오해를 일으킬 수있는 (또는 오도하는 데 사용되는) 미묘한 방법으로 작성되었습니다. 가드를 계속 지킬 수 있도록 다음과 같은 일반적인 미끄러운 통계 문제를 알아야합니다.

1) Healthy Worker Effect, 때로는 두 그룹을 평평한 경기장에서 직접 비교할 수없는 경우가 있습니다.

우주 비행사 그룹의 건강과 직장인 그룹의 건강을 비교하는 가상의 연구를 생각해보십시오. 연구 결과 건강과 작업 환경의 상관 관계가없는 두 연구간에 유의 한 차이가 없다면 우주에서의 생활과 근무가 우주 비행사에게 장기간의 건강 상 위험을 초래하지 않는다고 결론 내릴 수 있습니까?

아니! 이 그룹은 같은 발판에 있지 않습니다. 우주 비행사 팀은 건강한 후보자를 찾은 다음, "미세 중력"에서의 생활 효과에 적극적으로 대처하기 위해 포괄적 인 체력 정책을 유지합니다.

따라서 평균적으로 사무직 근로자보다 훨씬 건강에 좋을 것으로 기대되며 그렇지 않은 경우에는 걱정해야합니다.

2) 분류 및 단계 마이그레이션 효과 - 그룹간에 사람을 섞으면 통계 결과에 큰 영향을 줄 수 있습니다.

이것은라고도합니다. 윌 로저스 보도 된 미국 코미디언 이후,

Okies가 Oklahoma를 떠나 캘리포니아로 이사했을 때, 그들은 두 주에서 평균 정보 수준을 높였습니다.

예를 들어, 큰 그룹의 친구를 "짧은"그룹과 "큰"그룹으로 나누어 상상해보십시오. 그렇게함으로써 두 집단의 평균 신장을 한꺼번에 높이는 것은 놀랍도록 쉽습니다.

"키가 큰"그룹의 가장 짧은 사람에게 "짧은"그룹으로 전환하기 만하면됩니다. "키가 큰"그룹은 가장 짧은 회원을 잃어 평균 신장이 높아 지지만 "짧은 그룹"은 아직 키가 큰 회원을 얻지 못해 평균 신장이 증가합니다.

이것은 새로운 연구를 테스트하는 과정에서 환자가 종종 "건강"또는 "건강에 좋지 않은"그룹으로 분류되는 의학 연구에 중요한 영향을 미칩니다. 진단 방법이 향상되면 일부 건강에 좋지 않은 일부 환자가 다시 분류되어 치료 효과에 관계없이 두 그룹의 건강 결과가 향상됩니다.

 causation3데이터를 선택하고 선택하면 잘못된 결론이 도출 될 수 있습니다. 회의론자들은 데이터가 실제로 장기간의 온난화 (녹색)를 보일 때 냉각 기간 (파란색)을 봅니다. skepticalscience.com 

3) 데이터 마이닝 - 풍부한 데이터가 존재할 때 원하는 결론을 뒷받침 할 수 있도록 비트와 조각을 체리 피킹 할 수 있습니다.

이것은 나쁜 통계적 관행이지만 의도적으로 행해진 경우 원래의 완전한 데이터 세트를 알지 못해도 발견하기가 어려울 수 있습니다.

지구 온난화에 대한 두 가지 해석을 보여주는 위의 그래프를 예로 들어 보겠습니다. 또는 불소 - 소량이지만 역사상 가장 효과적인 예방 약품 중 하나이지만 독성 물질 인 불소를 고려하면 긍정적 인 효과는 완전히 사라집니다.

비슷한 이유에서 주어진 통계 실험을위한 절차가 실험이 시작되기 전에 정해진 다음 실험이 끝날 때까지 변경되지 않는 것이 중요합니다.

4) 클러스터링 - 완전 무작위 데이터에서도 예상됩니다.

암이나 다발성 경화증과 같은 특정 질병이 어떻게 발생 하는지를 검사하는 의학적 연구를 고려해보십시오. 지리적으로 분산 된. 질병이 무작위로 발생한다면 (환경은 아무런 영향을 미치지 않습니다.) 수많은 무리의 환자가 발생하는 것을 볼 수 있습니다. 환자가 완벽하게 균등하게 퍼지면 그 분포는 실제로 무작위적일 것입니다!

따라서 단일 클러스터 또는 다수의 작은 클러스터 클러스터가 존재하는 것은 전적으로 정상입니다. 해당 지역의 무언가가 병의 원인이 될 수 있다고 추론하는 데 얼마나 많은 클러스터링이 필요한지를 결정하기 위해서는 정교한 통계 방법이 필요합니다.

불행하게도 클러스터는 전혀 중요하지 않은 클러스터 일지라도 쉽게 (그리고 언뜻보기에는 매력적인) 뉴스 헤드 라인을 만듭니다.

 causation4

통계 분석은 다른 강력한 도구와 마찬가지로 매우 신중하게 사용해야하며 특히 두 수량이 상관된다는 결론을 내릴 때는 항상 조심해야합니다.

대신 우리는 인과 관계를 주장하기 위해 항상 별도의 증거를 요구해야하며 그 증거는 단일 통계 번호의 형태로 나타나지 않을 것입니다.

뚜렷한 상관 관계, 주어진 유전자와 정신 분열증 또는 고지방 식단 그리고 심장 질환은 매우 모호한 방법론에 근거한 것으로 판명 될 수 있습니다.

우리는 아마도 이러한 문제를 다루기 위해인지 적으로 준비된 종족 일 것입니다. 캐나다 교육자로서 키에 란 에간 그의 책에 넣어 시작부터 잘못 이해하기:

나쁜 소식은 우리의 진화가 우리로 하여금 작고 안정된 헌터 - 채집자 사회에서 살 수있게 해 주었다는 것입니다. 우리는 홍적위의 사람들이지만, 우리의 낡은 뇌는 거대한 다문화적이고 기술적으로 정교하고 빠르게 변화하는 사회를 만들어 냈습니다.

결과적으로, 우리는 우연히 의미를 파악하고 상관과 원인을 혼동하려는 유혹에 끊임없이 저항해야합니다.대화

이 기사는 원래에 게시되었습니다. 대화
읽기 원래 기사.


저자에 관하여

보우 와인 조나단Jonathan Borwein (Jon)은 뉴캐슬 대학교 (University of Newcastle)에서 수학 수료 교수입니다. 뉴캐슬 대학교 (University of Newcastle)의 수학 교수이자 컴퓨터 보조 연구 수학 및 응용 수학 센터 (CARMA)의 책임자입니다. 그는 Carnegie-Melon, Dalhousie, Simon Fraser 및 Waterloo 대학교에서 근무했으며 컴퓨팅 분야에서 두 명의 캐나다 연구 위원장을 역임했습니다.

로즈 마이클Michael Rose는 호주 뉴캐슬 대학교 (University of Newcastle)의 Jon Borwein 교수가 감독 한 Newcastle.Mathematics PhD 학생의 PhD 후보이며, 수학 및 물리 과학 학교입니다. 현재는 프랙탈 수학을 적용하여 뇌 시냅스 분포를 모델링하는 연구를 지원합니다.

공개 진술 : 저자는이 기사를 통해 이익을 얻을 수있는 회사 또는 조직의 주식을 소유하거나, 자문을 제공하거나, 주식을 소유하거나, 자금을 제공받지 않습니다. 또한 관련 제휴가 없습니다.


추천 도서 :

돈, 성, 전쟁, 카르마 : 불교 혁명을위한 메모
David R. Loy.

돈, 성, 전쟁, 운명 : David R. Loy의 불교 혁명 노트.데이비드 로이 (David Loy)는 불교 세계관의 가장 강력한 옹호자 중 한 명으로, 현대 세계의 사회 정치적 풍경을 변화시킬 수있는 능력을 다른 사람처럼 설명하지 않습니다. 에서 돈, 섹스, 전쟁, 카르마그는 카르마의 작업, 자아의 본성, 개인적 및 사회적 차원의 문제의 원인들, 그리고 "결코 충분하지 않다"는 집단적 감각의 배후에 숨겨진 진정한 이유들 - 오해 된 불교의 스테이플들에 대한 예리하고 심지어는 놀랍도록 분명한 발표를 제공한다 "시간, 돈, 성별, 안전 ... 전쟁조차도. 데이비드의 "불교 혁명"은 우리의 삶, 지구, 우리의 언어, 문화 및 영성에 퍼져있는 집단적 망상에 접근 할 수있는 방식의 급진적 인 변화에 불과합니다.

자세한 정보 및 / 또는 Amazon에서이 책을 주문하려면 여기를 클릭하십시오.