왜 당신의 페이스 북과 당신의 성격 사이의 연결이 실제로 존재 하는가?

이번 주 개인 정보 보호 운동가들은 Facebook의 차단 결정 영국의 대형 보험 회사인 Admiral은 젊은이들의 소셜 미디어 데이터를 사용하여 자동차 보험료를 책정하는 것을 막았습니다. 그러나 이것은 그러한 목적으로 소셜 미디어 정보를 사용하는 것에 대한 논쟁의 시작일 뿐입니다. 개인 정보 보호 문제는 잠시 제쳐두고 이렇게 하는 데에는 매우 타당한 사회적 이유가 있습니다. 사실, 그것은 수많은 사람들에게 혜택을 줄 수 있습니다.

Admiral은 젊은 고객의 Facebook 대화 및 "좋아요"(허가 하에)를 사용하여 그들이 저위험 운전자이고 최대 £150의 할인을 받을 자격이 있는지 평가하기를 원했습니다. 그러나 Facebook은 이것이 그들의 이용 약관에 위배된다고 재빨리 발표하여 Admiral의 계획을 방해했습니다.

이 문제에 대해 어느 쪽을 취하든 Admiral의 계획과 크고 작은 회사에서 나온 유사한 계획의 배후에 있는 과학을 이해하는 것이 중요합니다. 실제로 내 연구는 소셜 미디어 데이터를 사용하여 그러한 예측을 하는 것이 매우 정확할 수 있음을 시사합니다.

2015년에 평균적인 Facebook 사용자는 영화에서 정치인에 이르기까지 225개의 항목과 "아삭아삭한 나뭇잎 밟는 게 좋아".

제 동료들과 저는 6m Facebook 사용자의 성격을 측정하고 결과에 대한 피드백을 제공하는 옵트인 설문조사를 통해 데이터를 수집했습니다. 그런 다음 0과 1 사이의 숫자를 사용하여 Facebook 활동이 성격을 얼마나 잘 예측할 수 있는지 측정했습니다. 숫자가 높을수록 상관 관계가 강합니다.


내면의 구독 그래픽


60,000명의 사용자의 "좋아요"를 사용하여 자신이 보고한 심리적 특성을 예측합니다., 우리는 "좋아요"와 성격 사이의 상관 관계가 0.56이라는 것을 발견했습니다. 다른 사람의 직장 동료에게 성격을 예측하라고 하면 정확도는 0.27, 친구는 0.45, 가족은 0.50, 심지어 누군가의 배우자도 0.58로 예측할 수 있습니다. 즉, 컴퓨터는 남편이나 아내만큼 당신을 거의 모든 사람보다 더 잘 압니다.

"센세이션 추구자"(새롭고 다양하며 위험한 경험을 찾는 외향적인 사람) 가난한 자동차 보험 위험. 페이스북에서 이들은 "급류 래프팅"과 "번지점프"를 좋아하고 "칠린", "멋진 밤", 이상하게도 "soooooooo"와 같은 문구를 사용하는 사람들입니다.

온라인 데이터는 놀라울 정도로 위조하기 어렵기 때문에 이러한 시스템에 대해 더욱 확신을 가질 수 있습니다. Facebook에서 일어나는 모든 일에는 타임 스탬프가 찍혀 있습니다. 따라서 자동차 보험을 신청하기 전날 갑자기 "체스"와 "독서"(내향성을 예측하는 요인)를 좋아하게 된다면 – 몇 년 동안 파티와 음주에 대해 이야기한 후 – 시스템은 쉽게 그것을 집어.

사회적 이익

기록을 위해, 이 경우 소셜 미디어 데이터가 청소년과 사회에 도움이 될 수 있는 사용이 금지된 것은 유감스러운 일이라고 생각합니다. 대부분의 젊은이들은 운전을 진지하게 생각하고 많은 사람들이 보험 청구를 하지 않지만 스릴을 추구하고 값비싼 충돌 사고로 모든 사람의 보험료를 인상하는 소수 집단과 자신을 구별할 방법이 없습니다.

고령 운전자는 노클레임 보너스를 쌓을 시간이 있었습니다. 그러나 프리미엄을 설정하는 데 사용되는 기존 인구 통계 및 지리적 데이터의 렌즈를 통해 새로운 동인은 모두 동일하게 보입니다. 소셜 미디어 데이터에 성숙하고 자제력이 있는 것으로 나타난 젊은이들은 자신이 £150 할인을 받을 자격이 있음을 증명할 기회를 가질 수 있었습니다. 이것은 영국에서 17-22세를 위한 가장 저렴한 종합 보험 비용을 고려하면 좋은 절약이 되었을 것입니다. £ 1,287 / 년.

우리의 소셜 미디어 데이터가 우리를 위해 또는 불리하게 사용될 수 있는 많은 방법이 있으며, 이것이 우리가 이번과 같은 더 많은 전투를 보게 될 이유입니다. Admiral 사례는 금융 모델링에서 디지털 발자국을 사용하는 과정에서 앞뒤로 꼬불꼬불한 시작점으로 기억될 수 있습니다. 기타 소셜 네트워크, 휴대 전화, 매장 로열티 카드 및 소위 말하는 것을 형성하는 수십억 개의 센서 사물의 인터넷 모두 심리적 특성을 예측할 수 있는 데이터를 수집합니다.

우리가 사회적 유용성 대 개인 정보 보호 문제에 대해 토론하면서 앞으로 많은 긴밀한 요청이 있을 것입니다. 하지만 제 생각에는 이것은 그 중 하나가 아니었습니다. 회사가 우리의 데이터를 투명하고 우리의 동의하에 사용하는 한 보험 거래의 양 당사자가 매우 정확한 데이터에 의존하도록 허용하지 않는 이유는 무엇입니까?

대화

저자에 관하여

빅 데이터 분석 및 양적 사회 과학 강사 David Stillwell, 캠브리지 판사 비즈니스 스쿨

이 기사는 원래에 게시되었습니다. 대화. 읽기 원래 기사.

관련 도서 :

at 이너셀프 마켓과 아마존