단순한 소셜 미디어 문제가 아닙니다. 검색 엔진이 잘못된 정보를 퍼뜨리는 방법검색 엔진은 종종 정보와 잘못된 정보의 왜곡 된 조합을 제공합니다. Crispin la valiente / Moment via Getty Images, CC의 BY-ND

검색 엔진은 정보와 사람에 대한 사회의 주요 게이트웨이 중 하나이지만 잘못된 정보를 전달하는 통로이기도합니다. 비슷하다 문제가있는 소셜 미디어 알고리즘, 검색 엔진은 귀하와 다른 사람들이 이전에 클릭 한 것을 제공하는 방법을 배웁니다. 사람들은 감각에 끌리기 때문에 알고리즘과 인간 본성 사이의이 춤은 잘못된 정보의 확산을 촉진 할 수 있습니다.

대부분의 온라인 서비스와 마찬가지로 검색 엔진 회사는 광고를 판매 할뿐만 아니라 사용자를 추적하고 데이터를 판매하여 수익을 창출합니다. 실시간 입찰을 통해 그 위에. 사람들은 종종 논란의 여지가 있거나 자신의 견해를 확인하는 정보뿐만 아니라 선정적이고 재미있는 뉴스에 대한 욕구로 인해 잘못된 정보를 얻습니다. 한 연구에 따르면 당뇨병에 관한 더 인기있는 YouTube 동영상은 의학적으로 유효한 정보를 가질 가능성이 낮음 예를 들어, 주제에 대한 덜 인기있는 비디오보다.

소셜 미디어 플랫폼과 같은 광고 기반 검색 엔진은 검색 회사가 비즈니스 메트릭을 높이는 데 도움이되기 때문에 매력적인 링크 클릭에 대한 보상을 제공하도록 설계되었습니다. 연구원으로서 검색 및 추천 시스템 연구, 저와 제 동료들은 기업 이윤 동기와 개인 감수성의 위험한 조합이 문제를 해결하기 어렵게 만듭니다..

검색 결과가 잘못되는 방식

검색 결과를 클릭하면 검색 알고리즘은 클릭 한 링크가 검색어와 관련이 있음을 인식합니다. 이것은 ... 불리운다 관련성 피드백. 이 피드백은 검색 엔진이 향후 해당 쿼리에 대한 해당 링크에 더 높은 가중치를 부여하는 데 도움이됩니다. 충분한 사람들이 해당 링크를 충분히 클릭하여 관련성 높은 피드백을 제공하면 해당 웹 사이트가 해당 웹 사이트 및 관련 검색어에 대한 검색 결과에서 더 높은 위치에 올라 오기 시작합니다.


내면의 구독 그래픽


사람들은 더 높게 표시된 링크를 클릭 할 가능성이 더 높음 검색 결과 목록에서. 이는 긍정적 인 피드백 루프를 생성합니다. 웹 사이트가 더 많이 표시 될수록 더 많은 클릭이 발생하며, 그 결과 해당 웹 사이트가 더 높게 이동하거나 더 높게 유지됩니다. 검색 엔진 최적화 기술은이 지식을 사용하여 웹 사이트의 가시성을 높입니다.

이 잘못된 정보 문제에는 두 가지 측면이 있습니다. 검색 알고리즘이 평가되는 방식과 사람이 헤드 라인, 제목 및 스 니펫에 반응하는 방식입니다. 대부분의 온라인 서비스와 마찬가지로 검색 엔진은 일련의 메트릭을 사용하여 평가되며 그중 하나는 사용자 참여입니다. 읽고, 보거나 단순히 클릭하고 싶은 것을 제공하는 것이 검색 엔진 회사의 최대 관심사입니다. 따라서 검색 엔진이나 추천 시스템이 표시 할 항목 목록을 만들면 항목을 클릭 할 가능성이 계산됩니다.

전통적으로 이것은 가장 관련성이 높은 정보를 가져 오기위한 것이 었습니다. 그러나 사람들이 검색을 사용하여 찾기 때문에 관련성에 대한 개념이 모호해졌습니다. 흥미로운 검색 결과 및 진정으로 관련성있는 정보.

피아노 튜너를 찾고 있다고 상상해보십시오. 누군가 피아노를 연주하는 고양이의 비디오를 보여 주면 클릭 하시겠습니까? 피아노 조율과는 아무 관련이 없더라도 많은 사람들이 할 것입니다. 검색 서비스는 긍정적 인 관련성 피드백으로 검증되었다고 느끼고 사람들이 피아노 튜너를 검색 할 때 피아노를 연주하는 고양이를 보여도 좋다는 것을 알게됩니다.

실제로 많은 경우 관련 결과를 표시하는 것보다 훨씬 낫습니다. 사람들은 재미있는 고양이 비디오를 보는 것을 좋아하고 검색 시스템은 더 많은 클릭과 사용자 참여를 얻습니다.

이것은 무해한 것처럼 보일 수 있습니다. 그렇다면 사람들이 때때로주의를 산만하게하고 검색어와 관련이없는 결과를 클릭하면 어떻게 될까요? 문제는 사람들이 흥미 진진한 이미지와 감각적 인 헤드 라인에 이끌린다는 것입니다. 그들 음모 이론과 선정적인 뉴스를 클릭하는 경향이 있습니다., 피아노를 연주하는 고양이뿐만 아니라 실제 뉴스를 클릭하는 것 이상 또는 관련 정보.

유명하지만 가짜 거미

2018 년에 '새로운 치명적인 거미'검색 Google에서 급증 새로운 치명적인 거미가 여러 주에서 여러 사람을 죽였다고 주장하는 Facebook 게시물에 이어. 동료들과 저는이 인기 검색어의 첫 주 동안 Google 검색에서 "새로운 치명적인 스파이더"에 대한 상위 100 개 결과를 분석했습니다.

단순한 소셜 미디어 문제가 아닙니다. 검색 엔진이 잘못된 정보를 퍼뜨리는 방법2018 년 XNUMX 월 '새로운 치명적인 거미'에 대한 Google 검색 결과의 처음 두 페이지 (음영 처리 된 영역)는 해당 주제에 대한 원래 가짜 뉴스 게시물과 관련이 있었으며 폭파 또는 기타 사실 정보가 아닙니다. 치라 그 샤, CC의 BY-ND

이 이야기가 나왔습니다 가짜였다하지만이를 검색하는 사람들은 원래 가짜 게시물과 관련된 잘못된 정보에 크게 노출되었습니다. 사람들이 계속해서 잘못된 정보를 클릭하고 공유함에 따라 Google은 검색 결과 상단에 해당 페이지를 계속 제공했습니다.

이러한 스릴 넘치고 확인되지 않은 이야기가 등장하고 사람들이 클릭하는 것은 계속되고 있으며, 사람들은 분명히 진실에 관심이 없거나 Google 검색과 같은 신뢰할 수있는 서비스에서 이러한 이야기를 보여주고 있다면 그 이야기가 사실이어야한다고 믿습니다. 최근에는 입증되지 않은 보고서 중국이 연구실에서 코로나 바이러스 누출이 발생하도록 내버려 두었다고 주장하는 것은 이러한 악순환 때문에 검색 엔진에서 견인력을 얻었습니다.

잘못된 정보 발견

사람들이 정확한 정보와 잘못된 정보를 얼마나 잘 구별하는지 테스트하기 위해 우리는“Google 또는 아닙니다.” 이 온라인 게임은 동일한 쿼리에 대해 두 세트의 결과를 보여줍니다. 목표는 간단합니다. 신뢰할 수 있거나 신뢰할 수 있거나 가장 관련성이 높은 세트를 선택하십시오.

단순한 소셜 미디어 문제가 아닙니다. 검색 엔진이 잘못된 정보를 퍼뜨리는 방법테스트에서 사람들의 절반 정도가 잘못된 정보가 포함 된 Google 검색 결과와 신뢰할 수있는 결과 만 포함 된 검색 결과의 차이를 구분하지 못합니다. 치라 그 샤, CC의 BY-ND

이 두 세트 중 하나는 검증되고 잘못된 정보 또는 반박 된 이야기로 분류 된 결과가 하나 또는 두 개 있습니다. 게임을 공개하고 다양한 소셜 미디어 채널을 통해 광고했습니다. 전반적으로 2,100 개 이상의 국가에서 30 개의 응답을 수집했습니다.

결과를 분석 한 결과 사람들이 세트를 신뢰할 수있는 것으로 잘못 고른 시간의 약 절반에 한두 개의 잘못된 정보 결과. 수백 명의 다른 사용자를 대상으로 여러 번 반복 한 실험 결과 비슷한 결과가 나왔습니다. 즉, 사람들이 음모 이론과 가짜 뉴스를 포함하는 결과를 선택하는 시간이 약 절반입니다. 더 많은 사람들이 이러한 부정확하고 오해의 소지가있는 결과를 선택함에 따라 검색 엔진은 그것이 사람들이 원하는 것임을 알게됩니다.

빅 테크 규제 및 자체 규제에 대한 질문은 제쳐두고 사람들이 이러한 시스템의 작동 방식과 수익 창출 방식을 이해하는 것이 중요합니다. 그렇지 않으면 시장 경제와 사람들이 눈길을 사로 잡는 링크에 끌리는 자연스러운 성향이 ​​악순환을 계속할 것입니다.

저자에 관하여

Chirag Shah, 정보 과학 부교수, 워싱턴 대학

이 기사는에서 다시 게시됩니다. 대화 크리에이티브 커먼즈 라이센스하에 읽기 원래 기사.