YouTube의 알고리즘은 사람들을 급 진화시킬 수 있습니다. 그러나 실제 문제는 그들이 어떻게 작동하는지 전혀 모릅니다 미스터 템터 / 셔터 스톡

YouTube는 극단 주의자를 생성합니까? ㅏ 최근의 연구 이 사이트를 구동하는 알고리즘은 더 극단적 인 동영상을 추천하여 사람들을 급진 화시키는 데 도움이되지 않는다고 주장하면서 과학자들 사이에서 논쟁을 일으켰습니다. 제안 된 최근 몇 년 동안.

이 논문은 월요일 첫 공개 저널에 제출되었지만 공식적으로 동료 검토를받지는 않았지만 여러 유형의 채널이 수신 한 비디오 권장 사항을 분석했습니다. YouTube의 알고리즘은 독립 콘텐츠보다 주류 미디어 채널을 선호하며 급 진화는 사이트 알고리즘보다 유해한 콘텐츠를 만드는 사람들과 더 관련이 있다고 결론 내 렸습니다.

현장의 전문가들은 빨리 연구에 응답비판을 받고 종이의 방법 알고리즘을 주장하는 다른 사람들은 몇 가지 중요한 요소 그 데이터 과학 만 우리에게 답을주지 않을 것이다.

이 토론의 문제점은 YouTube 알고리즘이 작동 방식을 이해하지 못하기 때문에 사람들을 급진 화시키는 데 YouTube 알고리즘이 어떤 역할을하는지에 대한 질문에 실제로 대답 할 수 없다는 것입니다. 그리고 이것은 훨씬 광범위한 문제의 증상 일뿐입니다. 이 알고리즘은 일상 생활에서 점점 더 많은 역할을 수행하지만 투명성이 부족합니다.

YouTube가 급 진화에서 역할을하지 않는다고 주장하기는 어렵습니다. 이것은 기술 사회 학자 Zeynep Tufekci에 의해 처음으로 지적되었습니다. 더 극단적 인 내용으로. Tufekci의 말에 따르면, 조깅에 관한 비디오는 울트라 마라톤 실행에 관한 비디오로 이어지고, 백신에 관한 비디오는 음모 이론으로 이어지고, 정치에 관한 비디오는 "홀로 코스트 거부 및 기타 교란 내용"으로 이어집니다.


내면의 구독 그래픽


이것은 또한 쓰여졌습니다 상세히 사이트의 추천 알고리즘을 담당 한 전 YouTube 사용자 인 Guillaume Chaslot이 작성했습니다. 회사를 떠난 이후 Chaslot은 계속해서 이러한 권장 사항을 만들려고 노력했습니다. 더 투명. 그는 YouTube 권장 사항이 음모 이론과 사실 부정확 한 비디오그럼에도 불구하고 사람들이 사이트에서 더 많은 시간을 보내 게합니다.

사실, 시청 시간 최대화 YouTube 알고리즘의 요점이며, 동영상 제작자가 가능한 어떤 방식 으로든주의를 끌기 위해 싸 웁니다. 회사의 투명 투명성의 부족 이것이 정확히 어떻게 작동하는지에 대해 사이트에서 급 진화와 싸우는 것이 거의 불가능합니다. 결국 투명성이 없으면 상황을 개선하기 위해 무엇을 바꿀 수 있는지 알기가 어렵습니다.

YouTube의 알고리즘은 사람들을 급 진화시킬 수 있습니다. 그러나 실제 문제는 그들이 어떻게 작동하는지 전혀 모릅니다 YouTube 알고리즘의 작동 방식은 여전히 ​​미스터리입니다. Danny / Shutterstock은 누구입니까

그러나 이런 점에서 YouTube는 드문 일이 아닙니다. 알고리즘이 작동하는 방식에 대한 투명성이 부족한 경우는 일반적으로 개인 회사 나 공공 기관 등 대형 시스템에서 알고리즘을 사용할 때마다 발생합니다. 다음에 어떤 비디오를 보여줄지 결정할뿐만 아니라 이제 머신 러닝 알고리즘이 아이들을 학교에 배치하다, 결정하다 형무소, 결정 신용 점수보험료의 운명뿐만 아니라 이민자, 구직자대학 지원자. 그리고 보통 우리는이 시스템들이 어떻게 결정을 내리는 지 이해하지 못합니다.

연구원들은 이러한 알고리즘이 사회에 미치는 영향을 보여주는 창의적인 방법을 발견했습니다. 반동적 권리의 상승 또는 음모 이론의 확산 YouTube에서 또는 방법을 보여줌으로써 검색 엔진은 인종 차별주의 편견을 반영 그들을 만드는 사람들의.

기계 학습 시스템은 일반적으로 크고 복잡하며 불투명합니다. 적합하게, 그들은 종종 다음과 같이 묘사됩니다 블랙 박스정보가 들어가고 정보 나 행동이 나오지만 그 사이에 어떤 일이 일어나는지 아무도 볼 수 없습니다. 즉, YouTube 추천 시스템과 같은 알고리즘의 작동 방식을 정확히 알지 못하므로 사이트가 어떻게 작동하는지 알아내는 것은 보닛을 열지 않고 자동차를 이해하는 것과 같습니다.

다시 말해, 어떤 알고리즘을 수행해야하는지 또는하지 말아야하는지 규정하는 법률을 작성하는 것은 맹목적인 프로세스 또는 시행 착오가된다는 것을 의미합니다. 이것은 YouTube와 다른 많은 기계 학습 알고리즘에서 일어나는 일입니다. 우리는 그들이 실제로 어떻게 작동하는지에 대한 실제적인 이해없이 그들의 결과에 대해 말하려고 노력하고 있습니다. 우리는 이러한 특허 기술을 개방하거나 최소한 규제 할 수있을 정도로 투명하게 만들어야합니다.

설명 및 테스트

이를 수행하는 한 가지 방법은 알고리즘이 제공하는 것입니다. 반 상설 그들의 결정과 함께. 이는 전체 논리를 설명하지 않고 알고리즘이 다른 결정을 내리는 데 필요한 최소 조건을 해결하는 것을 의미합니다. 예를 들어, 은행 대출에 대한 결정을 내리는 알고리즘은 "18 세 이상이고 사전 부채가 없으면 은행 대출을 수락하게됩니다"라는 출력을 생성 할 수 있습니다. 그러나 이론상 플랫폼의 모든 비디오를 언제든지 추천 할 수 있기 때문에 추천 알고리즘을 사용하는 YouTube 및 기타 사이트에서는이를 수행하기 어려울 수 있습니다.

또 다른 강력한 도구는 알고리즘 테스트 및 감사로, 바이어스 알고리즘 진단에 특히 유용합니다. 최근의 한 전문 이력서 심사 회사는 알고리즘이 두 가지 요소의 우선 순위 직무 수행의 가장 좋은 예측 인자 : 후보자의 이름이 Jared인지, 고등학교에서 라크로스를했는지 여부. 이것은 기계가 감독되지 않은 상태에서 발생합니다.

이 경우, 이력서 심사 알고리즘은 백인 남성이 고용 될 가능성이 높았으며 채용 후보자에게 존재하는 상호 대리 특성 (예 : Jared 또는 라크로스 연주)을 발견했습니다. 알고리즘 감사는 YouTube를 통해 어떤 종류의 동영상이 추천을 위해 우선 순위를 정하는 지 이해하고 YouTube 추천이 급 진화에 기여하는지 여부에 대한 논쟁을 해결하는 데 도움이 될 수 있습니다.

실제 설명을 소개하거나 알고리즘 감사를 사용하는 것은 어렵고 비용이 많이 드는 프로세스입니다. 그러나 대안이 더 나쁘기 때문에 중요합니다. 알고리즘을 점검하지 않고 규제를받지 않으면 음모 이론가와 극단 주의자들이 미디어에 점진적으로 등장하고, 가장 수익성 높은 컨텐츠를 생산할 수있는 사람에 의해 우리의주의가 통제되는 것을 볼 수 있습니다.대화

저자에 관하여

Chico Q. Camargo, 데이터 과학 박사 후 연구원 옥스퍼드 대학

이 기사는에서 다시 게시됩니다. 대화 크리에이티브 커먼즈 라이센스하에 읽기 원래 기사.