차등 개인 정보가 데이터를 어떻게 보호할 수 있습니까?

: By Deakin University, Tianqing Zhu

방문해 주셔서 감사합니다 InnerSelf.com, 있는 곳에 20,000+ "새로운 태도와 새로운 가능성"을 홍보하는 삶을 변화시키는 기사. 모든 기사는 다음으로 번역됩니다. 30 개 이상의 언어. 확인 매주 발행되는 InnerSelf Magazine과 Marie T Russell의 Daily Inspiration에 게재됩니다. InnerSelf 매거진 1985년부터 출판되었다.

차별 개인 정보가 귀하의 데이터를 어떻게 보호합니까? 마르코 Verch / 플리 커, CC BY

기술 회사는 개별 프라이버시를 유지하면서 차등 개인 정보를 사용하여 사용자 습관에 대한 집계 데이터를 수집하고 공유 할 수 있습니다.

페이스 북, 구글, 애플, 아마존과 같은 대형 기술 회사들이 매일 우리에게 방대한 양의 데이터를 수집하기 위해 개인적 및 사회적 상호 작용에 점점 더 침투하고 있다는 사실은 비밀이 아닙니다. 동시에 사이버 공간에서의 개인 정보 침해는 제 1면 뉴스를 정기적으로 만듭니다.

그렇다면 데이터가 수집되고 속도와 독창성이 증가하는 세상에서 개인 정보를 어떻게 보호해야합니까?

차별 개인 정보 보호는 사이버 보안의 새로운 모델로서, 기존의 방법보다 훨씬 나은 개인 정보를 보호 할 수 있다고 주장합니다.

수년 전에 10이 개발 한 수학은 애플에 의해 채택되었고 구글 최근 몇 년 동안.

차등 개인 정보 란 무엇입니까?

차별 개인 정보는 기술 사용자가 개인 사용자의 개인 정보를 유지하면서 사용자 습관에 대한 종합 정보를 수집하고 공유 할 수있게합니다.

예를 들어 사람들이 공원을 걷는 데 가장 많이 사용되는 경로를 보여주고 싶다고 가정 해 보겠습니다. 정기적으로 공원을 걷는 100 사람들의 경로를 추적하고 길을 걸 든 잔디를 훑어 본다.

그러나 각 경로를 택한 특정 사람들을 공유하는 대신 시간 경과에 따라 수집 된 집계 데이터를 공유합니다. 결과를 보는 사람들은 60 사람들 중 100이 잔디를 통해 지름길을 선호하지만 60 사람들은 그렇지 않다는 것을 알 수 있습니다.

왜 우리는 그것을 필요로합니까?

많은 세계 정부는 기술 회사가 사용자 데이터를 수집하고 공유하는 방법에 대해 엄격한 정책을 시행합니다. 규칙을 따르지 않는 회사는 엄청난 벌금에 처할 수 있습니다. 에이 벨기에 법원은 최근 Facebook을 주문했습니다. 외부 웹 사이트에서 사용자의 브라우징 습관에 대한 데이터 수집을 중지하거나 하루에 € 250,000의 벌금에 처합니다.

여러 관할 구역에서 운영되는 많은 회사, 특히 다국적 기업의 경우 고객 데이터 수집 및 사용과 관련하여 민감한 입장에 처해 있습니다.

한편으로 이러한 회사는 맞춤형 권장 사항과 같이 사용자에게 도움이되는 고품질 서비스를 제공 할 수 있도록 사용자의 데이터가 필요합니다. 반면에 너무 많은 사용자 데이터를 수집하거나 데이터를 한 관할 구역에서 다른 관할 구역으로 이동하려고 시도하면 요금이 부과 될 수 있습니다.

암호화와 같은 전통적인 개인 정보 보호 도구는 기술 회사가 전혀 데이터에 액세스하지 못하게하기 때문에 이러한 딜레마를 해결할 수 없습니다. 익명 성은 데이터의 가치를 떨어 뜨립니다. 습관이 무엇인지 알지 못하면 알고리즘이 맞춤형 추천을 제공 할 수 없습니다.

어떻게 진행합니까?

공원을 걷는 길의 예를 계속합시다. 연구에 포함 된 사람들의 신분을 알고 있지만 누가 어떤 경로를 택했는지 모를 경우 개인 정보 보호가 보호된다고 생각할 수 있습니다. 그러나 그것이 사실이 아닐 수도 있습니다.

귀하의 데이터를 보는 누군가가 Bob이 잔디밭이나 길을 걷는 것을 선호하는지 확인하고 싶다고 가정 해보십시오. 그들은 다른 99 사람들에 관한 배경 정보를 얻었습니다. 40 사람들은 경로를 따라 걷는 것을 선호하며 59은 잔디를 걷는 것을 선호합니다. 따라서 그들은 데이터베이스의 100th 사람인 Bob이 풀밭을 걷는 것을 선호하는 60th 사람이라는 것을 추론 할 수 있습니다.

이 유형의 공격은 차별화 된 공격이라고하며, 누군가가 얻을 수있는 지식의 양을 제어 할 수 없으므로 방어하기가 어렵습니다. 차별 개인 정보 보호는 이러한 유형의 공격을 방어하기위한 것입니다.

걷는 경로를 추론하는 사람은 그다지 심각하지 않겠지 만 걷는 경로를 HIV 검사 결과로 대체하면 심각한 프라이버시 침해의 가능성이 있음을 알 수 있습니다.

차등 개인 정보 보호 모델은 누군가가 데이터 세트에서 99 사람들의 100에 대한 완전한 정보를 갖고 있다고해도 여전히 최종 사용자에 대한 정보를 추론 할 수 없음을 보증합니다.

이를 달성하기위한 기본 메커니즘은 집계 데이터에 무작위 노이즈를 추가하는 것입니다. 경로 예에서 잔디를 가로 지르는 것을 선호하는 사람의 수는 59의 정확한 숫자가 아니라 61 또는 60입니다. 부정확 한 숫자는 Bob의 개인 정보를 보호 할 수 있지만 패턴에 거의 영향을 미치지 않습니다. 60 % 주변 사람들은 지름길을 선호합니다.

소음은 신중하게 설계되었습니다. Apple이 iOS 10에서 차등 개인 정보를 사용했을 때 개별 사용자 입력에 잡음이 추가되었습니다. 즉, 예를 들어 가장 많이 사용되는 이모티콘을 추적 할 수 있지만 모든 개별 사용자의 그림 이모티콘은 가려져 있습니다.

Cynthia Dwork, 차등 개인 정보 보호의 발명가차등 개인 정보 보호의 요구 사항을 달성하기에 충분한 잡음이 얼마나 많은지에 대한 훌륭한 수학적 증명을 제안했습니다.

실용적인 응용 프로그램은 무엇입니까?

차별적 인 프라이버시는 추천 시스템에서 위치 기반 서비스 및 소셜 네트워크에 이르기까지 모든 것에 적용될 수 있습니다. 사과 차등 개인 정보를 사용합니다. iPhone, iPad 및 Mac과 같은 기기에서 익명의 사용 통계를 수집합니다. 이 방법은 사용하기 쉽고 합법적으로 합법적으로.

차별 개인 정보는 아마존과 같은 회사가 귀하의 맞춤형 쇼핑 환경 설정에 액세스하는 동안 귀하의 과거 구매 목록에 대한 중요한 정보를 숨길 수있게합니다. Facebook은 국가의 개인 정보 보호 정책을 위반하지 않고도 타겟팅 된 광고에 대한 행동 데이터를 수집하는 데 Facebook을 사용할 수 있습니다.

어떻게 미래에 사용할 수 있습니까?

각국마다 다양한 개인 정보 취급 방침이 있으며 민감한 문서는 현재 한 국가에서 다른 국가로 이동하기 전에 수동으로 확인해야합니다. 이는 시간이 많이 걸리고 비용이 많이 듭니다.

최근에, 디킨 대학교 각국의 클라우드 공유 커뮤니티에서 개인 정보 보호 프로세스를 자동화하는 차등 개인 정보 보호 기술을 개발했습니다.

그들은 수식을 사용하여 데이터가 준수하는지 확인하기 위해 "미들웨어"(소프트웨어)로 번역 될 수있는 각 국가의 개인 정보 보호법을 모델링 할 것을 제안합니다. 이러한 방식으로 차별 개인 정보를 사용하면 사용자의 개인 정보를 보호하고 기술 회사의 데이터 공유에 골치를 앓을 수 있습니다.