Netflix가 암 치료에 대해 가르쳐 줄 수있는 것

2 년 전, 버락 오바마 전 대통령은 정밀 의학 이니셔티브 그의 연두 교서에서 이 이니셔티브는 질병 치료가 각 환자의 유전 암호에 맞게 특별히 조정될 수있는 "새로운 의학 시대"를 열망했습니다. 대화

이것은 암 치료에 확실히 공감했습니다. 환자는 이미 특정 종양에서 변형 된 특정 유전자를 표적으로하는 치료법으로 암을 관리 할 수 ​​있습니다. 예를 들어, HER2 유전자의 증폭으로 인한 유방암의 유형을 가진 여성은 허셉틴이라는 치료제로 치료를받는 경우가 많습니다. 이러한 표적 치료법은 암 세포에 특이 적이기 때문에 화학 요법 또는 방사선 치료를 통한 전통적인 암 치료보다 부작용이 적습니다.

그러나 이러한 치료법은 대부분의 암 환자에게 제공되지 않습니다. 많은 암에서 암에 책임이있는 특정 유전자 변형은 알려지지 않았습니다. 개별화 된 암 치료법을 만들기 위해서는 기능적 유전자 변형에 대해 더 많이 알아야합니다.

암 유전학 데이터가 급속하게 증가함에 따라 수학과 통계는 이제이 데이터의 숨겨진 패턴을 열어 개인의 암을 담당하는 유전자를 찾을 수있게 도와줍니다. 이 지식을 통해 의사는 개별 환자의 치료법을 개인화하기 위해 이러한 유전자의 작용을 차단하는 적절한 치료법을 선택할 수 있습니다. 저의 연구는 암에서 정밀 의학을 향상시키는 것을 목표로합니다 - Netflix 영화 등급의 패턴을 찾는 데 사용 된 것과 동일한 방법으로 구축하십시오.

데이터를 살펴 본다.

오늘날 암 유전학 데이터에 대한 전례없는 대중의 접근이 있습니다. 이 데이터는 연구를 위해 종양 샘플을 기부하는 관대 한 환자에서 나온 것입니다. 그런 다음 과학자들은 인간 게놈에서 20,000 유전자 각각의 돌연변이와 활성을 측정하기위한 시퀀싱 기술을 적용합니다.


내면의 구독 그래픽


이 모든 데이터는 인간 게놈 프로젝트 2003에서. 그 프로젝트는 건강한 인간 DNA를 구성하는 모든 유전자의 서열을 결정했습니다. 이 프로젝트가 완료된 이후 인간 게놈을 시퀀싱하는 데 드는 비용은 매년 반 이상에 설명 된 컴퓨팅 성능의 성장을 능가합니다. 무어의 법칙. 이 비용 절감은 연구가 암 환자의 전례없는 유전학 데이터를 수집 할 수있게합니다.

전 세계적으로 수행 된 암 유전학에 관한 대부분의 과학적 연구는 미국 국립 보건원 (NIH) 국립 중앙 도서관에서 제공하는 중앙 집중식 공개 데이터베이스에 데이터를 공개합니다. NIH 국립 암 연구소 (National Cancer Institute)와 국립 인간 게놈 연구소 (National Human Genome Research Institute)는 또한 11,000 종양의 33 종양에서 나온 유전자 데이터를 Cancer Genome Atlas.

음식의 에너지를 추출하는 것부터 상처를 치유하는 것까지의 모든 생물학적 기능은 다양한 유전자의 조합에서 일어납니다. 암은 사람을 성년으로 성장시키고 면역 체계로부터 몸을 보호 할 수있는 유전자를 공중 납치합니다. 연구원은 이것들을 "암의 특징." 이러한 소위 유전자 조절 장애는 종양이 통제 할 수 없게 자라며 원 종양 부위의 먼 장기에서 전이를 형성하게합니다.

연구자들은이 공개 데이터를 적극적으로 사용하여 각 종양 유형을 담당하는 일련의 유전자 변형을 찾습니다. 그러나이 문제는 각 종양에서 단일 불규칙 유전자를 확인하는 것이 간단하지 않습니다. 인간 게놈의 20,000 유전자가 수천은 아니더라도 수백 가지가 암에서 조절 기능을 못합니다. dysregulated 유전자의 그룹은 각 환자의 종양마다 다르며 일반적으로 재사용되는 유전자 세트가 작아 각 암 표시가 가능합니다.

정밀 의학은 각 환자의 종양에서 생물학적 기능을 담당하는 소화 불량 유전자 그룹을 찾는 데 의존합니다. 그러나 유전자는 다른 상황에서 여러 생물학적 기능을 가질 수 있습니다. 따라서 연구자들은 일련의 암 환자들에게 공통적 인 기능을하는 "겹치는"유전자 세트를 밝혀야합니다.

유전자 상태를 기능에 연결 시키려면 복잡한 수학과 엄청난 계산 능력이 필요합니다. 이 지식은 이러한 유전자의 기능을 차단할 치료법에 대한 결과를 예측하는 데 필수적입니다. 그렇다면 어떻게 환자의 개별 결과를 예측할 수있는 중복 기능을 발견 할 수 있습니까?

Netflix가 우리에게 가르쳐 줄 수있는 것

다행히 우리에게이 문제는 이미 컴퓨터 과학에서 해결되었습니다. 그 답은 "매트릭스 분해 (matrix factorization)"라고 불리는 기술입니다. 그리고 당신은 이미 일상 생활에서이 기법들과 상호 작용했을 것입니다.

2009년에 넷플 릭스는 도전을 열었습니다. 각 Netflix 사용자의 영화 등급을 맞춤 설정합니다. Netflix에서 각 사용자는 서로 다른 영화 등급의 별개 세트를 가지고 있습니다. 두 명의 사용자가 비슷한 취향의 영화를 볼 수는 있지만 특정 장르에 따라 크게 다를 수 있습니다. 따라서 유사한 사용자의 평점을 비교하는 데 의존 할 수 없습니다.

대신 매트릭스 분해 알고리즘은 더 작은 사용자 그룹에서 비슷한 등급의 영화를 찾습니다. 사용자 그룹은 각 영화마다 다릅니다. 컴퓨터는 개별 사용자의 취향에 따라 각 사용자를 영화 그룹과 서로 관련시킵니다. 사용자 간의 관계를 "패턴"이라고 부릅니다.이 패턴은 데이터에서 얻은 것으로 영화 장르 만의 예기치 않은 일반적인 순위를 나타낼 수 있습니다. 예를 들어 사용자는 특정 감독이나 배우에 대한 선호도를 공유 할 수 있습니다.

암 4 21Genevieve Stein-O'Brien, CC BY

동일한 과정이 암에서 작용할 수 있습니다. 이 경우 유전자 조절 장애의 측정은 영화 등급, 영화 장르와 생물학적 기능 및 사용자 대 환자 종양과 유사합니다. 컴퓨터는 환자 종양을 검색하여 각 종양의 악성 생물학적 기능을 유발하는 유전자 조절 장애 패턴을 찾습니다.

영화에서 종양에 이르기까지

영화 등급과 암 유전학의 유추는 세부 사항으로 구분됩니다. 미성년자가 아니라면 Netflix 사용자는 시청하는 영화에 제약을받지 않습니다. 그러나 우리의 몸은 단일 기능에 사용되는 유전자의 수를 최소화하는 것을 선호합니다. 또한 유전자 사이에는 상당한 중복이 있습니다. 세포를 보호하기 위해 하나의 유전자가 공통 기능을 제공하기 위해 다른 세포를 쉽게 대체 할 수 있습니다. 암의 유전자 기능은 훨씬 더 복잡합니다. 종양은 또한 암세포와 인접한 건강 기관 간의 무작위 적 상호 작용에 따라 매우 복잡하고 빠르게 진화합니다.

이러한 복잡성을 설명하기 위해 우리는 다음과 같은 행렬 인수 분해 접근법을 개발했습니다. 패턴 세트의 협조 된 유전자 활동 - 또는 짧은 CoGAPS. 우리의 알고리즘은 각 종양의 패턴에 가능한 한 적은 유전자를 통합함으로써 생물학의 미니멀리즘을 설명합니다.

서로 다른 유전자가 서로를 대체 할 수도 있으며, 각각은 다른 맥락에서 유사한 기능을 제공합니다. 이것을 설명하기 위해 CoGAPS는 유전자 기능의 소위 "패턴"에 대한 통계를 동시에 추정합니다. 이것은 우리가 종양의 각 생물학적 기능에 사용되는 각 유전자의 확률을 계산할 수있게 해줍니다.

예를 들어 대다수의 환자는 대장 암, 췌장암, 폐암 및 구강암에서 생존 기간을 연장하기 위해 cetuximab이라는 표적 치료제를 사용합니다. 우리의 최근 연구는 이러한 패턴이 표적 치료제 cetuximab에 반응하는 암세포에서 유전자 기능을 구별 할 수 없다는 것을 발견했다.

미래

불행하게도, 유전자를 표적으로 삼는 암 치료법은 보통 환자의 질병을 치료할 수 없습니다. 그들은 단지 몇 년 동안 진행을 지연시킬 수 있습니다. 대부분의 환자는 재발하여 종양이 치료에 더 이상 반응하지 않습니다.

우리 자신의 최근 작품 cetuximab에 반응하는 세포의 유전자 기능을 구별하는 패턴은 저항성을 일으키는 바로 그 유전자를 포함한다는 것을 발견했다. 신흥 면역 요법이 유망하며 일부 암을 치료하는 것으로 보입니다. 그러나 너무 자주이 치료를받는 환자도 재발합니다. 환자가 더 이상 반응하지 않는 이유를 확인하려면 치료 후 암 유전학을 추적하는 새로운 데이터가 필수적입니다.

이러한 데이터와 함께, 암 생물학은 약물 저항에서 시간이 지남에 따라 발생하는 유전 적 변화를 결정하기 위해 수학과 통계를 연결시킬 수있는 새로운 세대의 과학자를 필요로합니다. 다른 수학 분야에서는 컴퓨터 프로그램이 장기 결과를 예측할 수 있습니다. 이 모델은 날씨 예측 및 투자 전략에 일반적으로 사용됩니다.

이 분야와 내 자신의 이전 연구, 날씨의 경우 위성 데이터와 같은 대형 데이터 세트의 모델에 대한 업데이트가 장기 예측을 향상시키는 것으로 나타났습니다. 우리는 폭풍우에 가까워 질수록 기상 예보가 개선되어 이러한 업데이트의 효과를 모두 보았습니다.

컴퓨터 과학의 도구가 영화 추천과 암 모두에 적용될 수있는 것과 마찬가지로, 미래 세대의 계산 과학자는 정밀 의학 분야의 일련의 예측 도구를 채택 할 것입니다. 궁극적으로 이러한 컴퓨터 도구를 사용하여 우리는 날씨를 예측할 때와 일반적으로 더 정확하게 말하면 치료에 대한 종양의 반응을 예측할 수 있기를 바랍니다.

저자에 관하여

Elana Fertig, 종양학 생물 통계학 및 생물 정보학 조교수, 존스 홉킨스 대학

이 기사는 원래에 게시되었습니다. 대화. 읽기 원래 기사.

관련 서적

at 이너셀프 마켓과 아마존