Talk To Me 컴퓨터 : 음성 제어가 해제됩니다.

예기치 않은 패키지가 집앞에 나타나기 시작하면 스마트 장치 중 하나에 단어를 넣고 싶을 수 있습니다.

이달 초 댈러스에서 6 살인 한 가족이 그녀의 가족에게 아마존 에코 인형 집을위한 스마트 스피커. 그리고 아마존의 시리 (Siri)와 같은 인공 비서 인 Alexa는 즉시 집에 명령했다..

샌디에고 TV 뉴스 쇼에서이 이야기를 들려 주었고 부끄러워하는 뉴스 앵커 중 한 명이 "나는 알렉사가 내게 인형 집을 주문해라 '는 어린 소녀를 사랑한다."라고 들었습니다. 샌디에고 더 많은 인형을 사려고했다..

CW6 샌디에고 알렉사의 우연한 인형 집 구입에 대한 뉴스 보도.

{youtube}oI2KLIULjXc{/youtube}

이 이야기는 애플의 시리 (Siri) 나 마이크로 소프트의 코타나 (Cortana)와 대화를 시도한 사람들에게 우스꽝스럽게 익숙한 듯하다. 우리의 장치는 우리의 말을 듣기에 꽤 좋았지 만, 그것이 항상 이해한다는 것을 의미하지는 않습니다.

마이크로 소프트의 연구원은 최근이를 오늘날의 대화 인터페이스에서 잠재적 인 문제로 지적했습니다. 그들은 현명한 농담과 세상적인 지식을 지닌 "지능형"조수로 판매되고 있지만 상식의 부족으로 종종 우리를 좌절시킵니다.


내면의 구독 그래픽


안에 소규모 연구연구원들은 시간이 지남에 따라 계속해서 디지털 보조원과 이야기하는 사람들은 가장 낮은 기대치를 가지고 시작한 사람들이라는 것을 발견했습니다.

음성 인터페이스는 실제로 무엇을합니까?

음성 인터페이스를 사용하려면 다음과 같이해야합니다.

  • 당신의 목소리를 "듣고"배경 소음과 구별하십시오.
  • "umms"와 "ahhs"를 무시하고 각 단어의 시작과 끝을 알아 낸다.
  • 각 단어의 소리를 사전의 단어와 일치시키고, 문맥에서 올바른 단어 하나를 선택하십시오 동음 이의어
  • 전체 문장의 의미를 정확하게 해석한다.
  • 귀하의 요청과 일치하는 의미 있고 유용한 응답을 생성하십시오.

이들 각각은 복잡한 기술 과제이며 여러 기술 회사가 여러 분야에서 진전을 이루었습니다.

Google Now는 광범위한 서비스 요청에 대해 적절한 응답을 제공하므로 웹 서비스 및 Google 서비스를 사용하는 경우 개인 활동에 대한 Google의 정보를 효과적으로 활용할 수 있습니다.

Amazon Echo는 소음 제거 원거리 마이크 어레이 덕분에 시끄러운 방에서 귀하의 요청을 듣는 것이 특히 좋습니다. 물론 Amazon을 통해 구매하는 것도 좋습니다.

지난 몇 년 동안, 음성 인터페이스는 찌그러지고 조심스럽게 말로 표현되는 명령이 아닌 일상적이거나 "자연스러운"음성을 이해하는 데 훨씬 뛰어났습니다. 그들은 "누가 호주 오픈에서 뛰고 있는가?"와 같은 간단한 쿼리를 처리하는 것이 여전히 좋으며 "호주 오픈에서 누가 올해 처음으로 뛰는가?"와 같은 더 복잡한 요청으로 어려움을 겪는 경향이 있습니다. "결승 동안 비가 올까요?"와 같은 질문.

Siri는 40 이상의 언어와 방언을 지원하지만 Alexa는 영어와 독일어로만 제공됩니다. 그러나 이러한 모든 기능은 꾸준히 개선되고 있습니다.

음성 인터페이스가 끊기는 곳

음성 인터페이스는 곧 우리의 모든 기술을 인수하게됩니다. 그녀의? 기술 연구 회사 인 Gartner는 " 예상했다 내년까지 기술과의 상호 작용의 30 %는 음성 지원 인터페이스와의 대화가 될 것입니다.

그러나 음성 인터페이스에는 한계가 있으며 모든 기술이 더 나은 기술로 해결 될 수는 없습니다.

음성은 Spike Jonze의 영화 Her와의 인터페이스 기술의 핵심 수단입니다.

{youtube}ne6p6MfLBxc{/youtube}

소음 공해는 주요한 장애물 중 하나입니다. 주변의 배경 소음과 당신이 말한 것을 구별 할 수 있습니까? 소음 감소, 개인화 된 음성 인식 및 입술 읽기와 같은 기술이 도움이 될 수 있습니다.

하지만 스마트 장치와 대화하여 다른 사람들을 위해 만드는 배경 소음은 어떻습니까? 사무실이나 비행기에서 당신 옆에 앉아있는 사람이 당신이 읽으 려 할 때 Siri와 이야기하고, 음성 인터페이스가 항상 사회적으로 받아 들여지지 않는 이유를 알 수 있다고 상상해보십시오.

또 다른 문제는 음성 인터페이스의 정신적 요구에서 비롯됩니다. 음성 기반 시스템을 사용하는 것을 배우는 일은 어려울 수 있습니다. 특히 Amazon Echo처럼 화면이없는 경우 특히 그렇습니다.

혹시 은행이나 전화 회사에 전화 한 적이 있다면, 필요한 것을 기다리는 동안 합성 음성 목록을 듣는 것에서 오는 집중력과 지루함의 비참한 조합을 알고 혼란을 피하기 위해 노력하십시오 쪽으로. 기존의 그래픽 인터페이스는 사용 가능한 옵션을 표시하고 선택 사항을 빠르게 탭함으로써이 문제를 방지합니다.

음성 명령을 익힌 후에는 음성 명령을 사용하면 혼란 스러울 수 있습니다. 연구원은 음성 명령 생각의 기차를 탈선시키다. 마우스와 키보드 이상.

이것은 차량용 음성 인터페이스에서 특히 위험합니다. University of Utah의 한 쌍의 연구 결과에 따르면 운전자는 최대 27 초의주의 산만 음성 명령을 사용한 후.

University of Utah / 운전자주의 산만에 관한 교통 안전 연구를위한 AAA 재단.

{비메오}108281698{/비메오}

목소리를 찾는거야?

따라서 음성 인터페이스가 완전히 도입되지는 않을 것이지만, 우리 삶에서 유용한 틈새를 발견하게 될 것입니다. 그들은 이미 자동차에서 흔히 볼 수 있으며, 기술 향상에 따라 덜 혼란 스러울 것입니다.

부엌에서 조리법을 통해 알렉사에게 요청하거나 손이 바쁜 요리를하면서 쇼핑 목록을 업데이트 할 수 있습니다. 가상 현실 및 증강 현실에서 음성 인터페이스를 사용하면 손이 전혀 보이지 않을 때 시스템을 제어 할 수 있습니다.

언어 학습에서는 발음 연습에 사용할 수 있습니다. 가장 중요한 것은 음성 인터페이스가 장애를 극복하기 위해 운동 장애, RSI 또는 난독증을 가진 사용자를 돕는 것입니다.

음성 인터페이스는 오랫동안 기다려온 기술이며, 시간이 마침내 다가 왔다고 생각하는 좋은 이유가 있습니다. 단지 그들이 소리처럼 영리하지 못하다는 것을 기억하십시오. 또한 자녀가있는 경우 음성을 구매할 때 PIN 코드를 입력 할 수 있습니다.

대화

저자에 관하여

프레이저 앨리슨 (Fraser Allison), 인간 - 컴퓨터 상호 작용의 박사 과정 후보, 멜버른 대학교

이 기사는 원래에 게시되었습니다. 대화. 읽기 원래 기사.

관련 항목

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market 및 Amazon