원본 콘텐츠는 UX Booth를 위해 작성되었으며 허가를 받아 재게시되었습니다.
음성 기술은 어디로 향하고 있는가

“Hey Google, 오늘 날씨가 어때?” 아침에 차 한 잔을 만들면서, 나는 대부분의 날 이렇게 연결된 주방에 묻곤 한다. 지금은 2020년이고, 나는 내 주방에 날씨 예보를 물어볼 수 있다. 분명 놀라운 일이지만, 안타깝게도 대화는 거기서 끝난다.
지난 10년을 돌아보면, 우리가 이뤄낸 성과를 보는 것은 정말 놀랍다. 우리는 아이폰의 부상, 테슬라와 스페이스X의 시작, 그리고 크리스퍼의 발전을 목격했다. 우리의 삶은 불과 5년 전과 비교해도 완전히 달라 보이고 느껴진다. 하지만 많은 것이 번개처럼 빠르게 발전하는 동안, 음성 기술의 역할은 안타깝게도 뒷전으로 밀려나고 있다. 물론 가끔씩 업데이트가 있기는 하다. 예전에는 내 연결된 주방이 겨우 타이머 정도만 관리할 수 있었지만, 이제는 장보기 목록을 받아 적을 수 있다. 어느 정도는 진전이지만, 세상을 바꾸는 다른 혁신들을 생각하면, 내가 알고 싶은 것은 음성 기술이 언제 그 잠재력을 실현할 것인가 하는 점이다.
이행되지 않은 약속: 음성은 언제 따라잡을까?
그렇다면 5년 만에 세상을 바꾸는 혁신이 가능하다면, 음성 기술은 언제 따라잡을까? 타이머를 설정하고 날씨를 묻는 것 외에 음성 기술로 우리가 할 수 있는 모든 일을 상상해 보자. 음성 기술은 머지않아 우리 일상생활의 핵심 기능이 될 것이 분명하다. 아이들은 알렉사에게 조명을 낮추라고 말하고, 구글 어시스턴트에게 저녁 식사에 대해 부모에게 메시지를 보내라고 하며 자라고 있다. 과거의 촉각 중심 기능은 상호작용적이고 직관적인 음성 기술로 대체될 것이다. 그런데도 놀랍게도 음성 기술의 미래는 아직도 손 닿지 않는 곳에 있는 듯하고, 삶을 바꿀 잠재력은 우리를 계속 피해 가는 것처럼 느껴진다.
이 미래는 내가 내 모국어인 한국어로 영어권 동료들과 이야기하면 내 언어가 실시간으로 번역되는 세계다. 또는 휴대폰이 이미지가 어떻게 생겼는지 완벽하게 자세히 설명해 주는 세계다. 혹은 집의 스피커가 내가 말하는 방식, 목소리의 톤을 통해 내 기분의 변화를 알아차리는 세계이기도 하다. 음성 기술의 가능성은 방대하며, 현재의 현실에서 그리 멀지 않다.
맥락 기반 디자인과 자연어 검색
현재 우리가 부족한 것은 자연어 검색을 수용하는 맥락 기반 UX 디자인이다. 우리가 실제로 말하는 방식에 반응하는 이 능력은 관련 항목을 함께 보여주는 쇼핑 목록이나, 식당에서의 비대면 주문과 같은 현재의 코로나19 관련 필요, 또는 음성 인식 결제 기능처럼 일상적인 발전으로 이어질 수 있다. 지금 우리에게 부족한 것은 대화다.
톤을 더하면 기술에 인간미를 불어넣을 수 있다
반대편에서는, 음성 기술이 우리 주변의 기술과 훨씬 더 공감적인 관계를 가능하게 하여, 우리 기술과의 관계마저도 더 의미 있게 만들고자 하는 깊은 인간의 욕구에 응답할 수 있다. 일상적인 기본 사항을 도와주는 것뿐 아니라 돌봄 관점에서 직관적인 피드백을 제공하는 감정 지원 AI를 상상해 보자.
우리의 말투가 우리가 선택하는 단어만큼이나 많은 것을 전달한다는 것은 잘 알려져 있다. 이러한 수준의 이해를 우리 주변의 일상용품에 통합한다면, 사회가 정신 건강의 필요에 대응하는 방식이나 노년의 친척을 돌보는 방식을 바꿀 수 있다.
집단의 목소리와 사고의 다양성 찾기
모든 혁신에는 여러 사람의 머리가 필요하다. 즉, 다양한 사람들로부터 아이디어가 나와야 한다. 의미 있는 진전을 위해 디자이너는 프로토타입을 제작하고, 실험하고, 마음껏 시도해 볼 수 있어야 한다. 음성 통합도 다르지 않다. 우리가 음성 기술에서 앞으로 나아가려면 디자이너에게 모든 가능성을 탐색할 도구가 필요하다. 하지만 현재로서는 음성 통합 기능을 갖춘 프로그램과 도구가 충분하지 않아 그것이 쉽지 않다.
현실적으로 정보 구조와 인터페이스 디자인은 터치/탭이 아니라 음성에 맞게 다르게 접근해야 한다. 그러나 현재로서는 대형 기술 기업 내부에서 운영되는 음성 기술을 전문으로 하는 소수의 팀만이 있다. 현재 음성 기능과 작동 방식을 개발하는 사람들은 그들뿐이다. 이 떠오르는 기술은 광범위한 의미에서 디자이너들에게 열려 있지 않으며, 이는 우리가 함께 이뤄낼 수 있는 진전을 늦춘다. 음성 분야에서 혁신의 불꽃을 일으키려면, 전 세계의 창의적인 사고자들이 동등하게 접근할 수 있도록 음성 프로토타입 제작 접근성이 더 민주화되어야 한다.
분명히 말하자면, 현재 진전이 더딘 이유는 투자나 재정 자원의 부족이 아니라 시야의 제한 때문이다. 빅테크 독점의 결과로 우리가 보고 있는 것처럼 닫힌 문 뒤에서 일하는 방식이 아니라, 수십만 명의 디자이너가 음성 기능 발전을 위해 함께 협업할 수 있다면, 각 팀이 속한 회사의 규모와 상관없이 그 어떤 작은 팀보다 훨씬 빠른 속도로 혁신할 수 있을 것이다.
미래는 이미 지금 여기에 있다
우리는 이미 여러 자동차 제조사와 협업하여 차량 내 음성 기능을 통해 인카 경험을 향상시키고 있다. 흥미롭게도 그 기능들 중 어느 것도 우리에게 완전히 새로운 것은 아니지만, GPS와 어떻게 대화하는지부터 실내 온도를 어떻게 설정하는지에 이르기까지, 그것들과 상호작용하는 방식은 완전히 달라질 것이다. 모든 기기를 핸즈프리로 다루는 방식을 통해 우리는 탑승자의 편안함과 안전을 개선할 수 있다. 설계 과정에 음성을 통합할 수 없었다면, 각 반복 작업은 두 배나 오래 걸렸을 것이고, 직관적으로 통합된 디자인이 아니라 덧붙인 기능처럼 느껴졌을 것이다.

음성 기술의 미래는 바로 눈앞에 와 있다. 우리는 이미 대부분의 현대 가정과 대부분의 직장이 스마트 음성 지원 기기를 채택하는 것을 보아 왔다. 그러니 미래가 바로 눈앞에 있는 지금, 디자이너들에게 음성 기술을 실험하고, 시도하고, 테스트하고, 프로토타입으로 구현하는 데 필요한 도구를 제공함으로써 정면으로 맞이할 때다. 더 많은 사람이 서로의 아이디어를 공유하고 그 위에 더해 갈 수 있을 때, 음성 혁신은 마침내 흐르기 시작할 것이다.
민주화된 프로토타이핑 역량이 있다는 것은 정체와 혁신의 차이다. 더 많은 사람이 접근할 수 있을수록, 더 많은 사람이 시도하고, 실험하고, 만들어 낸다. 프로토타이핑을 통해 아이디어는 현실이 될 수 있고, 음성 프로토타이핑을 통해 한때는 고통스러운 코드 줄로 설명해야 했던 것이 이제는 스스로 말할 수 있다.
음성 프로토타이핑 마스터클래스
음성 인터페이스의 힘과 그것이 사용자 경험을 혁신할 잠재력에 매료되셨나요? 고급 음성 프로토타이핑 마스터클래스에 참여하여, 음성 프로토타이핑 역량을 한 단계 끌어올릴 수 있도록 설계된 몰입형 온라인 과정을 만나보세요.
대화형 프로토타입의 세계에 몰입해 보세요. 음성 트리거와 애니메이션 제어를 통합하여 진정으로 매혹적인 사용자 경험을 만들어 내며 자신의 한계를 확장할 수 있습니다.





