귀와 입만 사용하는 UX: 아마존 에코

2015. 10. 13. 07:50리뷰
알 수 없는 사용자


에코는 아마존(Amazon)이 2014년 11월에 발표한 음성 비서 기능을 제공하는 거치형 스피커로서, 쉽게 말해 프링글스만한 스피커 안에 시리(Siri)같은 걸 집어넣었다고 생각하시면 됩니다. 이제 시리같은 음성비서 서비스는 우리에게 어느 정도 익숙하니, 굳이 설명하지 않아도 어떤 느낌인지 감이 오실 겁니다.

문제는 스마트폰에 비해 훨씬 크고, 무겁고, 전원 코드도 꽂아야 해서 들고다닐 수도 없고, 전화/문자도 안되고, 화면도 없는 그런 기기를 아마존은 무슨 자신감으로 이런 뒤늦은 시점에 내놓았느냐 입니다.

보통 이런 종류의 ‘제품’만으론 이해하기 어려운 자신감은 ‘제품을 둘러싼 맥락’을 함께 볼 때 이해되는 것들이기 마련입니다. 이번 글에선 일단 먼저 ‘제품' 자체에 대한 이야기를 나누어 보고자 합니다.


-
1줄 요약:
‘귀와 입만 사용하는 UX’를 통해 우리는 ‘화면이 없다'와 ‘움직일 수 없다'가 왜 아마존에 의해 다분히 의도된 에코의 포지셔닝 키워드인지 일부 이해할 수 있다.
-


1. 뭐가 다른가?


이미 시리와 같은 음성비서 서비스가 보편화된 상황에서 제품에 관한 모든 이야기를 구구절절이 나누기 보단 좀 더 핵심적인 차이점에 집중하고자 합니다. 기본적으로 에코 역시 시리와 같은 음성 비서 서비스를 제공하는 블루투스 스피커로서 소프트웨어적으론 크게 다르지 않습니다. 또한 에코 역시 스마트폰과 연동되어 있고 어플 내부적으로도 계속해서 기능을 추가할 수 있기 때문에 기능적 확장성이 보장된 상황에서 소프트웨어적 차이를 이야기하는 건 큰 의미가 없습니다. 따라서 이런 땐 하드웨어에서 생기는 차이점에 그 초점을 맞추어야 합니다. 바로 에코는 화면이 없고, 움직일 수도 없다는 점입니다.

핵심 차이 1: 화면이 없다



<왼쪽: 마이크를 끌 때, 오른쪽: 알람을 끌 때, 아랫쪽 원형부분이 볼륨 조절 휠>
딱 봐도 누구나 알 수 있듯이 에코는 애초에 손으로 만지면서 쓰라고 만든 기기가 아닙니다. 외부 물리 버튼이라곤 마이크를 끌 때(전원 버튼과 같은 것으로 거의 쓸 일이 없습니다), 알람을 끌 때(음성으로도 끌 수 있습니다) 사용하는 2개의 버튼과 볼륨 조절 휠, 그리고 리모콘이 전부입니다. 스마트폰의 경우 비슷한 구성이지만 화면을 통해 풍부한 인터랙션을 제공한다는 걸 생각해볼 때, 비슷한 구성에 화면 조차 없는 에코는 모든 인터랙션을 오로지 음성에만 집중하도록 되어 있다는 걸 알 수 있습니다.


핵심 차이 2: 움직일 수 없다



<pxd 로비에 고정되어 있는 에코>

손에서 자유로워짐은 곧 사용자와의 물리적인 거리 제한에서 자유로워짐을 뜻합니다. 때문에 에코는 들고 다녀야 한다는 부담을 훌훌 털고 전원 코드를 꼽아야만 동작하는 '거치형' 기기로 디자인되어 있습니다. 모바일이라는 상위 선택지가 일반화된 상황에서 당당히 거치형을 택했다는 점에서 우린 바로 이 부분에 주목할 필요가 있습니다. 사실 이 부분이 바로 '제품을 둘러싼 맥락' 즉, 아마존의 비즈니스 모델과 스마트홈 허브 경쟁을 함께 고려했을 때 이해되는 부분입니다. 그것은 나중에 기회가 되면 좀 더 나눌 수 있도록 하고, 일단 '제품' 관점에서 두번째 핵심 특징으로 기억합니다.


귀와 입만 사용하는 UX


결국에 두 가지 핵심 차이를 묶어내면 한 자리에 고정해둔채 주로 음성을 통해 입/출력이 이루어진다는 점이 하드웨어적으로 에코가 가지는 핵심적인 포인트임을 알 수 있습니다. 즉, 고정된 자리에서 눈과 손을 쓰지 않고 귀와 입만으로 인터랙션이 이루어지는 것입니다. 그럼 지금부터 이러한 UX가 사용자 관점에서 어떻게 다른 양상을 만드는지 이야기 나누어봅니다.


2. 어떻게 다른가?


기계에서 인격체로


<대화 경험은 기계를 하나의 인격체로 받아들이게 만든다>
아이폰 안에 시리가 살 듯이, 에코 안엔 알렉사가 살고 있습니다. 그래서 명령을 내릴 때 ‘Echo,’라고 부르지 않고 ‘Alexa,’라고 부르게 됩니다. 명령을 내릴 때마다 입으로 알렉사를 부르기 때문에 실제로 반복해서 알렉사를 부르다보면 머릿 속에서 점차 에코는 희미해지고 그 자리에 알렉사가 자리하는 경험을 하게 됩니다.
나아가 대화 경험이 사용 경험 전반을 이끌다보니 자연스럽게 알렉사를 점점 하나의 기계에서 하나의 인격체로 대하게 됩니다. 애플이 시리가 시리 자신에 대한 질문에 대응할 수 있도록 하고, MS도 코타나(Cortana)가 18가지 UI를 통해 자신의 감정을 표현할 수 있도록 하고, 영화 ‘HER’에서 가상 비서와 사랑에 빠지는 설정이 등장하는 것은 대화가 이끄는 UX가 사용자에게 어떤 경험을 선사하는지 보여주는 예입니다. 특히 알렉사의 경우 오로지 대화를 통해 소통하기 때문에 이와 같은 인격체로서의 인식 경험이 더욱 두드러집니다. 비슷한 예로 PC보다 아이패드를 통해 쇼핑하는 사람이 화면 터치가 만드는 소유효과로 인해 제품을 좀 더 높은 가치로 인식했다는 연구도 있었는데, 인터랙션 형태에 따라 제품과의 애착 관계 형성 양상이 변화할 수 있다는 점은 UX적으로 여전히 흥미로운 부분입니다.


스마트폰은 터치하고 에코에겐 말을 걸고



<운전하면서 라디오 듣는 것과 같은 느낌이랄까>

화면을 아예 제거하고 음성으로만 인터랙션 창구를 열어놓다보니, 한 자리에서 스마트폰과 자연스럽게 공존하게 됩니다. 오히려 에코가 화면을 가지고 있었다면 마치 아이패드가 뻔히 옆에 있는데 스마트폰을 만지고 있는 것 같은 애매한 상황이 되었을 텐데, 애초에 화면 자체가 없다보니 인터페이스가 겹치지 않아 둘의 공존에 큰 무리가 없습니다. 그냥 평소처럼 스마트폰을 사용하며 생활하다가 알렉사가 필요할 때 주저없이 불러서 일을 처리하면 됩니다. 이렇게 에코는 스마트폰을 어설프게 대체하기보단 함께 공존하는 길을 택합니다.


입출력 수단으로서 소리의 한계: 간섭



<에코와 리모콘 Image via CNET.com>
입출력 수단으로서 소리의 한계에 관한 이야기는 음성 비서 서비스 모두에게 해당하는 내용입니다만, 특히 음성 입/출력에 전적으로 의존하는 에코에게는 더더욱 중요한 내용이 됩니다. 먼저 기본적으로 소리를 통해 입출력이 이루어지는 에코의 특성상 소리의 간섭으로 인해 생기는 한계는 명확합니다. 주변 소음 수준이 높은 상황에선 명령을 내리는 것, 답변을 듣는 것 모두 어려워집니다. 에코의 경우 이러한 불편함을 최소화하기 위해 상단에 무려 7개의 마이크를 원형으로 배치하여 잘 들을 수 있도록 배려하였고, 원통의 크기의 대부분을 스피커에 할애하여 잘 들릴 수 있도록 배려하였습니다. 또한 마이크를 통해 원격으로 음성 입력이 가능하도록 배려하여 소리가 도달가능한 범위가 가지는 한계를 해소할 수 있도록 배려하였습니다. 실제 사용해본 결과 음악이 흐르거나 알람이 울리는 도중에도 알렉사라고 부르는 것에 잘 응답하고(같은 상황에서 시리는 응답하지 않았습니다.) 스피커는 최대 볼륨의 경우 일반적인 거실 크기 정도는 꽉 채울 만큼의 큰 소리가 출력됨을 확인할 수 있었습니다.


입출력 수단으로서 소리의 한계: 발음



<거리를 부피로 바꿔달라니, 무슨 말씀이신지: 발음 탓에 gallon을 kilo로 알아들은 에코>
발음을 잘못 알아듣는 것은 음성 입력 수단의 고질적인 문제점입니다. 오늘날까지도 이러한 불편함은 완전히 해소되지 못했습니다. 특히 음성 인터랙션에 있어 이 문제가 더욱 심각한 건 오작동을 한 눈에 확인하고 만약의 경우 취소 및 돌아가기 과정이 터치 한 번으로 이루어질 수 있는 화면 인터랙션에 비해, 음성 인터랙션은 오작동 여부를 판단하고, 취소 및 돌아가기 과정을 소화하기 위해 더 많은 시간과 더 높은 주의를 필요로 하기 때문입니다. 이처럼 아예 첫 대면에서부터 인터페이스가 오작동한다는 것은 UX에 굉장히 치명적이기 때문에 이것을 한 번 경험해 본 사람들은 좀 불편하더라도 더 익숙하고 확실한 구세대의 인터페이스를 여전히 선호하게 됩니다. 따라서 사실 음성 입력은 오히려 터치 입력보다도 더 높은 정확도를 지녀야 하는 것입니다.


입출력 수단으로서 소리의 한계: 사용법 숙지



<주인님, 이렇게 말씀해주셔야 합니다>

나아가 발음과 관련된 문제가 완전히 해소되었다하더라도 음성 입력 수단이 넘어야 할 산은 또 있습니다. 바로 사용법 숙지의 장벽입니다. 시각적으로 뭘 할 수 있고 어떻게 하면 되고가 명확히 보이는 화면 입력과 달리 음성 입력의 경우 뭘 할 수 있고 어떻게 하면 되고를 미리 숙지하고 있어야 합니다. 즉, 그냥 말만 하면 될 것 같아 보이지만 사실은 어떻게 말해야 하는지를 또 배워야 한다는 것입니다. 따라서 사용법 자체를 통째로 숙지하고 있어야 한다는 점에서, 사실 음성 인터랙션은 오히려 화면 인터랙션보다 더 높은 진입 장벽을 가지고 있는 것입니다.


입출력 수단으로서 소리의 한계: 입출력 정보 형태의 한계



<말씀하신 '우유' 관련 제품이 정확히 이백십칠만사천삼백구입육개있습니다. 첫번째 제품의 이름은..>
음성으로 취급하기에 적합한 정보 형태가 가지는 한계도 명확합니다. 음성 입력의 경우 명령문의 종류와 이에 필요한 몇 가지 파라미터로 구성된 문장 형태를 취하는 것이 현재 수준이기 때문에 '단순 명령, 정보 확인'보다 높은 차원의 정보 입력이 이루어지기 어렵습니다. 음성 출력의 경우에도 아직 맥락에 따라 정보를 가공하는 수준이 낮기 때문에 '단순 정보 확인 및 보고' 이상의 정보 출력이 이루어지기 어렵습니다.


가장 적합한 공간: 주방에서의 쓰임새



<에코 소개 영상에도 주방 씬이>

집 안에서 눈과 손을 쓰지 않고 귀와 입만으로 이루어지는 UX가 놓이기 가장 적합한 공간은 어디일까요? 거실에선 TV가 눈과 귀를 점유할 것이고, 각자의 방에선 PC와 스마트폰, 이어폰 등의 다양한 도구들이 최소한 눈과 손, 귀 정도는 점유할 것입니다. 결국에, 눈과 손의 점유권을 내어주고 귀와 입만으로 인터랙션을 만들어나가기에 가장 적합한 공간은 주방임을 알 수 있습니다. 요리와 식사는 눈과 손을 점유하되, 귀와 입을 점유하지 않는 대표적인 행동들입니다.

<멀티 타이머 기능>
그래서인지 에코엔 주방에 좀 더 적합할 수 있는 기능들이 몇 가지 담겨 있습니다. 먼저 일반적인 스마트폰의 타이머와 달리 멀티 타이머 기능을 제공합니다. 하나의 타이머를 설정해두고 다시 타이머를 한 번 더 설정하면 자연스럽게 ‘두번째 타이머를 설정합니다.’라고 이야기하며 동시에 두 개의 타이머를 진행시킵니다. 요리를 하다보면 하나를 올려두고, 또 다른 하나를 진행하다 이전 것을 잊거나, 혼란스러워하는 상황이 발생하기 쉬운데 이런 면에서 알렉사는 손쉽게 여러 요리를 빠짐없이 시간을 체크하며 진행할 수 있게 도와줍니다.

<이 정도는 기본>
계량 단위 변환 역시 지원합니다. 단위 변환 뿐만 아니라 단순 내용 검색 기능도 지원하기 때문에 스마트폰 속 레시피를 바라보며 요리하다가 간단히 검색해볼만한 내용이 생겼을 때 곧바로 에코에게 말로 물어보고 귀로 답을 들으며 요리를 진행할 수 있습니다. 이는 화면을 전환해서 시리에게 물어보거나 검색어를 손으로 입력했다가 다시 레시피 화면으로 돌아오는 것에 비해 훨씬 쾌적한 경험입니다.

<쇼핑리스트. 일부 품목은 아마존 프라임을 통해 바로 재구매 가능>
쇼핑리스트 관리는 요리를 위해 특화된 기능은 아니지만, 나름 편리한 상황을 연출할 수 있습니다. 요리에 필요한 재료 목록을 준비하거나, 요리하다 중간에 떨어진 재료를 발견했을 때 음성으로 추가할 수 있습니다. 이는 손으로 재료를 정리하다말고 그때마다 스마트폰을 오가는 것에 비해 훨씬 손쉬우며, 일부 품목의 경우 아마존과 연계하여 바로 재구매할 수도 있어 편리합니다.

<냉장고 안에 카메라를 설치하여 스마트폰/패드로 내부 모습 관찰 By Siemens, Image via reviewed.com>

<냉장고 문의 일부를 유리로 처리하여 직접 관찰 By Haier, Image via CNET Korea blog>
최근 IFA 2015에 등장한 냉장고들에서도 볼 수 있듯이 냉장고안 식자재 파악/관리에 대한 니즈 대응이 서서히 이루어지고 있는데 이 과정에서 가장 큰 화두는 '뭘 넣었는지 어떻게 알거냐'입니다.

<터치 인터페이스를 장착한 스마트 냉장고>

이걸 해결하기 위해 터치스크린으로 냉장고를 드나드는 식품 정보를 입력하도록 한다면 그 자체로도 번거로울 뿐만 아니라 식자재를 넣는 손과 터치스크린에 정보를 입력하는 손의 점유가 겹치면서 불편한 상황이 연출될 수 있습니다. 이런 면에서 에코가 항상 주방에 상주하며 냉장고 안에 유통기한 등의 관리가 필요한 무언가를 넣거나 꺼낼 때 음성을 통해 자연스럽게 기록할 수 있게 한다면 인터페이스 수단이 겹쳐서 생기는 불편함을 어느 정도 해소해낼 수 있을 것입니다.



<Image via obrella.com>
그리고 무엇보다 스마트홈 환경이 구축되었을 때에야 비로소, 에코가 가진 주방에서의 잠재력이 충분히 드러나게 될 것입니다. 왜냐하면 눈과 손, 귀와 입과 같이 각각이 독립된 입출력 채널들의 공존은 곧 멀티태스킹이 가능해짐을 의미하기 때문입니다. 에코에게 있어 스마트홈 환경은 집 안에서 이러한 멀티태스킹 효과를 체감할 수 있도록 해주는 대표적인 충분 조건입니다. 요리하다말고 밀가루 묻은 손을 씻고 현관까지 가서 문 열어주고 다시 돌아와서 가스레인지 불 줄이고 세탁기 다 돌았는지 확인하러 다시 나갈것이 아니라 바로 그냥 선 자리에서 입으로 주방과 온 집안을 통제하고 귀로 상황을 보고 받는 것입니다. 눈과 손은 여전히 요리에 집중한 채로 말이죠.


3. 현재의 ’제품'만으론 아직 갸우뚱, ’제품을 둘러싼 맥락’으로 미래를 함께 봐야


음성 비서 기능이 포함된 블루투스 스피커 제품 자체로만 봤을 때 디자인, 마감, 설치/이용 UX도 훌륭한 수준입니다. 하지만 기능적으로 음성 비서 기능과 블루투스 스피커 기능은 각각 스마트폰과 블루투스 스피커 제품 조합으로도 충분히 이용가능하므로 스마트폰이 이미 있는 사람에겐 가격적으로 불리한 선택이(에코는 180$이며 블루투스 스피커는 그 절반인 90$ 이하로도 선택가능한 좋은 제품이 많습니다.) 될 수 있습니다. 또한 우리나라에선 아마존의 서비스를 완전히 제공받을 수 없으니 불리함은 더욱 커질 수 있습니다. 따라서 ‘제품'만 놓고 보았을 땐 아직까지 구매하기에 갸우뚱한 느낌이 듭니다.

하지만 이것만으로 에코를 속단하기엔 너무 이릅니다. 비교하자면 지금의 에코는 아이팟(iPod), 곧 다가올 미래의 에코는 아이폰(iPhone)과 같습니다. 앱을 언급하지 않고 아이폰 리뷰를 하는 것이 얼마나 의미없는 것인지 우리가 알고 있듯이 ‘에코를 둘러싼 맥락', 즉 아마존의 비즈니스 모델과 전략, 스마트홈 허브로서의 포지셔닝을 함께 이야기해야 에코 역시 그것의 가치를 제대로 다룰 수 있습니다. 이번 글에선 이러한 부분을 배제하고 순수 ‘제품'에 대해서만 이야기를 다룬 만큼 아이팟 리뷰를 보며 아이폰이 만들 미래를 놓치는 우를 범하는 일이 없으시기 바랍니다.

그래도 이번 글을 통해 ‘귀와 입만 사용하는 UX’가 사용자 관점에서 어떻게 다른 양상을 만드는지 이해하는데 있어 작은 도움이 되셨길 바라며 나중에 기회가 되면 ‘에코를 둘러싼 맥락'에 대해서도 함께 이야기를 나누어보도록 합니다.


[참고##서비스 디자인##]