태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.


2018.06.21 07:50

UX World 2018 spring - Creating Innovative Customer Experiences 후기 2편



[Session 3] AI 스피커에서의 UX 역할 : 카카오미니 사례를 바탕으로

김보미 : AUX파트, UX 랩, KAKAO



2017년 미국인의 16%인 3900만 명이 AI 스피커를 사용하고 있습니다. 2년 전만 해도 사용자가 고작 1%였던 것을 고려하면, 폭발적인 성장세입니다. 국내 또한 AI 스피커 판매량이 100만 대를 돌파하였습니다. 음성은 학습 없이도 본능적이고 자연스러운 상호작용입니다. 이러한 굉장한 이점에도 불구하고, 화면 UX와 달리 눈에 보이지 않기 때문에 사용자의 인지가 많이 떨어집니다. 카카오에서 사용자의 인지를 높이기 위해 고민한 것을 1. 전체적인 음성 구조, 2. 어떻게 스피커가 사용자와 대화를 하며 답변을 유도하는지(대화 설계), 3. 사람들이 스피커를 어떻게 느끼게 해야 하는지(AI persona) 세 가지로 나누어 전달하고자 합니다.



1. Voice Structure

음성콘텐츠의 구조 4가지

알림소리

알람, 타이머

음성 답변

TTS

음악 재생 콘텐츠

뉴스, 팟캐스트

음악형 콘텐츠

음악, 라디오

빠른 인지가

필요한 콘텐츠

짧고 즉각적인

정보 콘텐츠

내용 전달이

중요한 콘텐츠

감상형 콘텐츠

콘텐츠 속성에 따라 우선순위를 부여하여 음성콘텐츠들이 유기적으로 연결될 수 있도록 하였습니다.


볼륨인지그래프

사실상 사람이 느끼는 볼륨인지 그래프는 비례하지 않습니다. 사용자들은 음성이 낮을 때는 볼륨이 조금만 커져도 많이 커졌다고 느끼고, 크게 듣고 있을 때는 많이 커져야 차이를 느꼈다고 합니다. 그래서 카카오 미니는 볼륨 구조를 직선의 형태가 아니라, 유선적인 형태로 제공하고 있습니다. 또한, 음악은 감성형 콘텐츠이기 때문에 작거나 크게 듣고 싶은 사람이 있지만, 음성 답변은 정보성 콘텐츠이어서 대부분 사람들이 일정한 크기로 듣고 싶어 하였습니다. 그래서 음성 답변은 적당한 크기로 제공할 수 있도록 설정하였습니다.



연속적인 대화

"카카오, 7시에 깨워줘" "7시에 알람 맞췄어요." "내일 날씨 어때?" "낮에는 쌀쌀할 것 같아요.

카카오 미니는 스피커를 한번 부르면, 다시 부르지 않아도 되는 '이어 말하기' 형태를 제공하고 있습니다. 카카오 미니는 대화가 연속적으로 이어집니다. 불필요한 호출 명령어를 제하여 마치 친구와 대화하는 것처럼 감성 대화를 시도하고 있습니다. 이러한 대화를 통해 사용자는 좀 더 카카오 미니에 애착을 가질 수 있고, 잡담이나 감성 대화를 나눌 수 있도록 중요한 역할을 차지하고 있다고 생각합니다.



2. Conversation Design

의미는 상황에 따라 달라진다.

CASE 1 )"카카오, 내일 날씨 어때?" "낮에는 쌀쌀할 것 같아요." "다시." "낮에는 쌀쌀할 것 같아요."

CASE 2 ) (음악 재생 중) "카카오, 내일 날씨 어때?" "낮에는 쌀쌀할 것 같아요." ……. "다시." "음악을 다시 재생합니다."

시간 간격에 따라서 사용자 발화의 의미가 달라집니다. 사용자의 발화는 똑같지만 어떤 음악을 듣고 있는지, 이전에 대화를 한 시간과 간격이 얼마나 있는지, 사용자의 같은 발화여도 여러 가지 상황을 고려하여 다르게 가이드를 제공하고 있습니다.


짧을수록 좋다.

"토르에 출연한 헐크는 누구야?" "마크버팔로우는 토르:라그나로크의 헐크역에 출연해요."

최대한 사용자의 답변을 가능한 짧게 구성하였습니다. 아무것도 보이지 않는 상황에서 사람의 듣기 집중력은 10~15초가 한계라고 합니다. 또한 답변을 전부 집중해서 듣지 않고, 처음만 듣고 떠나거나 끝부분만 듣고서 결과를 판단하기 때문에, 의미 전달을 위해 최소화한 정보를 전달하고자 하였습니다. 또한 중요도에 따라 처음과 끝에 중요한 정보를 배치하였습니다.


불확실성은 회피한다.

"짜증 나." "짜증 날 땐, 초콜릿이 좋대요."

사용자가 '짜증 나'라고만 발화하였을 때, '내가' 짜증이 난다는 건지, '네가' 짜증이 난 건지, 짜증이 났냐고 물어본 것인지, 주체에 따라 여러 가지 의미가 될 수 있습니다. 이에 카카오 미니는 잘못된 메시지를 송출하는 것보다, 가능한 준비된 메시지를 사용하고자 다양한 발화에 답할 수 있도록 화제 전환을 하는 방법을 택하였습니다.



3. AI Persona

왜 여성 목소리인가

사람은 일반적으로 여성 목소리를 더 선호한다고 합니다. 여성 또한 동성의 목소리를 선호했다고 하네요. 또한, 모든 사람이 좋아하는 남성 목소리보다 여성 목소리를 찾기가 더 쉽기 때문에 여성의 목소리를 선택하였습니다.


퍼소나를 부여하라

"카카오, 몇 살이야?" "노코멘트! 그냥 젊다고만 알아주세요!" "너 인간이야?" "내 이름은 카카오, ai죠!"

모든 AI가 각기 다른 성격을 가지고 있습니다. 알렉사의 경우 차분하고 전문가다운 핸드폰 비서의 느낌이며, 구글 홈은 여유 있고 친근한 친구로 느껴진다고 합니다. (구글 홈은 퍼소나를 중요하게 생각하여 픽사의 스토리텔러까지 고용했다는 기사도 있었다고 합니다.) 카카오 미니의 프로필은 다음과 같습니다.


이러한 큰 가이드라인을 작성하고, 사용자의 예상 질문과 답변을 도출하면서 퍼소나를 구체화하였습니다. 또한 어조와 말투의 표현 가이드를 통해 일관성 있는 답변을 유지하고자 하였습니다. 그리고 좀 더 긍정적이고 밝은 성격임을 나타낼 수 있게 목소리 톤을 높게 설정하고, 다양한 어조를 사용하도록 하였습니다.


어조로 감정을 전달한다

"카카오, 오늘 며칠이야?" "오늘은 6월 11일이에요." "멍청이." "부족하지만, 너무 미워하지 마세요"

정보에 대해 답변을 할 때는 전문적이게 감정 없이 전달하며, 일상 대화를 할 때는 연기 톤을 추가하여 퍼소나를 느낄 수 있도록 하였습니다. 실패 메시지를 송출할 때도, 약간 미안한 어조로 말을 하여 감정을 나타낼 수 있도록 하였습니다. 그리고 어조가 너무 차이 나지 않고, 같은 사람처럼 느껴질 수 있도록 균형을 유지하고자 하였습니다.


아직은 기술적인 한계로 인해 사람이 직접 1:1 답변을 만들고 있어 아쉬운 점이 많지만, 언젠가 her의 사만다, 아이언맨의 자비스처럼 직접 사고를 하는 AI가 상용화되고 디스플레이와 결합하어 조금 더 편하게 사용할 수 있는 시대가 오길 바랍니다.





[Session 7] WAYMO DESIGN

Matthew Corey Hall : Visual Designer, Waymo

웨이모의 LOGO. 주행을 의미하는 W의 형태를 나타내고 있습니다.


자율 주행 자동차는 운전자가 차량을 운전하지 않아도 스스로 움직이는 자동차를 말합니다. 한국에서도 2016년 2월 12일 자동차 관리법 개정안이 시행되면서 자율주행차의 실제 도로주행이 가능해졌습니다. 현대자동차의 제네시스는 실제 도로주행을 허가받은 제1호 차로 국토교통부가 지정한 고속도로 1곳과 수도권 5곳 등을 시험운행 중이라고 하네요.


아직은 자동차 자율 주행에 관해 우려하는 시선이 많습니다. 그러나 일반적인 교통사고의 이유는 인간의 실수가 94%를 차지하고 있습니다. 사람보다 수억 개의 데이터가 교통사고의 예방에 더욱 효과적이지 않을까요? 또한, 자율 주행 운전은 혼자서 운전할 수 있는 '자동차'를 만드는 것이 아닌, 경험을 통해 더 나은 '운전자'를 설계하여 경제 소득과 신체장애 관계없이 누구나 쉽게 이동할 수 있도록 돕는 것이 궁극적인 목표입니다. 구글사의 웨이모는 6억 마일의 자동주행 경험과 2만 건의 테스트 시나리오, 5억 마일의 시뮬레이션을 통해 유능하고 신뢰성 있는 운전자를 설계하고 있습니다.



자율주행의 5단계 레벨

(1) 운전자 지원-(2) 부분 자율 주행-(3) 조건부 자율 주행-(4) 고급 자율 주행-(5) 완전 자율주행


자율 주행에는 5가지 단계가 있습니다. 현재 자율 주행의 레벨 수준은 2~3단계로, 고속도로 같은 단조로운 길만 운전할 수 있으며, 급박한 사고를 대비하여 항시 사람이 핸들을 잡고 있어야 합니다. 그러나 사용자들은 기술을 너무 믿고 잠을 자거나 휴대폰을 사용하는 등, 레벨에 따른 가이드라인을 따르지 않는다고 합니다. 그래서 자율 주행 기업들은 완전하고, 안전한 자율 주행을 위해 4~5단계의 레벨을 목표로 상용화를 준비하고 있습니다.



핸들을 잡지 않고 휴대폰을 만지는 목숨이 2개인 운전자의 모습



위의 자동차는 웨이모의 프로토타입이었던 '코알라'. 정말 코알라를 닮았네요.




차의 센서를 통해 출력된 엔지니어 개발뷰


기존의 운전자가 있는 차량에서는 어디로 향하고 있는지 차가 막히는지 운전자에게 물어볼 수 있고, 운전자의 보디랭귀지를 통해 예상을 할 수 있지만, 자율 주행에서는 운전자가 없는 경우 뒷좌석의 탑승자는 내비게이션을 통해 정보를 습득하여야 합니다. 그렇기 때문에 사용자를 안심시킬 수 있는 스크린을 제공합니다. 주행 상황을 이해하기 쉽도록 360도, 300m 앞까지 볼 수 있습니다.



불필요한 정보는 삭제하고, 적절한 정보를 지속해서 제공하며 탑승자의 이해를 돕고 있습니다. 탑승자는 이동 중이기 때문에 화면을 보기에 피곤하지 않도록 조명과 그림자를 조정하였습니다. 위의 이미지처럼, 횡단보도를 건너는 보행자, 주변 구조물과 하차를 할 구역 등 탑승자에게 필요한 정보만을 나타내고 있습니다.




이제 트럭을 자율 운전할 수 있도록 준비하는 과정에 있다고 합니다. 자율 주행은 기존의 교통법규보다 더 많은 규제를 하고 있고, 무엇보다 아직 법규가 만들어지지 않는 부분이 많아, 여전히 제약이 많다고 합니다.


웨이모가 실제 주행 중인 유튜브 영상도 함께 [링크]로 전달 드립니다.

0.01%의 확률이어도 사고가 난다면 누구에게 책임을 물어야 하는지, 그리고 급격하게 변화하는 날씨에는 기술적으로 어떻게 대응을 할 수 있을지, 아직은 해결해야 할 문제들이 있습니다. 누구나 신체적인 제약 없이 자동차로 이동할 수 있는 세상이 온다면, 내비게이션의 유니버설 디자인을 위해 많은 공부가 필요해질 듯합니다. 하지만 자동주행 자동차가 상용화될 시기가 생각보다 멀지 않은듯하네요.


궁금한 점이 있으시다면, Matthew Corey hall의 인스타그램을 통해 소통하시는 것도 좋을 것 같습니다. :)

@grafik__


* 모든 이미지 자료 출처는 UX World 2018 spring 컨퍼런스 최종 발표자료입니다.





[참고##국내교육##]



팀블로그 pxd Story 구독 방법  블로그 글은 각 개인의 생각이며 피엑스디와 다를 수 있습니다.


Trackback 0 Comment 2
  1. 노트테이커 2018.06.21 23:49 신고 address edit & del reply

    Apple의 siri를 사용하면서 가장 불편했던 점이 이어말하기였습니다. 매번 hey siri를 통해 자고있는 시리를 깨워야 하다보니 점점 사용을 안하게 되더라구요... 또한, 영어발음에 대한 불편함도 있었구요 :(
    (나름대로 발음에 대한 자신감이 있었는데,,, 시리땜에 자신감 하락을 몇번 겪어보기도 했다는 점... ㅎ)
    포스팅 글 유익하게 읽고갑니다 ;)

    • um yejin 2018.06.25 18:43 신고 address edit & del

      안녕하세요 노트 테이커님!

      사용 중이신 제품이 애플 ai 스피커 홈팟이신가요? 아직 국내 정식 발매가 되지 않아 개인적으로 매우 궁금한 스피커입니다. ^^

      아마존사 알렉사의 경우, '이어 말하기'(스피커에게 처음 말을 걸 때만 호출 명령어를 사용)과 '단발성(일회성)'(스피커에게 말을 걸 때마다 호출 명령어를 사용) 두 가지 옵션을 모두 제공하고 있다고 합니다. 카카오에서도 이에 대해 많은 고민을 하였는데, 사내 테스트 과정에서 많은 분이 스피커에게 이어 말하기로 말을 걸었다고 하네요. :)

      프로페셔널한 음성비서라고 하지만 아직은 기술의 한계 때문에 커뮤니케이션하는 과정에서 답답할 때가 많습니다. 심지어 사람이 일일이 1:1 매칭 답변을 만들어줘야 하는 점은 21세기답지 않기도 하죠.

      긴 글을 즐겁게 읽어주셔서 감사드리고, 앞으로도 종종 들려주세요. ^^

Ad Test...