트위터 사용자 유형 - 데이타 기반 퍼소나
데이타 기반 퍼소나
요즘 Lean UX 같은 사용자 데이타에 기반을 둔 디자인 방법이 대세입니다. 디자이너의 경험과 감이 아니라 사용자 행동으로 나타난 실제 피드백을 근거로 하므로 보다 신뢰를 얻고 있습니다. 하지만 여기에서의 사용자는 다양한 특성을 가진 개개인으로서의 사용자라기보다는 전체로서 통계화된 대상입니다. 사용자를 이해하고 문제가 무엇인지 찾는 과정보다는 문제의 해결을 실험해보는 과정에서 주로 사용되는 방법입니다.
좋은 디자인을 위해서는 우선 누구를 대상으로 하는지, 어떤 니즈를 해결해주려고 하는지 문제를 명확히 하는 것이 중요합니다. 그래서 사용자를 모델링 하여 대상을 명확히 하는 퍼소나 방법이 이제 UI/UX 디자인에서 거의 필수적인 과정으로 자리잡았습니다.
하지만 퍼소나가 실제 사용자의 데이타와는 상충될 수도 있다거나 같은 사용자 데이타를 가지고도 디자이너에 따라 다른 퍼소나가 나올 수 있다는 방법적인 약점에 대한 비판들도 있어왔습니다. 이는 사용자에 대한 정보 자체가 정성적인 조사 방법에 의존하고있고 도출 과정에서 주관적인 편향이 작용하는 것을 배제할 수 없기때문입니다.
이를 보완하기 위해서는 서비스 운영에서 수집되는 실제 사용자 데이타를 이용하는 것이 한 방법이 될 수 있습니다. pxd에서는 로그 데이타 기반 퍼소나를 기존 퍼소나를 보완하는 방법으로 과제에 적용하면서 좋은 결과를 얻고 있습니다.
트위터의 공개된 사용자 기록(트윗)을 이용해 사용자의 행태를 시각화하고 유형화하는 방법을 살펴보겠습니다.
로그 데이타를 통한 사용자 행태 재구성
사용자 유형을 만드는 데는 데이타 분석에서 주로 사용하는 전체 사용자의 정량적 지표가 아닌 사용자 개개인의 로그 데이타를 사용합니다. 로그 데이타로 남겨진 사용자 흔적을 재구성하여 사용 행태를 관찰하는데 활용합니다.
최근 온라인, 모바일 서비스들은 현장에서 사용자 행태를 직접 관찰하는 것이 어려워졌습니다. 사용 맥락도 하루 중 수시로, 도처에서, 걷거나 심지어 운전 중에도, 일어나자마자, 잠들기 전에, 화장실 같은 극히 개인적인 공간에서 사용이 일어납니다. 작은 화면에서 짧은 시간에 빠르게 작업이 이뤄져서 재현하더라도 무슨 일이 벌어졌는지 알기 어렵습니다. 경우에 따라 다이어리 스터디 같은 저널링을 통해 유용한 실마리를 얻기도 하지만 한계가 있었습니다. 로그 데이타는 사용자의 행태를 가장 성실하고 꼼꼼하게 기록한 다이어리 역할을 합니다.
사용자의 로그 자체도 개인정보이기 때문에 수집하는데 한계가 있습니다. 분석에 필요한 데이타가 결정이 되면 실사용자 중 테스터를 모집하고 동의를 얻어 사용 로그를 수집할 수 있게 변형된 앱을 설치하는 방법을 사용하기도 합니다.
트위터의 공개된 API로 사용 로그와 유사한 데이타를 얻을 수 있습니다. 사용자에 대한 정보, 사용자가 남긴 트윗에 대한 상세한 정보를 구조화된 형태로 받아올 수 있습니다. 사용자별로 최근 200개의 트윗을 받아서 분석에 사용했습니다.
사용 행태 시각화를 통해 사용자 유형 발견
유형화(clustering)한다는 것은 비슷한 특성끼리 모으고 또 다른 것을 나누는 작업입니다. 언어적이거나 수치적인 정보를 유형화하는데는 비용이 크지만 이것을 시각화하면 수월하게 처리할 수 있습니다. 시지각은 유사한 특성과 패턴을 병렬처리를 통해 빠르게 찾아내는데 최적화되어 진화되었습니다.
기존의 퍼소나 방법에서도 사용자 유형을 나누는데 시각화 방법을 활용합니다. 사용자 조사 결과에서 유의미한 행동 변수(특성)들을 추출하고 유사한 경향을 보이는 사용자를 그룹화하는데, 이를 위해 행동변수를 축으로하여 사용자들이 어느 정도에 위치하는지 표시하여 가까운 거리에 반복적으로 등장하는 유사한 성향의 사용자를 찾습니다.
하지만 사용자 수와 행동 변수가 많아지면 다양성이 더 크게 나타나 유형을 나누기가 모호해집니다. 유의미하다고 생각되는 행동 변수를 취사선택하여 단순화하는 작업을 필요로 합니다.
출처: About Face, Designing for the digital age
사용 행태를 볼 때는 사용자별로 시각화하여 사용 패턴이 드러나도록합니다.
사용 변수의 패턴이 드러나려면 많은 정보를 동시에 표시하면서 복잡해지지 않도록 해야합니다. 사용 행태의 특징이 드러나는 정보를 찾으면 그것을 위치,색상, 크기, 형태 등 시각적 특징(visual features) 중 하나와 맵핑하여 나타냅니다. 다차원적인 정보를 다차원의 시각 특징에 담아 섞이지 않게 하여 인지 비용을 줄여줍니다. 변수가 연속적이면 위치와 크기 같은 연속적 시각 특징을 활용하고 비연속적이면 색상,형태 등 비연속적 특징을 사용합니다. (색에서 명도와 채도는 연속적인 차이를 보이는데 사용합니다)
트위터에서는 우선 사용자들이 언제 얼마나 빈번히 트윗을 남기는지, 그것이 자신이 직접 쓴 것인지, 리트윗 한 것인지가 궁금했기 때문에 시간을 하루 24시간과 날짜, 2차원으로 나눈 위치 공간에 배치하고 트윗 유형을 색상을 이용해 구분 표시하는 걸 기본 구조로 잡았습니다. 위치는 중요한 시각적 자원이라 보통 시간은 1차원만 사용하고(x축) 그다음 가장 중요한 정보값을 다른 1차원(y축)에 나눠 배정하는게 일반적입니다. 대부분 그래프가 그렇죠. 여기서는 하루 주기의 패턴이 중요하다고 생각되어 2차원을 모두 사용했습니다.
트윗 사용 패턴 시각화
시각화는 애자일 방법으로 진행합니다. 실제 데이타를 적용한 시각화 결과를 보고 그다음 우선순위의 변수들을 찾아 추가하는 과정을 반복합니다. 유형을 나누는데 유의미한 정보가 무엇인지 찾기 전까지 알 수 없기 때문에 시도를 반복하는 게 최선의 방법입니다.
사진이나 동영상을 첨부하는 것이 리트윗 등 관심을 얻는데 주요한 요소인지 확인해보기 위해 기본 트윗 도트위에 사각 형태로 부속 속성을 주었습니다. 모바일인지 PC에서 사용하는지의 구분은 테두리로 표시하고 태그나 링크를 사용했는지는 텍스트로 표현했습니다. 이런 식으로 먼저 표시한 정보와 시각적 특징이 겹쳐지지 않도록 정보의 레이어를 쌓아 올리는 과정을 반복합니다.
시각화가 잘 되면 정보 요소들이 만들어내는 패턴을 통해 사용자의 유형이 스스로 드러나게 됩니다.
트위터 사용자 유형
트위터는 상호 친구 맺기가 아닌 구독하기(following) 모델을 사용합니다. 그래서 싸이월드나 페이스북처럼 오프라인 지인 기반으로 네트웍이 만들어지기보다는 관심사를 기반으로 새로운 네트웍이 형성됩니다. 별거 아닌 개인적인 일상의 소소한 자랑거리에도 내 친구들이 보여주는 따뜻한 반응에 익숙했던 사람들은 follower들의 냉혹한 무관심에 놀라고, 뉴스와 정보를 빠르게 얻을 수 있다는 말을 듣고 가입한 newbie들은 휑한 타임라인에 당황합니다. 카페나 커뮤니티는 관심 주제를 위한 하나의 공간에 사람과 정보가 모이기 때문에 수동적으로 정보를 소비하는 형태로도 참여할 수 있지만 트위터에서는 스스로가 능동적으로 관심을 위한 네트웍을 형성해야 합니다.
그래서 트위터를 분석할때 관심 내용인 키워드나 네트웍에 중점을 두고 분석하고 시각화하는 경우가 많았습니다. 하지만 그럴수록 개개인의 사용자는 잘 드러나지 않습니다. 수많은 데이타의 한 점이 되어 버립니다.
사용자가 남긴 트윗의 정보 요소를 추출해 사용자별로 시각화하면 사용자 유형이 확연하게 드러납니다.
아래는 두드러지는 유형을 몇 가지 모아봤습니다.
일반적인 사용 패턴
자기 트윗(파랑)도 하고 RT(초록)도 하고 다른 사람에게 멘션(보라)이 적당히 섞여 있는 형태가 됩니다.
애니프사
관심 분야 리트윗이 많습니다. 사진이 첨부된 트윗이 대부분입니다.(초록+노랑).
관심 주제에 깊게 몰입합니다. 오프라인에서의 실제 정체성을 드러내지 않고 프로필 사진으로 애니메이션 사진을 주로 사용해서 애니프사라고 합니다.
트윗 스트림을 샘플링 해보면 국내 트위터 사용자 중에 애니프사와 아이돌팬과 같은 팬덤이 가장 큰 비중을 차지합니다. 수동적으로 정보를 소비하는 사용자에 비해 압도적으로 트윗수가 많기 때문에 더 비중이 높아 보이는 면이 있기도 하지만요.
앞에서 얘기한 대로 트위터에서는 관심을 통해 네트웍이 형성되어 있기 때문에 트위터 사용자는 사실 모두가 덕질을 한다고 볼 수 있습니다. 그것이 자기 일과 관계있으면 실제 자기 정체성을 드러내고 그렇지 않으면 불필요하게 드러내지 않을 뿐입니다. 관심 주제에 열정적이지 않으면 트위터에서 흥미를 잃고 도태되어 살아남기 힘들거든요.
아이돌 팬덤
애니프사와 비슷하나 관심 주제가 아이돌입니다.
짧은 시간에 많은 트윗이 겹쳐있어 화면에는 적어 보이지만 하루 트윗수(104)가 많습니다
선별하여 리트윗하는 사용자와는 패턴이 확연히 달라서 리트윗을 페이스북의 "공유하기"보다는 "좋아요"에 가깝게 사용하는 것 같습니다.
동영상(빨강) 위주로만 리트윗하는 경우도 있습니다.
팬덤 컨텐트 생산자
직접 올리는 컨텐트 주로 아이돌 사진(파랑 + 노랑)이 많습니다.
멘션(보라) 비율도 높습니다. 정보를 공유하는 데 집중하는 사용자와 공통의 관심을 가진 사람들과의 소통을 중시하는 사용자 유형이 나뉩니다.
촉매자형 인플루언서
자기 트윗 비율이 높습니다. 링크로 관련 업계 소식을 전하는 비율이 높지만 단순히 큐레이션하여 소개하기 보다는 의견을 덧붙이는 것이 주가 됩니다. 정보를 단방향으로 전달만 하는 것이 아니라 관련 의견을 멘션으로 받고 선별하여 리트윗합니다. 팔로워들의 다양한 경험과 전문 지식을 매개하는 역할을 합니다.
작가
직접 컨텐트를 생산하는 크리에이터는 작업을 소개하는 채널로 사용합니다.
미디어 봇
정해진 시간에 정해진 양식(기사 요약+사진)으로 기계적으로 트윗합니다.
대부분의 미디어 계정은 예약 기능을 이용해 주기적으로 자사의 기사나 뉴스를 노출합니다.
불법 사이트 홍보용 봇
기존 사용자 계정을 해킹해서 팔로워들에게 광고를 뿌립니다. 언팔 당하지 않으려고 광고를 너무 자주 뿌리지 않는 꼼꼼함을 보입니다. 타임라인 노출 효율을 높이기 위해 한두 시간 간격으로 20개 정도씩 집중적으로 트윗합니다.
같은 로봇 계정을 서로 팔로우하고 서로 리트윗해줍니다.
스팸 필터에 걸리지 않기 위해 단어를 랜덤하게 짜깁기해 내용을 매번 다르게 작성합니다. 하지만 초보적 수준이라 이런 패턴은 쉽게 발견해 차단할 수 있을 것 같지만, 트위터에서는 별로 신경 안 쓰는 것 같습니다.
홍보용 계정
자사 상품 홍보(파랑+사진)와 고객 응대(보라)로 구성되어 있습니다.
업무니까 업무시간에만, PC에서 트윗합니다.
고객과 관심을 공유하는 홍보 계정
자사 출판 서적 홍보(파랑)만이 아니라 IT 관련 업계 소식을 리트윗 하며 고객과 공통의 관심을 가지는 계정이라는 정체성을 유지합니다.
인스타그램(노란색)에 연동만 한 계정
오프라인에서 많은 팬을 가지고 있는 celeb들은 하나의 추가적인 채널로서 트위터를 사용하기도 합니다.
정치인 계정
페이스북(진한 파랑) 연동이 대부분입니다.
대부분 본인이 아니라 사무실에서 계정 관리를 하다 보니 PC(테두리표시)에서 올리는 경우가 많습니다.
소통보다는 알림 채널의 하나로 사용합니다.
본인이 직접 관리하는 정치인 계정
본인이 직접 양방향 소통의 채널로 사용합니다.
공교롭게도 이번 총선에서 이 분은 당선되고 앞의 분은 낙선되었네요.
백악관
해쉬태그(#)와 관련 인물 간접 멘션(@) URL 링크를 활용하여 보다 자세한 정보를 제공합니다. 정부 업무나 행사, 정책에 관련된 것이면 다른 계정의 리트윗도 많이 합니다.
첨부된 사진의 경우 이슈에 대한 인포그래픽과 행사의 내용을 알 수 있는 참가자 위주의 사진을 주로 사용합니다.
청와대
사용 패턴만을 보면 대통령의 미니홈피 사진첩이 더 적합해 보입니다.
점심시간은 꼭 지킵니다.
고양이 계정
주인은 PC에서만, 고양이는 모바일로만 트윗합니다. 계정 바꾸기가 번거롭기 때문이겠지요.
사람 자체에 대한 관심보다는 그 사람이 생산하는 컨텐트에 관심을 가지고 팔로우하고 내가 관심없는 노이즈가 많아지면 언팔하는 구조다 보니 계정의 캐릭터를 집중해서 키워가는 양상을 보입니다. 그래서 멀티 계정을 운영하는 사용자들이 많습니다.
사용이 현저히 줄어드는 계정
남들의 반응(리트윗,라이크,멘션)이 없으면 트위터에 흥미를 잃어갑니다.서비스의 주 사용자 층 외에도 이탈하거나 사용이 줄어드는 사용자들만 뽑아서 패턴을 찾아보면 서비스 개선 인사이트를 얻는 데 도움이 될 수 있습니다.
사용자 유형으로부터 퍼소나 만들기
로그 데이타를 이용한 사용 행태의 유형화가 바로 퍼소나로 이어지지는 않습니다. 로그 데이타는 퍼소나를 만드는 ABC Attitude, Behaviors, Context 중 행위 위주의 정보만을 담고 있습니다. 기존의 정성적 조사를 병행하여 사용 맥락을 확인하고 또 로그에는 포함되지 않는 오프라인에서의 행태를 알아보고 보완할 필요가 있습니다.
데이타를 이용한 사용 행태 유형화를 먼저 진행하여 인터뷰 대상을 보다 구체화하고 참가자 섭외하는 데 활용할 수도 있습니다. 또 심층 인터뷰에서 맥락을 확인하는데 기억을 되살리는 데 도움이 되기도 합니다.
서비스를 디자인하는 데 있어 사용자를 이해하는 것이 무엇보다 중요합니다. 기존 퍼소나는 처음 서비스를 기획할 때 주로 사용하고 이후 서비스를 운영하면서는 lean startup과 같은 사용자 데이타를 활용해 서비스를 개선하고 최적화하는 방법을 사용합니다.
서비스 개선을 통한 성장 변화폭이 둔화하는 시점이라면 초기 목표로 삼았던 대상 고객과 현재 사용자의 구성이 달라졌을 수도 있습니다. 개선을 통한 부분 최적화를 계속 할 것이 아니라 로그 데이타 기반의 퍼소나로 다시금 사용자가 누구인지 이해하고 그로부터 서비스의 혁신 또는 피봇을 꾀하는 것이 필요할 수 있습니다.
현재 서비스를 운영하고 있었다면 우선 로그를 활용해 사용자 행태를 시각화하고 실제 사용자의 유형을 파악해 보는 작업을 해보는 게 어떨까요?
[참고##퍼소나##]