[pxd talks 70] 게임 속 데이터 분석을 통한 사용자 경험 설계

2017. 3. 30. 07:50pxd talks
알 수 없는 사용자


2016년 11월, 엔씨소프트 데이터분석 모델링팀 이은조 팀장님이 pxd에 방문하여, ‘데이터 분석을 통한 게임 유저 모델링’라는 주제로 강연을 해주었습니다. 엔씨소프트에서는 많은 MMORPG를 서비스하고 있는데, MMORPG라는 하나의 거대한 가상 세계에서 유저들은 다양한 데이터를 만들어내고 있었습니다. 이은조 팀장님은 유저들이 게임을 플레이하며 만들어내는 데이터에서 게이머들의 유형과 행동 패턴들을 추적하고, 이러한 데이터 분석을 통해 인사이트를 도출하는 작업을 담당하고 있었습니다. 이번 pxd Talks는 엔씨소프트가 어떻게 데이터를 분석하는지와, 발견한 인사이트의 활용 사례를 볼 수 있는 강연이었습니다.



데이터 분석을 통한 게임 유저 모델링

연사님이 첫 번째로 소개해준 것은, ‘데이터 분석을 통한 게임 유저 모델링’입니다. 게임 유저를 이해하기 위해 정성적인 방법과 정량적인 방법을 모두 사용하는데, 연사님은 정량적인 게임 데이터 분석을 통해 유저를 이해하는 파트를 담당하고 있었습니다.

강연을 시작하면서 ‘분석’과 ‘모델링’에 대한 사전적 의미를 소개해주었습니다. 사전적 의미를 보면, ’분석’은 ‘얽혀있거나 복잡한 것을 풀어서 개별적인 요소나 성질로 나눔’이고, ‘모델링’은 ‘대상을 좀 더 단순한 형태로 본떠 만듦’입니다. 게임 유저 분석은 게임 유저들이 게임에 접속해서 만든 데이터를 나누고 분리해서 단순한 형태로 구체화하는 것입니다. 게임 유저 분석을 하는 목적은 ‘우리의 게임 유저는 누구인가?’를 이해하는 것입니다. 게임을 이용하는 유저가 누군지 정확히 알고 있어야, 게임을 운영하는 데 있어서 그들에게 원하는 서비스를 제공하거나 미래의 전략을 구체적으로 구상할 수 있기 때문입니다. UX를 하는데도 이 목적과 크게 다르지 않다고 생각합니다. 사용자가 정확히 누구인지 알아야, 그들을 이해하고 공감해서 더 나은 서비스를 제공해 줄 수 있다고 생각합니다.

게임유저가 누구일지 머릿속으로 그리면, 많은 사람이 ‘모니터에 집중하고 있는 20~30대 남자’라는 이미지로 추상적으로 생각하는데 실제 데이터로 보면 그것이 정확하지 않을 수도 있습니다. 단순히 전형적인 틀로만 유저를 이해하는 것은 실제 유저와 다를 수도 있으므로 위험할 수도 있습니다. 실제 게임에서는 매우 다양한 패턴을 가진 게임 유저들이 각각의 스타일로 게임을 즐기고 있으므로 하나의 모델로 단순화시키는 것은 매우 어렵습니다. 기존의 게임 유저 분석은 전체 유저의 대표값 또는 평균값을 구하여 하나의 단순화된 지표로 만드는 것이 전형적인 작업이었습니다. 데이터 분석을 통해서 게임 유저의 다양한 유형을 발견할 수 있었고, 그 유형에 맞는 차별화된 서비스를 만들고 전략을 세울 수 있었습니다.



우리 게임을 이용하는 유저는 누구인가?

“우리 게임을 이용하는 유저들은 누구인가?” 라는 질문을 했을 때, 단순히 전형적인 틀로는 모든 유저에 대한 설명으로는 부족하고, 또 모든 유저 각각을 말할 순 없을 것입니다. 어느 정도 유사한 그룹을 묶어서 설명해야 합니다. 또, “유사한 유저들은 누구인가?”라고 했을 때, 유사하다는 정의는 어떻게 해야 할지 고민이 필요합니다. 그래서 유사하다는 것은 단순히 느낌이나 감이 아닌 데이터로 정확하게 표현해야 할 필요가 있었습니다.

유사한 데이터를 분류하는 방법에는 여러 가지가 있는데, 연사님이 사용한 3가지 모델링 방법은 다음과 같습니다.

1. 행위기반 클러스터링

2. 시퀀스 마이닝

3. 네트워크 분석


1. 행위기반 클러스터링

행위기반 클러스터링은 게임 유저들이 어떤 행동을 하는지 관찰하고 유사한 행위를 하는 유저들끼리 그룹을 나누는 작업입니다. 행위기반 클러스터링은 유저를 관찰한 시점에 나누는 것이기 때문에, 게임 플레이를 지속하거나 시간이 지났을 때 어떻게 변화하는지 알기는 어려운 점이 있습니다.

행위기반 클러스터링은 게임 내 비슷한 유형을 가진 유저끼리 묶는 방법으로써, “어떤 활동을 측정해야 하는가?”, “얼마나 세분화해서 분류할 것인가?”, “어떤 기준으로 분류할 것인가?”라는 3가지 질문이 목적에 따라 고민되어야 합니다. 분류 목적에 따라 어떤 데이터를 봐야 잘 분류될지 선택을 해야 하는데, 이것을 “특질선택(Feature Selection)”이라고 합니다. 게임에는 너무 많은 데이터가 있기 때문에, 모든 데이터를 분류하는 것은 현실적으로 불가능합니다. 그래서 분류를 위해 데이터를 선별하는 것이 매우 중요한 과정입니다. 아직 어떤 데이터를 선별하는 것이 가장 적절한지 자동으로 알려주는 알고리즘은 없으므로 데이터 분석에서 가장 어려운 점입니다. 그래서 데이터 분류를 위해 분석할 데이터를 선택하는 기준은 그 게임을 가장 잘 이해하고 데이터에 대한 지식이 있는 사람이 선정해 주는 것이 현재까진 최선입니다. 연사님은 그래서 데이터 분석 전에 분석할 게임의 운영자나 사업팀의 관계자와 이야기를 해서 분석할 데이터의 후보군을 선정하였다고 합니다.

어떤 데이터를 수집할지 선택한 이후에 분석을 할 때 중요한 포인트는 ‘유형 개수 선정’입니다. 유형 개수가 많으면, 다양한 유형을 세분화 가능하지만, 플레이어가 조금만 다르게 플레이하면 유형이 쉽게 바뀔 수 있는 단점이 있습니다. 반대로 유형 개수가 적으면, 특징 확인 및 결과 유지가 쉬운데, 다양한 유형이 통합되어 개선 포인트를 놓칠 수도 있습니다. 이것도 정답이 정해져 있는 것이 아니라 여러 번 시도하면서 인사이트를 발견해야 하는 작업입니다.

이러한 데이터로 ‘분류 기준’을 세워 분류하는데, K-Means Clustering 알고리즘을 이용해서 하는 분류를 많이 이용한다고 하였습니다. K-means Clustering은 원하는 군집 개수를 선택하면, 데이터들의 유사도를 계산해서 자동으로 집단을 만들어 주는 알고리즘입니다. 이 K-Means Clustering을 통해서 나눠진 집단을 보면서 유형을 분류하고 특징을 정의할 수 있었습니다. 정의된 특징에 태그를 지정하여 내부 커뮤니케이션 용도로 사용하고, 신규유저가 진입하여 플레이할시 어떤 유저군인지 자동 분류하여 정의하고 현재 게임 유저의 유형을 살펴보면서 전략적인 서비스 운영을 할 수 있었다고 하였습니다. 위 과정은 모두 정량적인 데이터 기반으로 이뤄지지만, 그것을 분석하고 정의하는 것에 대해서는 정성적인 판단은 필수라고 합니다.


2. 시퀀스 마이닝

시퀀스 마이닝은 시간에 따라 게임 유저가 어떻게 변화하는지 유형을 분류하는 작업입니다. 게임 유저들은 플레이를 지속하거나 시간이 지날수록 유형이 다르게 변화합니다. 그것을 유형화하여 분류하는 것이 시퀀스 마이닝 작업입니다.

포켓몬스터에서 '이브이'는 조건에 따라 다르게 진화합니다. 게임 유저도 성향이나 환경에 따라서 다르게 변화할 수도 있습니다. 이렇게 변화를 관찰하여 유형화하는 것이 시퀀스 마이닝입니다. (이미지 출처: http://gamingway.fr/)


시퀀스 마이닝은 각 유저별로 시간의 흐름에 따라 어떤 유저로 변화하는지를 관찰할 수 있었다고 합니다. 행위기반 클러스터링을 통해서 나온 사용자 유형을 가지고, 시간의 흐름에 따라 어떤 식으로 유저가 변화하는지 지켜보면서 시퀀스별 유형을 또 분류할 수 있었다고 합니다. 사용자 유형의 변화를 추적함으로써, 시간에 따라 게임 유저가 어떤식으로 변화하는지 변화하는 유형을 알 수 있고, 또, 이벤트나 특정 기간에 따라 유형이 변화하거나 게임을 떠나고 돌아오는지 파악할 수 있었다고 합니다. 행위기반 클러스터링에서 나온 결과로 게임 내 플레이 유형을 나누고, 시퀀스 마이닝으로 시간을 더해서 분류하면, 어떤 유저가 매출이 높은지 단순한 인구통계학적 정보가 아닌 명확하게 파악할 수 있었다고 합니다. 이를 통해 그들에 맞는 전략적 판단을 하는 데 도움을 받을 수 있었다고 합니다. 시퀀스 마이닝의 기간은 목적에 따라 달라질 수 있었다고 합니다.


3. 네트워크 분석

위의 분석방법인 ‘행위기반 클러스터링’이나 ‘시퀀스 마이닝’은 행동의 유사성이나 변화의 유사성을 하나의 개체에 집중해서 보게 되는데, 게임에서는 단순히 한 명의 게임 캐릭터가 성장하는 것이 아니고 거대한 게임 세계 안에서 다른 유저들과 끈임없는 인터랙션을 통해 플레이를 즐기게 됩니다. 여기서 인터랙션은 단순히 대화 뿐만 아니라, 같이 모험을 하고, 결투도 하고, 임무를 완수하고, 아이템을 거래하는 등 유저들간의 많은 관계를 형성하며 플레이를 합니다. 그래서 단순히 캐릭터 한 명의 행위나 변화만을 관찰하는 것은 게임 안에서의 관계를 볼 수 없으므로, 게임 유저가 어떻게 다른 유저와 관계를 형성하는지 구조화를 시켜서 또 새로운 유형을 발견할 수 있었습니다. 이런 관계를 구조화시켜서 분류하는 것은 ‘네트워크 분석’을 통해서 알아낼 수 있었습니다.

같은 개체(탄소)를 가졌지만, 어떤 관계로 있는지에 따라 흑연인지 다이아몬드 인지 나뉜다. (이미지 출처: http://www.philosophyib.com/3/wholebrain/diamond-vs-graphite)


네트워크 분석은 유저간의 관계를 노드와 엣지로 표현한 것을 말합니다. 유저들을 하나의 점으로 표현하고, 유저간 교류를 선으로 표현하여 네트워크 구조를 그래픽으로 표현할 수 있습니다. 그래픽으로 표현되었을때, 유저 군집이 보이게 되는데 이것을 커뮤니티라고 정의합니다. 이 커뮤니티 구조를 자세히 살펴보면 유저분석으로 발견하지 못한 특징들이 파악되게 됩니다. 예를 들어, 거래를 주로 하는 커뮤니티 구조가 있을 수도 있고, 친목을 위주로 하는 커뮤니티가 보이는 구조가 있을 수도 있습니다. 커뮤니티의 연결형태에 따라 또 유형을 분류해서 유형별 특징들을 파악하고 정의할 수 있었다고 합니다. 네트워크 분석을 하게 되면, 기존 행위기반 클러스터링이나 시퀀스 마이닝을 통했을때 같은 유형의 사용자라고 하더라도 완전 다른 패턴의 커뮤니티안에서의 다른 특징을 발견할 수 있다고 합니다.

위 세 가지 모델링 방법을 통해서 다양한 관점에서 게임 유저가 누구인지를 입체적으로 파악할 수 있게 되었고, 유저 유형별 이해 및 관리를 위한 많은 인사이트들을 도출할 수 있었다고 합니다.



마무리

필자는 이전에 참여했던 프로젝트들에서 많은 사용자를 만나서 그들의 생활 속에서 어떤 맥락으로 서비스나 제품을 활용하는지 관찰하고 인터뷰를 진행했었습니다. 이번 강연에서 설명한 게임 내 데이터를 활용하는 것은 기존 정성 조사와 비슷한 점을 많이 느꼈습니다. 게임이라는 가상의 세계에서 모든 행동은 데이터로 남기 때문에 그들의 감정까지 데이터에 표현되지 않지만, 데이터를 활용해서 행동 관찰과 유저간의 관계 분석을 통해 사용자를 분류하고 정의하는 것에서 기존 UX 프로세스와 많은 유사점을 발견할 수 있었습니다.

기존 정성적 사용자 조사에서 사용자의 무엇을 관찰하고 질문할지 결정하고, 사용자와 환경을 관찰하면서 그들을 이해하고 공감하고, 그들의 태도와 행동 그리고 말을 데이터로 만들어 분류와 재분류를 통해서 모델링 하는 과정이 게임에서의 데이터 분석과 많은 부분에서 유사점을 느꼈습니다. 게임에서의 데이터 활용 사례를 보면서 게임 안에서는 행동은 데이터로 모두 남기 때문에, 가장 효과적인 관찰 Tool 중 하나라고 생각합니다. 게임이나 데이터 기반의 서비스에서 데이터 분석과 정성 조사가 조화롭게 이뤄줬을 때, 사용자를 더 정확하게 파악할 수 있고, 사용자 니즈를 더 충족하는 설득력 강한 사용자 경험을 제안하는 데 도움이 될 것 같다고 생각합니다. UX디자인을 할때도 점점 데이터에 대한 이해와 분석에 대한 중요도가 높아진다고 생각하는데, 이번 pxd Talks에서 게임업계에서의 데이터 분석사례를 통해 많은 영감을 받는 시간이었습니다.

다시 한번 좋은 강연을 해주신 엔씨소프트의 이은조 팀장님에게 감사를 드리면서 글을 마칩니다. 감사합니다.


[참고##pxd talks##]