pxd talks

[pxd talks 97] AI의 핵심, 딥러닝에 대한 이해

Jeongsub Lim 2020. 11. 27. 07:50

들어가며

지난 11월 3일, 보이저엑스(VoyagerX)의 창업자이자 대표이신 남세동 대표님이 'AI의 핵심, 딥러닝에 대한 이해'라는 주제로 pxd talks를 진행해주셨습니다. 남세동 대표님은 네오위즈에서 '세이클럽' 서비스를, 네이버의 자회사 라인에서 '라인 카메라'와 'B612'앱을 만들었으며, 현재는 '보이저엑스'에서 인공지능을 활용한 다양한 서비스를 개발하고 계시는, 국내에서는 전설적인 개발자로 익히 알려진 분입니다. 특히 보이저엑스의 인공지능 영상편집기 Vrew는, 컷 편집 및 자막 제작에 있어서 유튜브 크리에이터들 사이에서도 강력히 추천받는 서비스이기도 합니다.

이번 pxd talks에서는, 먼저 대표님이 AI와 딥러닝에 대한 간략한 개념을 소개해주셨고, 이러한 지식을 기반으로 다양한 사례들을 함께 살펴보았으며, 마지막으로 대표님이 바라보는 미래에 관하여 깊이있는 대화를 나누었습니다.

 

1. AI와 딥러닝

먼저 AI와 딥러닝에 대한 간략한 개념을 알아봅니다.


1-1. 프로그래밍

프로그래밍(Programming)이란 컴퓨터에 무언가를 입력(input)한 뒤, 원하는 무언가를 출력(output)할 수 있도록 컴퓨터의 처리과정(process)을 개발하는 작업을 뜻합니다. 이러한 작업을 수행하는 프로그래머는 컴퓨터에 무엇을 입력할지, 컴퓨터가 무엇을 출력해야 할지, 그리고 그것을 출력하기 위해서는 어떠한 규칙이 있어야 하는지를 모두 알아야 합니다. 따라서 모든 프로그램은 온전히 인간의 생각 산물이었다고 말할 수 있습니다. 인공지능이 등장하기 전까지는요.


1-2. 지도 학습

지도 학습(Supervised Learning)은 '처리' 단계를 인공지능으로 대체하는 방법입니다. 즉, 컴퓨터에 "내가 A를 입력하면 B를 출력할 수 있도록 하는 방법을 연구해 봐"라고 하는 것입니다. 이 단계에서부터 컴퓨터의 주된 역할은 학습(Learning)이고 인간의 역할은 훈련(Traning)이라고 할 수 있습니다. 그리고 '처리' 과정은 기존의 '순서도(Flow Chart)'에서 '인공 신경망(Artificial Neural Network)'으로 대체됩니다.

출처: https://towardsdatascience.com/cat-dog-or-elon-musk-145658489730

지도 학습의 대표적인 사례는, 익히 알려진 것처럼, 컴퓨터에 특정 사진을 입력한 뒤 '이것이 고양이냐 강아지냐'를 맞추도록 하는 것입니다. '고양이'라고 이름이 붙여진(Labeling) 사진들과 '강아지'라고 이름이 붙여진 사진들을 학습한 컴퓨터는, 새로운 사진이 입력될 때 기존의 학습 내용을 바탕으로 그 사진이 고양이인지 강아지인지를 확률적으로 분류(Classification)하고 예측(Prediction)하여 답을 출력합니다.


1-3. 비지도 학습

비지도 학습(Unsupervised Learning)은 오로지 컴퓨터에 입력만 할 뿐, 무엇을 출력해야 하는지 답을 알려주지 않습니다. 지도 학습이 아이를 동물원에 데려가서 '저건 사자야, 저거 호랑이야'라고 일일이 알려주면서 학습을 시키는 방법이라면, 비지도 학습은 그냥 아이가 동물원을 자유롭게 돌아다니도록 하는 것과 같습니다. 아이는 저 동물이 무엇인지는 모르지만 일단 발이 2개인지 4개인지, 날개가 있는지 없는지, 목이 긴지 짧은지 등의 특성(Feature)들을 중심으로 동물원의 동물들을 그룹화(Clustering)할 것입니다.

출처: https://intellipaat.com/blog/tutorial/machine-learning-tutorial/machine-learning-algorithms/

위의 그림에서 컴퓨터는 6마리의 동물들을 그룹화하는 임무를 부여받았습니다. 컴퓨터의 입장에서는 모두 처음 보는 동물들이고 이름이나 종류도 알지 못하기 때문에, 각 동물의 특성을 스스로의 힘으로 찾고 비교해가면서 그룹화를 해야 합니다. 예를 들어 컴퓨터는 '날개'라는 특성과 '꼬리지느러미'라는 특성을 발견하고, 각각의 특성을 가진 동물과 그렇지 않은 동물로 그룹을 나눌 수 있을 것입니다. 마치 동물들에 대해서 잘 모르는 아이라도 '하늘을 나는 동물'과 '물속에 있는 동물'을 자연스럽게 구분하게 되는 것처럼 말이지요.

이러한 비지도 학습은 단순히 '특성 중심의 그룹화' 이상일 수도 있는데요, 예를 들어 심리학자인 Lynda L. Warwick에 따르면, 인간 또한 유사한 특성이나 속성을 중심으로 그룹화를 하는 과정에서 '개념(Concept)'을 형성하고, 이는 모든 인간의 지식 및 사고의 기초를 이룬다고 합니다. 이렇게 바라본다면, 인공지능이 학습해나가는 과정은 사실 인간이 학습해나가는 과정과 본질적으로는 크게 다르지 않을 수도 있겠다는 생각이 듭니다.


1-4. 강화 학습

강화 학습(Reinforcement Learning)은 지도 학습이나 비지도 학습에서 필요한 것과 같은 입력 데이터나 출력 데이터를 사용해서 학습하지 않습니다. 다만 특정한 환경(Environment)과 보상(Reward)만을 제공할 뿐입니다. 이제 컴퓨터는 어떠한 상태(State)에서 어떠한 행동(Action)을 취해야 보상을 최대한 많이 받을 수 있는지를 스스로 탐색하고 학습합니다. 이 또한 실제 사람의 학습 방법과 유사하다고 볼 수 있습니다. 사람도 어떤 행동을 하고 나서 '재미있어', '맛있어'와 같은 긍정적인 반응, 또는 '재미없어', '아팠어'와 같은 부정적인 반응을 통해서 시행착오를 겪고, 경험과 학습을 통해 계속 행동 방식을 수정해 나가면서 특정 목표에 도달해나가기 때문입니다.

강화 학습의 대표적인 사례로는 '알파고(AlphaGo)'라는 프로그램이 있습니다, '바둑'이라는 환경에서 '이겼다'라는 보상만 주어진다면, 알파고는 인간이 이해할 수 없는 방식으로 인간보다 훨씬 더 바둑을 잘 두게 되는 것이지요.

위의 영상에서 로봇들이 수많은 탐색과 학습을 거쳐, 결국 진짜 사람처럼 그네를 타고 턱걸이를 하는 모습을 볼 수 있는데요, 로봇이 발견한 가장 효율적이고 최적화된 방법이 알고보니 사람이 기존에 해왔던 방법과 유사하다는 점에서, 남세동 대표님은 "예전에는 '로봇들이 사람처럼 움직이네?'라고 생각했다면, 지금은 '사람이 그동안 참 잘해왔던 거구나...'라고 생각한다"는 말씀을 하셨습니다. 앞으로도 인간의 많은 작업이 인공지능으로 대체된다면 우리도 이런 생각을 하게 되지 않을까요?

 

2. AI의 현재: GAN

인공지능 기술의 발전이 당장은 대중들에게 널리 체감되지는 않더라도, 적어도 연구자들 사이에서는 너무 빠르게 성장하고 있어서 거의 2~3년 간격으로 유행이 바뀌고 있는 수준이라고 합니다. 그중에서도 현재까지 가장 활발히 연구 및 응용되고 있는 분야 중 하나는 GAN(Generative Adversarial Networks)이라고 불리는 '생성적 적대 신경망'을 활용한 분야로, 딥러닝이 적용된 비지도 학습의 한 분야입니다. 즉, 앞에서 살펴본 비지도 학습의 작동 원리를 응용한 방법인데요, 간단히 소개하자면 이렇습니다.

출처: https://post.naver.com/viewer/postView.nhn?volumeNo=16566740&memberNo=36733075

'생성적 적대 신경망'은, 최대한 진짜 같은 데이터를 생성하려는 '생성 모델'과, 생성 모델이 만들어낸 데이터가 진짜인지 가짜인지를 분류하려는 '분류 모델'이 서로 적대적 관계를 이루면서 경쟁적으로 학습을 하게 됩니다. 예를 들어 위조지폐를 만들어본다고 생각해봅시다. 우선 분류 모델에게 실제 지폐를 입력하고, 그 특성들을 학습하도록 합니다. 그다음으로는 분류 모델에게 생성 모델이 만들어낸 위조지폐를 입력하고, 이게 진짜인지 가짜인지를 분류하도록 합니다. 이제 생성 모델은 분류 모델을 속이기 위해서 노력하게 되고, 분류 모델은 생성 모델이 만들어 낸 위조지폐를 잡아내기 위해 노력합니다. 그리고 이러한 과정이 반복될수록 생성 모델이 만들어낸 위조지폐는 실제 지폐와 닮아가게 될 것입니다.


이를 응용하면 다음과 같은 일도 가능합니다.

또는 이런 것도,

또는 나의 손글씨를 입력하면 이를 폰트로 만들어주는 서비스도 가능할 것입니다. 보이저엑스의 온글잎 서비스는 사람이 직접 손으로 쓴 300자의 글씨를 바탕으로 11,172자에 해당하는 한글 폰트로 바꿔주는데요, 아직은 완전히 자동화가 이루어지지는 않았으나 몇 년 후에는 모든 사람이 저렴한 가격에 자신만의 폰트를 갖도록 하는 것이 보이저엑스의 목표라고 하셨습니다.

 

3. 그래서 우리는 앞으로 뭘 해야 하죠?

인공지능, 특히 딥러닝 기술이 현재 바로 활용할 수 있는 데이터가 주로 문자와 언어, 음성, 사진과 영상 등이다 보니, 아무래도 디자인 직군에 미치는 영향도 클 것 같습니다. Adobe는 최근 Adobe Sensei라는 인공지능 기술을 기반으로 Adobe Photoshop CC 2021에서 사용할 수 있는 Neural Filters 기능을 소개했습니다.

또한 Figma에 GPT-3라는 언어 생성 인공지능 기술이 적용된 "Designer"라는 플러그인을 적용한 데모 영상도 있습니다. 입으로 화면을 설계할 날이 머지않았는지도 모르겠습니다.


이러한 상황에서, pxd와 남세동 대표님이 나눈 대화는 크게 세 가지로 요약될 수 있습니다.

3-1. 기술은 생각보다 빨리 발전한다

남세동 대표님이 처음 딥러닝을 접했을 때, 그리고 처음 보이저엑스를 창업하셨을 때, '몇 년 후면 이런 기술이 현실화 되겠구나'라고 예상했던 것들이 실제로는 2배 정도 빨리 개발되더라는 것입니다. '2년 후에는...'이라고 예상하면 1년 후에, '5년 후에는...'이라고 예상하면 3년 후에 세상에 나오더라는 것이지요. 이는 특히 '일'과 '직업'의 영역에서 급격한 사회 변동을 불러일으킬 텐데, 디자이너를 포함한 모든 직업에 영향을 미칠 것입니다. 이는 인공지능이 뛰어나다기보다는, 어쩌면 사실 인간이 생각보다 창의적인 존재가 아닌데도 우리가 '인간은 창의적인 동물'이라는 '착각'을 하고 있기 때문일 수도 있겠습니다.

3-2. 수요는 많은데 공급이 없다

이렇게 기술이 빨리 발전하고 항상 화제가 되는 데도 불구하고 남세동 대표님은 항상 인력난을 고민한다고 합니다. 즉, 인공지능 기술이 널리 알려지고 사람들의 입에 언급되는 횟수에 비하여 사회로 배출되는 인공지능 관련 개발자는 여전히 매우 적다고 합니다. 특히 요즘은 간단한 지도 학습은 초등학생도 구현할 수 있을 정도로 인공지능 관련 교육의 인프라도 잘 구축되었고, 사람들이 겁먹는 것처럼 그렇게까지 어려운 기술은 아니라고 하시면서, 배움과 도전을 강조하셨습니다.

3-3. 항상 안테나를 세워라

기술 본래의 속성이 그러하듯, 딥러닝 또한 아는 만큼 그 활용 가능성이 많이 보일 것입니다. 보이저엑스의 서비스들 또한 딥러닝이라는 무시무시한 기술로 만들어졌다고 하기에는 굉장히 친숙하고 일상적인 서비스들이라는 생각이 드는데요, 이처럼 앞으로도 많은 영역에서 기회를 발견할 수 있을 테니 항상 안테나를 세우고 다니라고 말씀을 하셨습니다.

 

마치며

개인적으로 예전에 Don Norman의 글을 인상 깊게 읽은 적이 있습니다. Norman은 "계산기가 발명되었다고 수학자라는 직업이 없어진 것은 아니다. 오히려 계산기는 수학자들이 저지를 수 있는 오류를 줄여주는 역할을 한다."고 하면서, "계산기는 계산을 한다. 그리고 수학자는 해결되어야 할 문제를 파악하는 데에 집중한다."라고 하였습니다. 저는 이 말이 디자이너에게도 그대로 적용될 수 있다고 생각합니다.

이번 pxd talks를 통해 흐릿하거나 막연했던 AI와 딥러닝의 개념을 보다 명확하게 인식할 수 있었고, 우리 스스로도 현실을 직시하고 마음을 다잡는 기회가 되었습니다.