Sans-serif

Aa

Serif

Aa

Font size

+ -

Line height

+ -
Light
Dark
Sepia

인공 지능 기술, 잃어버린 목소리를 되찾아주다

세기의 대결로 관심을 끌었던 알파고(Alphago)와 이세돌의 바둑 대결 결과는 우리의 바람과는 달랐다. 이 대결을 기점으로 우리 사회는 일종의 인공지능 포비아(AI Phobia)에 잠시 휩싸였었다. 가까운 미래에 인공 지능(이하 AI)이 인간을 대체할 것이라는 전망과 AI로 인해 사라질 수많은 직업, 종국에 인간에게 허락된 영역이 남아있을지 모두가 두려워했다. 어떤 이는 미술, 음악, 문학과 같은 예술 분야가 인간에게 남은 최후의 보루라고 생각할지도 모른다. 하지만 우리가 흔히 생각하는 영감, 경험이라는 것도 학습이 가능한 데이터로 분석된다면 이 또한 쉽게 대체 가능하다. 실제로 인공지능이 작곡한 음악, 그림, 소설이 시도되고 있기 때문이다. 현재는 다소 어색할지라도, 미래에는 인간을 초월하는 작품을 만들어낼지도 모른다.

AI에 대한 두려움은 이것이 가까운 미래에 인간을 대체할 수도 있다는 전제를 바탕으로 한다. 분명 그런 가능성이 있긴 하다. 현재는 인간의 직업이나 활동을 대체하는 수준으로 보고 있지만, 가까운 미래에는 인간 자체를 대체할 수도 있기 때문이다. 얼마 전 화제가 되었던 Fake Obama 영상은 얼핏 보기에는 누가 진짜인지 구분하기가 어려울 정도다. 이는 이미 인간의 표정, 목소리, 습관, 미세한 근육의 움직임을 데이터로 변환하여 분석이 가능하다는 것을 의미한다. 대면하지 않고도 비즈니스가 가능한 시대에 인공지능이 만들어 낸 얼굴이 사람을 대신하지 못할 이유가 없다. 그렇다면 이렇게 두려움을 야기하는 인공지능에 대해 계속해서 연구하고 한편으로 기대하는 이유는 무엇일까? 인공지능이 가져올 두려움, 편리함 등을 생각해본다면 그 핵심에는 인간이 있기 때문이다. 사용자가 어떻게 쓰는지에 따라 인공지능은 두려움보다는 편리함에, 우리를 대체하기보다는 함께 사는 기술이 될 수 있다.

그의 목소리를 되찾아주다, ‘Project Revoice’

Project Revoice, https://clios.com/awards/winner/innovation/the-als-association/project-revoice-40686

2014년 SNS에서 시작된 아이스버킷 챌린지가 자선관련 이벤트라는 것을 아는 사람은 많았지만, 정확히 무엇을 위해 시작되었는지에 대해 아는 사람 별로 없다. 이 이벤트는 Pat Quinn이 루게릭병을 앓고 있는 사람들을 위한 모금 활동으로 생각해낸 것으로 이후 SNS를 통해 빠르게 전파되고 유명인사까지 참여한 성공적인 이벤트가 되었다. Pat Quinn 또한 루게릭 환자였다. 그는 수많은 연설과 강연을 통해 루게릭 환자에 대한 사회적 관심을 이끌어 냈는데, 이 과정에서 그의 병은 계속해서 악화되어, 근육의 마비는 물론 강연을 하던 그의 목소리마저 잃게 되었다.

Project Revoice, http://www.bwmdentsu.com/project/project-revoice
Project Revoice, http://www.bwmdentsu.com/project/project-revoice

Project Revoice는 Pat Quinn의 목소리를 되살리는 프로젝트다. 음성 데이터 분석 회사인 Lyrebird의 음성분석 인공지능 기술은 30분, 300문장 이상의 음성 데이터만 있으면 2~3시간 내에 목소리 복제가 가능하다. Pat Quinn의 수많은 강연 영상은 그의 목소리를 되찾아 주는데 사용되었다. 목소리가 완성된 날, 가족과 지인이 모인 자리에서 Pat Quinn의 목소리가 컴퓨터를 통해 세상에 다시 울렸다. 그것은 인공지능이 되살린 음성이었지만, Pat Quinn이 루게릭병에 대한 관심을 호소하고 다른 환자들에게 희망이 되어 강연하던 그의 목소리였다. 이 프로젝트는 Pat Quinn을 시작으로 비슷한 문제를 겪고 있는 사람들에게 도움을 주고자 무료로 동일한 서비스를 제공하고 있다.

Project Revoice가 전하는 감동적인 이야기가 우리의 관심을 끄는 이유는 크게 두 가지다.

첫 번째는 신체의 잃어버린 기능을 되찾아 주었기 때문이다. Pat Quinn과 같이 강연을 하지 않는 일반인에게도 목소리는 매우 소중하다. 인공지능을 통해 사람의 음성을 데이터로 분석하고 재생산하는 일이 가능한데, 이는 데이터로 저장할 수 있는 것이라면 그것의 종류와 상관없이 우리에게 되찾아 줄 수 있다는 것을 의미한다. 지금은 목소리지만 미래에는 신체 다른 기관의 기능을 되찾아 주는 기술이 나타날 수 있다.

두 번째는 인공지능 기술이 개인에게 맞춤식으로 사용되었다는 점이다. 인공지능 음성 서비스와 같이 우리의 삶에 이미 자리 잡은 기술들은 많이 있다. 하지만 개인보다는 범용적으로 사용되는 기술인 경우가 대부분이다. 다른 사람에게 내 목소리는 별다른 의미를 갖지 못하지만 이는 역으로 인공지는 기술이 개인에게 조금 더 가깝고 맞춤인 기술로 제공될 수 있다고 볼 수 있다.

인공지능이 재현해내는 목소리, 다른 영역으로 확대 가능할까

Project Revoice는 인공지능 기술이 단순 편의나 인간의 영역을 대체하는 것과는 다르게 누군가의 삶의 일부로 활용될 수 있음을 보여주었다. 개인의 삶의 일부로 활용되는 목소리라는 측면에서 보면 이 기술은 루게릭병 환자가 아닌 다른 사람에게도 다양하게 적용될 수 있다.

질병이나 불의의 사고로 잃어버린 것을 되찾아 주는 것이 가능하다면, 아예 없던 것을 만들어 내는 것도 불가능한 것은 아닐 것이다. Project Revoice에서 알 수 있듯이, 자신의 목소리를 되찾아 주는 것은 활용할 수 있는 음성데이터만 있다면 가능하다. 그렇다면 아예 목소리가 없던 사람들은 어떨까? 선천적인 이유로 자신만의 목소리가 없는 사람들이라면 음성 데이터 은행을 통해 자신이 상상하는 목소리를 갖게 될 수도 있다. 이 목소리를 직접 사용할 수는 없겠지만, 만들어 낸 목소리로 텍스트를 읽는 형태의 서비스로 활용될 수 있다. 우리가 문서파일에 다양한 폰트를 받아 활용하듯이, 스마트 기기를 통해 텍스트를 자신의 목소리로 변환하는 것처럼 말이다. 이를 통해서라면 물리적으로 목소리를 낼 수 없는 사람도 커뮤니케이션이 가능하도록 서비스를 제공할 수 있을 것이다.

그렇다면 이러한 기술이 질병이나 불의의 사고로 자신의 목소리를 잃은 사람에게만 활용될 수 있을까? 앞에서 살펴본 방법 외에도 음성데이터를 사용해 다른 기기 및 서비스에 활용하는 방향으로 발전할 가능성이 크다. 이를테면 사용자 개개인에게 습관적으로 발생하는 부정확한 발음이나 발성을 파악하고 수정하는데 사용될 수 있을 것이다. 현재는 발음을 교정하기 위해 물리적으로 녹음하고 이를 반복해서 들으며 수정하는 방법이 사용되는데, 이 기술이 보편화되면 별다른 녹음 장치 필요 없이 언제든지 쉽게 자신의 말하기를 교정할 수 있다. 일상에서는 인공지능 스피커에 개인의 목소리를 적용한다면 아이들에게 동화책을 읽어줄 때 부모의 목소리로 읽어주는 것도 가능할 것이다. 개인의 목소리를 활용하고자 하는 니즈가 생길수록 향후 스마트 기기는 개인 음성 데이터를 분석하고 이를 기기에서 사용할 수 있는 기능을 개발하고 다양한 서비스를 제공하는 데 집중할지도 모른다.

인공지능 기술이 앞으로 다양한 영역에서 더 빠르고 편리하게 우리의 삶에 자리잡을 것이라는 사실은 자명하다. 우리가 해야할 일은 인공지능 기술에 대해 불안과 두려움으로 걱정하는 것이 아니라, 기술과 인간이 어떻게 공존할 수 있는지 고민하는 것이다. 이는 인공지능 기술을 활용하게 될 미래의 비즈니스도 마찬가지다. 기술이 가져올 편의도 좋지만 목소리를 돌려주는 프로젝트처럼 기술이 인간의 삶의 일부로, 그리고 개인의 파트너로 존재함으로써 우리에게 의미있게 변화하는 방향을 기대해본다.

Leave a Reply