본문 바로가기

IT

빅데이터와 인공지능 그리고 빅브라더ㅡ2



이 회사의 창업자들이 불안한 이유는 그들이 창조주보다 한발 더 나아가 사고할 수 있는 놀랍도록 멋진 기계를 창조하려는 소년 같은 열망을 가졌기 때문이 아니다. 그것은 이 같은 열망을 가지도록 한 그들의 인간 사고에 대한 이해 수준이 형편없기 때문이다.

 

                                                                   ㅡ 니콜라스 카의 《생각하지 않는 사람들》 중에서



 

 

인공지능에 대한 이해를 하려면 빅데이터에 대한 이해가 선행돼야 합니다. 이를 위해 첫 번째 글에서 빅데이터에 대해 다루었는데, 이것으로 부족한 감이 있어 오늘은 빅데이터와 인공지능의 절대강자라 할 수 있는 구글이 유튜브를 사들인 이유부터 다루어보고자 합니다. 구글어스와 스트리트 뷰(필자가 정보통신사업을 할 때 스텐포드 출신의 벤처사장이 이에 대한 한국 독점권을 가지고 있었다)도 빅데이터의 구축을 통해 인공지능의 완성도를 높이기 위함입니다.                                             

                                                               

                                                               

 

구글은 2009년 11월에 벤처캐피탈로부터 400만 달러를 투자받아 2010년 9월에 동영상 공유서비스 사업을 시작한지 10개월밖에 되지 않은 유투브를 18억 5천만 달러라는 어마어마한 금액에 사들였습니다. 유투브가 10개월 동안 한 일이란 온갖 종류의 영상들(드라마의 클립 영상, 각종 TV쇼, 가수의 뮤직비디오와 공연 영상, 포르노 등)을 올릴 수 있는 사이버공간을 제공하는 것이었습니다. 

 

 

유투브는 창기 몇 달 동안에는 포르노(지금은 차단된다)와 각종 폭력물, 타인의 은밀한 사생활을 몰래 찍은 도촬 영상까지 탈법적이고 관음적인 동영상들이 무차별적으로 올라오는 것을 모른 척 했습니다. 그들은 개인이 자발적으로 자신의 시간과 노동, 아이디어와 촬영 장비를 이용해 직접 찍은 짧은 동영상(UCC)들을 자유롭게 올리고 무차별적으로 다운받고, 끼리끼리 주고받고 때로는 은밀하게 공유할 수 있도록 방치했습니다.

 

 

디지털 관음증과 노출증을 깨놓고 드러낼 수 있는 사이버 공간의 등장은 디지털 세대에게는 혁명과도 같은 것이었습니다. 유투브 이용자들은 기하급수적으로 늘었고, 무한대의 영상물이 매초마다 수백 개씩 올라왔습니다. 그에 따라 이용자의 수도 폭발적으로 늘었습니다. 이는 유투브 창업자들도 전혀 예상하지 못했던 일이라 특별한 수익구조가 없는 상태에서 영상을 담아둘 서버를 늘리기도 벅찰 정도였습니다. 



다만 유투브 서버에는 누가 어떤 영상을 올렸고, 전 세계의 이용자들이 어떤 내용의 영상을 주로 클릭했고, 한 번 들어오면 얼마를 머물렀고, 일주일에 몇 번 들어왔고, 얼마나 많은 동영상을 퍼다 나르고 댓글을 달았으며, 얼마나 자주 재접속을 하는지 유투브에 접속한 이용자들의 모든 행태와 성향, 기호와 중독성의 흔적들을 낱낱이 축적되고 있었습니다. 이것을 이용해 수익구조를 만들기만 하면 대박도 가능할 것이었습니다.

 

 

헌데 수억에서 수십억 명에 이르는 이용자 정보를 가지고 수익구조를 찾는 일이 생각보다 쉬운 일이 아니었습니다. 이용자 정보를 팔 수도 있는 것이 아니고, 그것의 가치를 정확히 평가할 방법도 없었습니다. 2008년이 금융붕괴 이후 벤처기업에 대한 평가도 박해진 상태였습니다. 많은 기업들이 유투브를 삼키고 싶었지만 이용자 정보를 가지고 수익구조를 창출하는 일이 만만한 것이 아니었습니다.    

 

                                

                                                      유투브 창업자 스티브 첸  

          

 

이때 빅데이터를 구축해 인간보다 뛰어난 인공지능을 만들어내는 것이 최종 목표인 구글이 18억 5천만 달러라는 상상을 불허하는 금액에 유투브를 인수했습니다. 구글이 다른 기업들은 생각도 해보지 않은 천문학적인 금액을 배탱한 것은 유투브의 서버에 축적되어 있는 전 세계 이용자들의 데이터였습니다.  연간 수십억에서 수백억 명에 이르는 네티즌들의 빅데이터는 구글에게는 마르지 않는 샘물과 같은 것이었습니다.

 

 

개인정보의 수집과 데이터 마이닝의 중요성을 누구보다도 잘 이해하고 있는 구글은 유투브 이용자들의 데이터를 수집·축적·가공해 그들의 기호와 성향, 행태를 파악함으로써, 그들의 머릿속까지 훤히 들여다볼 수 있는 인공지능을 개발하면 유투브 인수에 들어간 자금을 얼마든지 회수할 수 있다고 판단한 것입니다. 그때까지 구글은 개인정보의 무차별적인 수집을 절대 멈추지 않을 것이며, 그들의 최종 목표인 인간보다 똑똑한 인공지능을 만들 수도 있습니다.  

 

 

사실 지금까지의 인공지능 프로그램은 확률에 의존하는 것입니다. 정보통신의 최강자인 카네기멜론대의 싱(정확한 이름은 기억나지 않는다) 교수는 특정한 미로에 갇힌 쥐가 그곳에서 빠져나올 확률을 계산해내는 이론으로 인공지능의 대가에 올랐습니다. 그녀는 쥐가 탈출하기까지 나올 수 있는 모든 경우의 수를 계산해낼 수 있는 공식을 만들어냈고, 그것을 통해 쥐의 행태를 예측할 수 있었던 것입니다.    

 

 

필자와 잠시 동안 함께 일했던 인공지능의 세계적인 대가에 따르면 그녀의 이론에 십만 분의 1의 오차가 있다고 했지만, 인공지능의 기본 원리는 예측가능한 모든 경우의 수를 계산해 최적의 수를 제시하는 것입니다. 어떤 사람이 특정한 것(어떤 것이라도 상관없다)을 얻기 위해 자신의 자산을 투자하려고 할 때 그의 결정을 미리 예측할 수 있다면 그것보다 더 좋은 마케팅은 없을 것입니다.   

 

  

비록 추론하고 상상할 수 있는 인공지능의 개발을 위해 획기적인 이론이 나오지 않았지만, 구글 정도의 빅데이터가 쌓이면 인간처럼 추론하고 상상할 수 있는 인공지능의 전 단계까지는 갈 수 있습니다. 구글이 미국의 가장 큰 도서관에 소장돼 있는 모든 책을 스케닝하려고 했던 것도 그 속에 담겨 있는 정보뿐만 아니라, 무한대의 단어와 문장, 감정과 상황에 따른 다양한 반응 등을 분석해 인공지능의 개발에 이용하려 했기 때문입니다.   


 

                                         

 

 

헌데 말입니다, 창업 10개월 만에 잭팟을 터뜨린 유투브의 창업자와 임직원들이 한 일이란 사이버 영상놀이터를 만들어 보자는 아이디어를 빼면 아무것도 한 일이 없다는 것입니다. 그들의 기술이라는 것이 인터넷이 평등의 공간이기 때문에 모든 코드가 공개되어야 한다고 믿었던 위대한 선각자들, (그러나 그 기술들이 악용되는 것을 그저 지켜볼 뿐 아무 것도 할 수 없는) 오픈 소스주의자들의 기술에 전적으로 의존했다는 사실입니다.

 

 

즉 특별한 원천기술이 있는 것도 아닌 그들은 다른 기업에서 만든 동영상 압축·전송 기술, 아마추어가 촬영한 동영상을 쉽게 편집할 수 있도록 만들어진 개인용 영상장비, 특정 국가와 기업들이 깔아놓은 인터넷 광대역망이라는 기반시설의 도움을 받아 잭팟을 터뜨린 것입니다. 최근에는 유투브를 이용해 돈을 버는 사람과 기업들이 늘어나고 있지만 그 확률이라는 것이 수십억 분의 1도 안됩니다.

 

 

가벼운 경제가 고용없는 성장으로 귀착되기 쉬운 것도 이 때문입니다. 구글의 야심대로 추론하고 상상할 수 있는 인공지능이 나오면 고용없는 성장은 최고에 이를 것입니다. 여기에 개인용 컴퓨터가 슈퍼컴퓨터와 별반 다르지 않게 만들며, 해킹이 원천적으로 차단되는 양자컴퓨터까지 개발되면 만물의 영장 자리는 인간이 아닌 인공지능이 될 수도 있습니다. 세계 최고의 과학자들이 인공지능의 개발을 경계하는 이유도 여기에 있습니다. 

 

 

이 정도가 되면 인간이 컴퓨터와 인터넷을 이용해 진화하고 있는 것인지, 아니면 컴퓨터와 인터넷이 인간을 이용해 진화하고 있는 것인지, 인간이 프로그래밍 한 컴퓨터와 인터넷이 이제는 인간을 프로그래밍하고 통제하는 것은 아닌지 헷갈릴 판입니다. 어쩌면 우리는 빅브라더의 세상에 접어들었는지도 모릅니다. 위험사회를 넘어 감시사회에 이른 것이지요. 



이세돌과 알파고의 대결은 또 다른 차원의 열릴 수 있다는 것을 말해줍니다. 인간이 하던 일의 대부분이, 그것도 창조적이고 깊은 성찰이 필요로 하는 일들까지 인공지능에 넘겨줘야 할지도 모릅니다. 인간은 월급을 줘야 하지만 인공지능은 데이터만 늘려주면 되기 때문에 인건비도 필요없습니다. 바둑은 무한대에 이르는 경우의 수가 나오기 때문에 이세돌 정도의 강자를 이기려면 상당한 시간이 걸릴 것으로 보였는데, 그것마저 몇 년이나 단축했으니 이세돌의 패배를 과대포장할 없지만, 단순한 1패로 볼 수 있는 일은 아닙니다.