본문 바로가기

IT

빅데이터와 인공지능 그리고 빅브라더ㅡ3



우리가 흔히 알고 있듯이 컴퓨터는 0과 1이라는 단 두 개의 비트를 이용해 인공지능이라는 추론과 사고의 영역까지 넘볼 수 있게 되었다. 컴퓨터의 최종 목표인 인공지능에 대한 초기 연구는 1940년대 현대적인 디지털 컴퓨터가 개발되면서 시작됐다. 당시의 연구가들은 인간의 두뇌처럼 연상과 추론이라는 생각하는 과정을 자동화하는 인공지능의 개발이 가능하다고 믿었다. 



초기 연구가들은 인간의 능력보다 수만 수십만 배 빠른 계산의 끝에는 인간의 두뇌가 하는 역할을 할 수 있는 인공지능에 이를 수 있다고 생각했다. 이들은 '논리적 추론, 의미의 발견, 일반화, 과거의 경험으로부터의 학습 등과 같은 주로 인간의 고도의 지적 처리 특성과 관계된 일을 수행할 수 있는 능력'을 보유한 인공지능을 개발하기 위해, 많은 논리학자들과 수학자들에 의해 수년에 걸쳐 진행되는 정리증명(theorem proving)이나, 서양의 바둑인 체스 게임을 알고리즘의 모델로 채택했다.



                                                                       


이를 테면 0과 1의 비트에 논리적 연산과정의 흐름을 계속할 수 있는 yes와, 다시 처음이나 전 단계로 가는 no를 부여해 숱한 시행착오를 반복한 끝에 가장 좋은 답이나 확률적으로 가장 높은 해답에 이를 때까지 주어진 질문을 발전적으로 해결하는 방식을 취한다. 주어진 조건(인간의 경우 기억을 구성하는 언어가 핵심이다)에서 다음 단계에서 발생할 수 있는 모든 경우의 수를 빛의 속도로 검토한 뒤 최적의 해답을 찾아가는 알고리즘이 인공지능의 바탕을 이룬다. 



우리들이 사용하고 있는 디지털 컴퓨터는 주어진 문제를 해결하기 위해 직렬방식이나 주어진 순서대로 계산한다. 별개의 입력회로가 데이터를 각각의 기억장치에 저장한 후, 한 번에 하나씩 중앙처리장치로 전달된 정보를 처리하면, 그 결과가 외부 출력장치에 의해 출력된다. 이런 직렬방식의 계산은 주어진 조건에 따라 계산을 해나기 때문에 인간보다 빠른 계산은 가능하나, 인간의 감정처럼 수시로 변할 수 있는 것들은 처리할 수 없다.



인간의 사고능력은 과거의 기억(주로 의식에 해당하며 보통 단어와 문장의 형태, 즉 언어로 상상한다. 우리가 침대를 떠올릴 때 침대라는 명사가 없이 침대를 떠올릴 수 없는 것과 같다. 우리가 상상하는 모든 것에는 이름이 붙어 있기 때문에 기억이라는 것은 장면을 떠올린다 해도 그것이 무엇인지 알려면 개개의 것들에 이름이 부여돼야 한다)을 기반으로 수많은 연상과 추론과정을 통한 일반화와 의미의 추론을 동시에 처리하는 인간의 사고능력을 재현할 수 없다.



이래서 나온 것이 모든 경우의 수를 빛의 속도로 계산할 수 있는 병렬처리방식이다. 대당 수백억에 달하는 슈퍼컴퓨터들은 주어진 문제를 여러 개의 CPU로 발생 가능한 경우의 수를 동시에 처리·종합해 최적의 해답을 찾아가는 병렬처리방식을 채택했다. CERN에서 근무할 당시 w입자(보손)를 처음 발견한 한스 그라스만의 《모든 이들을 위한 물리학》을 보면 병렬처리방식의 알고리즘이 자세히 나와 있는데, 이를 옮길 수 없어 위키백과에 나온 내용으로 대신하고자 한다. 핵심은 컴퓨터 가격을 천정부지로 올리는 병렬처리방식을 도입하면 일반용 디지털 컴퓨터보다 엄청나게 빠른 계산이 가능하다는 것이다. 



마이크로 전자공학 분야, 그중에서도 초고밀도 집적회로(VLSI) 분야에서와 프로그래밍 분야에서의 큰 진전으로 특히 일본과 미국에서의 인공지능 연구에 대한 노력이 증대되었다. 많은 연구가들은 고밀도 집적회로 기술이 진정한 의미의 지능형 기계를 만드는 데 필요한 하드웨어 기반을 제공할 수 있을 것이라고 믿고 있다. 그들은 그런 지능형 컴퓨터는 오직 병렬처리를 할 수 있는 내부구조를 통해서만 가능하다고 믿고 있는데, 여기서 병렬처리란 수백만 개의 중앙처리장치(CPU)·기억장치·입출력장치가 1개의 작은 실리콘 칩 안에 들어가 있는 집적회로를 여러 개 사용하여 기억·논리·제어 등과 같은 몇 개의 독립된 것을 말한다. 



기상변화를 예측하고 핵발전을 제어하는데 사용되는 슈퍼컴퓨터들이 이런 병렬처리방식을 채택하고 있다. 우리가 사용하고 있는 개인용 컴퓨터는 중앙처리장치와 기억장치, 입출력장치의 한계용량(가격을 결정한다) 때문에 병렬처리방식을 채택할 수 없다. 물론 한스 그라시만의 책을 보면 소니의 플레이테이션3의 알고리즘을 다운받으면 개인용 컴퓨터도 슈퍼컴퓨터가 될 수 있다고 한다. 



2012년에 캐나다에서 이미 만들었다고 주장하는 양자컴퓨터(대당 120억원 정도)가 개발돼 보편화되면 모든 컴퓨터가 슈퍼컴이 될 수도 있다. 여기서 말하는 보편화란 대당 가격이 200~300만원 이하를 뜻한다고 보면 된다. 엄청난 양의 데이터를 저장하는 구글의 경우 클라우딩 시스템(수많은 컴퓨터를 연동해 하나의 데이터 저장장치처럼 사용하는 시스템으로, CERN에서 일반인 컴퓨터의 여유 용량을 묶어 천체관측에 활용하기도 한다)을 사용한다. 



중고 컴퓨터로 가득 찬 구글의 데이터센터라는 것이 이를 말하며 애플이나 삼성전자, 이통사들도 비슷한 시스템을 구축해 서비스를 하고 있다. 이런 식으로 서버 비용을 획기적으로 줄이면서 인공지능의 연구가 비약적인 발전을 이루었고 다음과 같은 결과물을 내놓을 수 있었다. 수만에서 수십만에 이르는 좀비PC를 이용하는 디도스 공격이 클라우딩 시스템을 이용해 데이터센터(서버)를 마비시키는 것이라고 보면 된다.  



(1980년부터 본격화된) 디지털 컴퓨터나 컴퓨터가 제어하는 로봇 장치가 논리적 추론, 의미의 발견, 일반화, 과거의 경험으로부터의 학습 등과 같은 주로 인간의 고도의 지적 처리 특성과 관계된 일을 수행할 수 있는 능력을 지닌 컴퓨터 알고리즘인 인공지능에 관한 연구는 실제로 유용한 몇 개의 업적을 남겼는데 그것은 의사결정·언어이해·형상인식 등과 관련된 분야이다.

필자가 인공지능의 세계적인 대가와 잠시 동안 사업을 할 때 삼성물산에서 200억원을 투입해 의사결정시스템을 개발하는 사업을 수주할 뻔했는데, 당시의 프로그래머가 설명해준 의사결정시스템의 알고리즘은 흔히 수백 개 또는 수천 개의 '조건-시행문'(if-then)의 형태로 구성된 논리적 규칙들로 이루어진다. 삼성물산이 개발하려고 했던 의사결정시스템은 원자재 구입부터 시작해 최종 결정자의 선택까지 하나의 연산과정으로 묶는 것이었다. 


현재 세계적으로 널리 알려진 의사결정시스템은 카네기멜론대의 인공지능 이론의 세계적인 대가인 싱 교수가 개발한 미 국방부의 무기구입시스템이다. 중요한 사실은 어느 시스템이나 할 것 없이 수없이 많은 단계로 이루어진 결정과정을 자동화하는 것이므로, 해고가 늘어나고 신규 고용 창출이 줄어들게 된다. 매 단계의 의사결정에 개입하게 마련인 인간의 경험과 지식이 자동화되니 고위임직원들도 버터낼 방법이 없다. 


이런 인공지능 알고리즘을 채택한 최초의 게임이 한국에서 대박을 터뜨린 스타크래프트이다. 필자는 단 한 번도 스타크래프트를 해본 적이 없지만 게임이 돌아가는 기본 알고리즘에 대한 이해는 얼마든지 가능했다. 


                                                         

인공지능의 대표적인 알고리즘으로 매 단계마다 주어지는 '조건-시행문'(if-then)이란 논리적 규칙들은 프로그래머의 능력에 따라 수천 줄로 이루어진 소프트웨어가 될 수도 있고, 수만 줄로 이루어진 소프트웨어가 될 수도 있다. 뛰어난 프로그래머일수록 논리학의 언어인 수학에 탁월한 재능을 가지고 있어 최적의 해답을 찾아가는 '조건-시행문(if-then)'을 최소한으로 사용해서 소프트웨어를 작성한다. 


흔히 컴퓨터 프로그래머들이 특정 소프트웨어에 대해 무겁다거나 가볍다고 말하는 것이 이것을 뜻한다. 즉 무거운 소프트웨어일수록 프로그램의 크기 커서 이를 수용할 컴퓨터의 CPU가 무한대로 커지며, 주어진 문제가 CPU의 동시 처리 용량을 넘어설 때 나타나는 각종 버그나 오류가 수시로 발생한다. 스마트폰 메이커들이 수시로 프로그램을 업그레이드하는 것이 '조건-시행문(if-then)'을 최적화해가는 과정이라고 보면 된다. 


결국 적은 '조건-시행문(if-then)'으로 짜진 가벼운 소프트웨어는 정반대의 결과를 가져온다. 우리가 프로그래머의 등급을 나눌 때 기준이 되는 것이 똑같은 기능을 하는 소프트웨어를 최소한의 '조건-시행문(if-then)'의 형태의 논리적 규칙들을 사용해 만들 수 있는 능력이다. 세계적인 프로그래머들이 수학과 논리학, 언어학에서 뛰어난 재능을 보여주는 공통점이 있는데, 이들 사이에서도 수학과 논리학, 언어학 중에서 전문 분야가 있기 마련이다. 


인류가 개발한 모든 사유방식이 '조건-시행문(if-then)'의 형태의 논리적 규칙들을 이루는데 대표적인 것이 하나의 주어진 사실에서 결론(진리)을 추론해가는 과정인 연역법과 결론(진리)에서 거꾸로 추론해 하나의 사실에 이르는 귀납법 등이다. 변증법적 사고와 변증법적 유물론도 사용될지도 모른다. 인공지능 알고리즘을 짜는 프로그래머의 능력이 높을수록 최종 결과는 인간의 사고능력에 근접할 수 있다. 


                                                인공지능이 탑재된 원숭이로봇

 

언어이해(자연언어처리)는 음성인식과 거의 동일한 알고리즘을 말한다. 인간의 음성을 인식해 이해한 뒤 컴퓨터 고유의 연산작용을 가동하는 것을 말한다. 빅데이터가 가장 필요한 부분이 언어이해인데, 인간의 기억과 감정 등이 결국은 언어에 대한 이해이기 때문이다. 비트켄슈타인이나 촘스키, 딜뢰즈, 데리다 등이 언어학과 기호학 및 논리학의 대가였는데 이들의 연구가 상당한 영향을 미친 분야가 인공지능이 수행하는 언어이해이다.  


형상인식(컴퓨터 시각)은 가장 널리 알려진 것이 상상하는 모든 것을 구현해내는 CG가 대표적이다. 무인우주탐사선과 3D영상장비, 3차원 홀로그램, 로봇공학 등에도 사용된다. 이밖에도 여러 가지 자동처리 기능을 지닌 전자기기에도 인공지능이 사용되지만, 앞의 글에서 밝혀듯이 인간의 두뇌처럼 고도의 추론과 연산작용을 할 수 있는 획기적인 인공지능 이론이 나오지는 않았다. 


그래서 구글의 꿈은 탁월한 프로그래머만이 꿈꿀 수 있는 일종의 유토피아라 할 수 있다. 천재들의 집단연구라 해도 21세기 안에 인간을 대체할 인공지능의 출현은 불가능할 것으로 보인다. 뉴턴이나 아인슈타인 같은 불세출의 천재가 나오지 않는 이상. 이제 남은 것은 감시사회의 도래를 의미하는 빅브라더의 출현이다. 이는 다음 글에서 다루도록 하겠다. 지금 감시사회에 대한 책들을 읽고 있으니 다음 글이 조금 오래 걸릴 수도 있다.


참고로 인공지능 컴퓨터의 기준인 튜링테스트(인공지능이 인간처럼 생각하는 능력을 갖고 있는지 판별하는 기준으로 통한다. 인간과 대화 중인 AI를 제3자인 인간이 가려낼 수 없다면, 그 AI를 '인간처럼 생각할 수 있는' 것으로 본다는 게 핵심이다)을 통과한 컴퓨터가 나왔다. 지난 6월 7일 런던 왕립학회가 주최한 '튜링테스트2014' 현장에서 '유진 구스트만'이란 이름의 슈퍼컴퓨터가 처음으로 65년 된 튜링테스트를 통과했다.


극단적인 진화론자이자 《이기적인 유전자》의 저자인 리처드 도킨스는 그의 진정한 대표작인 《눈먼 시계공》에서 인류 다음에 올 진화의 승자가 인공지능 컴퓨터가 될 수 있다고 했으며, 그것이 진화의 법칙에서 전혀 이상하지 않다고 말했다. 브루스 립튼의 《자발적 진화》를 보면 리처드 도킨스의 오류를 지적하는 내용이 나오는데, 진화론과 분자생물학에 관심이 있는 독자라면 리처드 도킨스의 주장에 너무 경도되는 것은 위험할 수도 있다. 



하지만 오늘 구글의 인공지능인 알파고가 세계 최강자 중의 한 명인 이세돌 9단을 꺾었다. 바둑이란 특수한 종목이기에 인공지능인 알파고가 이세돌을 꺾을 수 있었다. 수천만 건의 기보를 저장한 상태에서, 빠른 연산이 가능하도록 프로그램된 인공지능이라면 이세돌과의 한 수 한 수마다 최상의 수를 찾는 것이 불가능하지는 않다. 초반의 포석부터 국지전투, 대마사냥이나 전세를 파악해 집으로 가는 전략까지 저장된 수천만 건의 기보를 활용하기 때문에 최상의 수를 계속해서 둘 수 있다.


이세돌을 비롯해 많은 바둑고수들이 알파고도 실수가 있었으며, 패착이 될 수 있는 수들이 있었다고 했지만 나중에 가서 보니 이세돌이 져있었다는 말을 제일 많이 했다. 마치 이창호가 최강의 자리에 있을 때 기리에 어긋나는 수를 둔 것이 나중에 보니 반집이라도 남기는 심원한 수였다고 것이 복기과정에서 밝혀진 것과 비슷하다. 알파고의 승리는 역사적 사건으로 기록되겠지만, 그렇다고 인간의 창조적인 일을 대체할 정도에 이르지는 않았다.  


바둑은 경우의 수를 찾아가는 것이기에, 저장된 기보가 늘고, 그것을 가지고 수없이 많은 판을 두다 보면 최상의 수를 찾는 것이 가능하다. 이런 방식으로 인공지능의 기력이 늘어나면 현 세계최강인 커제도 꺾을 수 있다. 특히 인공지능은 고수와의 바둑을 두는 매판이 기력향상으로 이어지기 때문에 초일류강장와의 대국이 늘어날수록 더욱 기력이 세질 것이다. 


이런 과정을 통해 기사들이 말하는 기세나 감각까지 파악할 수 있는 수준에 이르면 무적이 된다. 이런 식으로 다양한 분야에서 빅데이터가 구축되고 그것에 따른 인공지능이 구축되면 언젠가는 인간처럼 사랑하고 슬퍼하는 것까지 가능해질 수밖에 없다. 아직은 그 단계로 넘어가기 위한 획기적인 연구가 나오지 않은 상태라 빅데이터를 활용하는 것에서만 비약적인 발전을 이룰 수 있다. 


바로 이 때문에 경제뉴스나 증권뉴스 등은 인공지능이 대신할 수 있다. 구글이 현재 진행 중인 거의 모든 책들의 스캔이 끝나면 소설이나 에세이 등에 나오는 온갖 종류의 사랑에도 눈을 뜰 터, 그럴 경우 인간이 보기에는 분명한 감정으로 보이는 것을 인공지능이 보여줄 수 있다. 여기에 이르면 인류 다음의 지구의 지배자는 무조건 인공지능이다. 허면, 약점과 허점이 수두룩한 인간은 어떻게 될까? 오늘의 이세돌의 패배가 미래의 모습을 보여주는 전조가 아닐까? 아무튼 인간보다 못한 자들이 나라를 다스리는 나라에서 인공지능이 최고의 기사마저 이겨버렸다.


이제 인류는 고민을 해야 할 때다. 기술발전이 인간의 일자리를 없애고 빈곤을 양산한다면 그런 기술의 사용범위를 정해야 한다. 과학기술의 발전이 언제나 선만은 아니다. 우리는 인간으로서 발전하는 것이 아니라 과학기술의 결과물을 가지고 가장 편안한 삶을 위한 퇴화의 길을 가고 있다. 과학기술에 철학적이고 도덕적이며 윤리적인 잣대를 영원히 면제해줄 수는 없는 것이 아닌가 판단된다.  


  

                                                                                               사진 출처 : 구글이미지