인간의 지능을 가진 지능기계 'AI', 지구별 행성에 출현하다

세상에서 유일하게 언어로 생각하는 사회성 동물, 호모 사피엔스

인공지능의 핵심은 인간의 언어입니다. 그래서 인공지능을 이해하기 위해서는 언어가 인간과 인류사회에 어떤 의미가 있고 어떻게 시작되었는지 살펴보는 것이 매우 중요합니다. 어떤 역사를 거쳐 인간이 문명을 일으켰고 오늘날 인공지능의 창조에까지 이르렀는지 성찰해보는 것이 곡 필요합니다.

인간은 지구상에서 유일하게 언어로 생각하고 언어로 소통하는 사회성 동물입니다. 인류가 다른 동식물과 다르게 지능을 발달시켜 문명을 발전시키고 오늘날 현대 산업 기계문명까지 건설할 수 있었던 가장 주요한 핵심 동인은 다름아닌 언어입니다.

미성숙한 채 태어난 인간의 아기는 태어나자마자 뇌세포가 폭발하듯이 늘어납니다. 그리고 어머니 젖을 먹고 성장하면서 눈귀코입살갗 등의 감각기관을 통해 세상을 보고 듣고 냄새맡고 맛보고 만져보는 행동으로 세상을 인식하기 시작합니다. '함'을 통해 '앎'이 생겨납니다.

성장하는 생명체 아이가 맨 먼저 배우는 것은 언어입니다. 아이는 언어를 통해 세상을 이름으로 분별하기 시작합니다. 언어를 통해 자신의 세상, 다른 공동체 구성원과 함께 공유하는 세상을 만들어 나갑니다. 그래야만 환경에 적응해 생존해 나갈 수 있기 때문입니다.

사람과 유전자가 98% 이상이나 같은 침팬지도 소리를 질러 의사소통을 하고 새들도 지저귀면서 의사소통을 합니다. 개미는 페르몬으로, 식물은 잎에서 뿌리는 휘발성 유기화합물(BVOCs)로 의사소통을 합니다. 그러나 새의 지저귐과 침팬지의 외침은 언어는 아닙니다.

동물은 소리지르고 새는 지저귀고 사람은 말을 합니다.

언어는 사물이나 사실과 분리된 기호와 상징, 개념들로 이루어집니다. 언어는 '몸', '바디(body)' 등 서로 다른 말소리로 언어 구성원들의 합의에 의해 만들어지고 사용됩니다. '자본', '이윤', '사회운동', '국가', '인공지능'이라는 말을 원숭이와 호랑지빠귀는 아마도 이해할 수 없을 것입니다.

오직 인간만이 으르렁거리거나 소리지르지 않고, 즉 진동없이 의사소통을 할 수 있는 '속삭이는' 동물입니다. 언어가 있기 때문에 가능한 일입니다.

인류는 언어를 통한 지식-정보의 집적과 무리생활을 통해 기술과 문명을 발달시켜왔습니다. 사람은 언어를 통해 소통하는 다른 사람들과의 무리에 속하지 못하면 사람으로서 세계를 인식할 수도 없고 사람으로 세상을 살아갈 능력도 상실합니다.

1920년 인도에서 발견된 늑대 소녀 자매의 예가 극명하게 보여주듯 사람은 유아기에 늑대 사회에서 양육되면 늑대로 성장합니다. 늑대 소녀는 많은 노력에도 불구하고 결코 사람의 언어를 학습하지 못했습니다.

우리는 언제부터 언어를 사용했을까

호모 사피엔스가 언제 언어를 사용했는지는 알 수 없습니다. 다만 현생 인류가 아프리카에 출현했을 초기부터 소리지르고 으르렁거리고 흥얼거리는 데서 한 걸음 한걸음 그야말로 아주 더디게 언어 사용으로 나아갔던 것으로 보입니다.

그러다가 어느 순간 이른바 '특이점'이 나타나 원시언어를 사용하기 시작했을 것입니다. 원시 언어는 하나가 아니었습니다. 아프리카, 아시아, 유럽, 아메리카, 오스트레일리아 등 서로 멀리 떨어져 분리되어 있거나 고립되어 서로 다른 자연환경에 적응해 생존해나간 수많은 수렵채취 사회들에서 서로 다른 수천의 언어가 시작되었습니다. 오늘날 언어는 약 7000개가 넘습니다.

현대문명과 떨어져 고립된 아마존 피다한족의 언어는 3개의 모음과 8개의 자음뿐입니다. 복문이나 중문 완료시제도 없습니다. 숫자도 없습니다. 그리고 주요한 의사소통 수단으로 콧노래, 외침, 노래, 휘파람 등을 사용합니다. 피다한 족의 언어와 의사소통은 언어의 발생을 보여주는 살아 있는 언어 화석이라고 할 수 있습니다.(다니엘 에버렛, 󰡔잠들면 안돼, 거기 뱀이 있어󰡕, 꾸리에)

인류 문화의 '도약'이라고 표현되는 약 4만~4만5000년 전부터는 인간이 언어를 사용했다는 분명한 증거들이 나타납니다. 장신구, 동굴벽화, 복잡한 무기, 악기, 불피운 자리의 보존, 매장 등이 그 증거들입니다. 이는 언어를 통한 사유와 상상, 상징의 전달, 모방 학습 행동 등 언어가 없으면 불가능한 문화와 기술의 산출물들입니다. 인류는 처음으로 죽음 이후의 세계를 포함해서 언어로 세계를 해석하고 재구성하기 시작합니다.

인도네시아 술라웨시 섬에서 발견된 4만 3900년 전 동굴벽화에는 작고 사나운 물소와 이를 사냥하는 6명의 작은 사냥꾼이 그려져 있습니다. 창을 들고 있는 이들 사냥꾼들은 새의 부리가 달려 있거나 꼬리가 달린, 반은 사람 반은 짐승인 '반인반수'입니다.

인간이 반인반수라는 상상의 동물을 창조해내고, 무리들과 함께 후대까지 기억을 광범위하게 공유할 수 있도록 그림이라는 상징을 만들 수 있는 것은 오직 사회성 언어의 소통이 있어야만 가능한 일입니다. 세계에 대한 해석과 함께 애니미즘과 종교 의례의 등장도 마찬가지입니다.

학자들은 인간의 언어 사용은 오랜 기간에 걸쳐 언어와 지능을 발전시키는 방향으로 신체구조가 바뀌는 자연선택의 결과라고 보고 있습니다.

말을 하기 위해서는 후두부가 아래로 내려가고 성대가 부풀어 오르고 위 아래로 움직이는 공명공간이 생기는 등 소리길이 생겨야 합니다. 무엇보다도 이에 조응한 뇌구조의 변화가 일어나야 합니다. 어느날 갑자기 돌연변이로 언어 능력이 생겨난 게 아닙니다. 언어의 이데아인 본질 문법구조가 있고 모든 언어는 이같은 본질 문법구조의 변형이라는 촘스키의 이론은 대형 언어모델의 인공지능이 등장하면서 이제는 거의 거론조차 되지 않고 있습니다.

약 4만년 전 사라진 네안데르탈인은 두뇌도 크고 노래를 하거나 웅얼거리기는 했지만 말은 하지 못했을 것으로 추정됩니다. 언어의 문턱에는 이르렀지만 문턱을 넘지 못하고 멸종된 것입니다.

인간은 발음을 하려면 초당 약 220개의 근육을 움직여야 합니다. 소리를 낼 때 앵무새를 제외하고 인간만이 혀를 복잡하게 움직일 수 있습니다. 입과 목, 코와 혀, 허파 등 소리를 내는 데 필요한 신체 구조가 인간과 비슷한 동물들도 있습니다. 그러나 말을 하는 인간과 다른 포유류를 뚜렷하게 구분하는 표지는 발성기관을 조종하는 두뇌입니다.

인간 어린아이는 보통 1살이면 최초로 낱말들을 말하기 시작합니다. 18세가 되면 약 6만 개의 단어를 구사합니다. 잠자는 시간을 빼면 90분마다 한 낱말을 학습한 셈입니다.

호모 사피엔스는 모방과 학습능력이 뛰어난 사회성 동물입니다.

사람의 언어는 공유 언어다

외부에 객관으로 존재하는 그런 세계란 없습니다. 뱀은 귀가 없지만 긴 혀를 내밀어 세밀하게 냄새를 분별하고 피부가 감지하는 진동과 눈으로 세계를 인식합니다. 이원색의 시각을 가진 개는 눈으로는 흐릿한 세계를 볼 수 있을 뿐이지만 2억~3억만 개 이상의 코 감각 수용체가 맡은 냄새와 예민한 귀가 듣는 소리로 세계를 인식합니다. 장거리 여행 새는 자외선과 지구 자장까지 눈으로 봅니다. 박쥐는 초음파로 세계를 인식합니다.

개가 보는 세계와 뱀, 박쥐, 새가 인식하는 세계, 사람이 보고 실감하는 세계 가운데 어느 것이 객관으로 존재하는 세계인지 확언할 수 없습니다.

사람의 세계관이란 언어로 지어진 마음의 건축물입니다. 국가도 정당도 노동조합도 하나의 개념일 뿐입니다. 현실에 대한 날카로운 비판의식도 현실에 대한 모든 착시도 언어에서부터 시작합니다. 공자가 바른 이름(정명 正名)을 강조한 것도, 붓다가 명색(名色, 이름붙인 물질과 개념 namarupa)과 식(識, 분별심 vinnana)을 깨달음의 핵심 대상으로 삼은 것도 이 때문이라고 할 수 있습니다.

인간의 기억 시냅스는 불완전합니다. 중요하지 않다고 판단되는 행동에 대해서는 뇌의 기억 시냅스에서 지워버립니다. 그것이 생존에 유리하기 때문입니다. 동굴 벽에 그림을 그리고 부족의 서사시를 구전으로 전수하는 것은 개인을 뛰어넘어 세대에서 세대로 전해지는 집단 전체의 기억 시냅스 연결입니다.

인간은 언어를 통해 자신들의 사회성을 과거와 미래로까지 확장시켰습니다. 그리고 작은 씨족에서 부족연합을 거쳐 도시국가와 제국으로까지 규모를 확산시켰습니다.

인간의 언어가 공유언어라는 지적은 하나마나한 동어반복이 아닙니다. 오늘날 극단화된 사유재산 개념과는 정반대로 언어는 공유재산이라는 확연한 사실을 재확인하는 '낯설게 하기'의 명제입니다. 원시부족의 구전 서사시나 동굴벽화, 도시국가 수메르 점토판의 문서 기록, 전 세계 도서관의 소설과 역사서를 비롯한 지식과 정보, 디지털 네트워크에 저장된 모든 인간 행동의 정보와 기록은 인간의 사회성이 과거와 미래, 전 세계로 확장되고 확산된, 인간지능의 폭발을 보여주는 거대한 피라미드입니다. 이윤창출의 도구인 사유재산이 결코 아닙니다.

자신의 감각기관을 통해 자신의 세계관을 만들어 내 자신의 세상 속에서 사는 개개의 인간들이 지구상에는 약 80억 명이나 됩니다. 말하자면 이 지구상에는 서로 조금씩 모두 다른 개별 인간들의 세계가 80억 개나 됩니다.

동시에 인간은 공유 언어를 통해 공유하는 공통의 모국어 세계를 살고 있기도 합니다. 물론 지금 이 순간에도 모국어 세계 가운데 일부는 멸종돼 가고 있는 중입니다. 이미 영원히 멸종되어버린 모국어의 세계도 있습니다. 에스페란토어가 보급되지 않고 있는 이유는 에스페란토어가 모국어인 인간이 전혀 없고, 당연히 에스페란토 문화도 만들어지지 않았기 때문입니다.

인간의 뇌구조가 수용할 수 있는 친밀한 인간관계의 규모는 21세기인 지금도 여전히 수렵채취 시대의 부족 사회 단위에 머물러 있습니다. 모국어 집단의 크기 또한 일부 다언어 국가를 제외하고 대부분 아직 모국어 사용 국민국가 규모를 크게 넘어서지 못하고 있습니다.

사람과 AI의 지능은 공유지능이다

인간은 마침내 인간의 언어를 학습할 수 있는 기계지능을 만들었습니다. AI가 지능을 가질 수 있는 이유는 인간의 언어를 학습하기 때문입니다.

인간의 뇌구조가 언어와 사물을 학습하는 방식을 모방해서 인간의 지능을 갖게 된 지능기계가 지구별 행성에 처음 출현한 것입니다. 지금 여기의 80억 개 개별 인간들 세계관과 7000여 개 모국어 세계 뿐만 아니라 문자로 기록된 과거의 모든 세계들까지 학습해 새로 '생성'된 지능입니다. 창조주인 인간도 아직 정확히 파악할 수 없는 블랙홀의 '세계'이기도 합니다.

그리고 이제 대용량 언어모델(LLM)에 의한 인공지능은 나날이 인간보다 훨씬 더 뛰어난 AGI를 향해 가속페달을 밟고 있는 중입니다.

생성형(GPT, Generative Pre-trained Transformer) AI의 변환기(Transformer)란 일리야 수츠케버에 의하면 거인, 즉 AI의 심장에 있는 알고리즘의 이름입니다.(2023. 3. 21. 가디언 인터뷰)

사전 훈련(Pre-train)이란 거대한 텍스트 모음을 통해 거인에게 언어의 기본 패턴과 관계를 가르치는 교육, 즉 세상을 이해하도록 가르치는 것을 말합니다.

생성이란 AI가 이러한 지식 기반에서 새로운 생각을 만들어낼 수 있다는 것을 의미합니다. 2022년 11월 30일 최초로 공개된 오픈 AI의 챗GPT-4는 2021년 9월까지의 인간의 모든 지식과 정보를 딥러닝해서 새로운 지식과 정보를 '생성'한 그런 인공지능입니다.

다시 수츠케버에 따르면, 인간의 뇌는 느린 뉴런을 가진 신경망일 뿐입니다. 컴퓨터가 인간의 뇌와 비교할 수 없는 엄청나게 빠른 신경망과 변환기를 가진다면 다음 단어를 예측할 수 있는 비지도 학습, 이른바 딥러닝을 스스로 할 수 있게 됩니다. 실제로 GPT-4가 이를 실현했습니다. GPT-4의 변환기는 그냥 변환기가 아니라 스스로 판단하고 스스로 학습할 수 있는 자기회귀 변환기입니다.

GPT-4 초기에 오답을 하는 이른바 환각 현상은 인간 언어 데이터의 속성상 완전한 해결은 불가능하지만 추가로 인간의 피드백을 통한 강화학습으로 대폭 개선되고 있는 중입니다.

지금 오픈 AI의 챗GPT는 이미지같은 비언어 모델도 학습한 다중모드의(multi modal) 인공지능입니다.

생성형 AI를 사용해본 사람은 왜 빅테크 초거대 기업들이 수십 수백 수천조 단위의 천문학 비용을 들여서라도 AGI를 개발하려는지 금방 이해할 수 있을 것입니다. 그만큼 놀랄만큼 유용하고 우리가 겪고 있는 수많은 문제들을 해결할 수 있는 신천지가 눈 앞에 닥쳐온 것입니다.

문제는 인류의 공유재산인 공유언어가 오직 이윤만을 추구하는 극소수 빅테크 기업들의 사유재산으로 변환되고 있다는 사실입니다. 이것은 인간을 데이터 자원으로 변환해 새로운 식민지를 만들어 착취하는 침략전쟁에 다름 아닙니다.

인간지능이 공유지능이란 말은 개개인의 지능이 고유한 특징과 편차를 보인다는 사실을 무시한 평균주의 개념이 아닙니다. 언어를 통한 집적된 지식과 정보의 학습을 기반으로 인간지능은 새로운 지식을 생성해낼 뿐만 아니라 놀라운 창조력을 보여줍니다. 그러나 아인슈타인의 천재 지능이 발견한 상대성이론도 곧바로 모든 사람들에게 공유되고 인류 공통의 공유지능으로 흡수됩니다.

이같은 공유 인간지능을 학습한 인공지능을 사유화한다는 것은 언어도단입니다. 그런데 그런 일이 아무런 문제의식 없이 일어나고 있습니다. 성찰이 필요한 지점이라고 하지 않을 수 없습니다. 끝.

(* 네번째 글로 이어집니다. 이 글은 책읽는사회문화재단의 <웹진나비>에 동시 게재됩니다.)

박승옥 햇빛학교 이사장

헤드라인