AI의 한계
- Minwu Kim
- 2024년 4월 17일
- 5분 분량
최종 수정일: 2024년 12월 14일
이제 1년 간 인공지능 연구를 한다. 그에 맞게 머릿속을 인공지능에 대한 생각으로 조금씩 채워넣고 있다. 이런 예열 과정이 있고 없고는 본 게임에 들어갈 때 큰 차이를 낳는다. 특히 "무엇을 하는가"보다 "왜 하는가"를 정확하게 인지하고 있어야 한다. 일의 추진력은 다 거기서 나온다.
다만, 들어가기 앞서 좀 일상적인 얘기도 해야겠다. 일기에 너무 뜬구름 잡는 소리 밖에 없다. 삶을 사랑하자곤 말로는 다짐하고 실상은 전혀 그러질 못한다. 그래서 강제적으로 좀 일상적인 이야기를 조금이라도 써야겠다. 미래 말고 현재를 살아가고자 하는 나름의 시도이다.
비가 내렸다. 내 기억이 정확하다면 올해만 벌써 3번째다. 전만 해도 1년에 한 두번 올까말까 했던 걸로 기억한다. 기후변화인가 싶다.
이 나라는 비가 좀만 세차게 내리면 샷따를 내린다. 가성비가 안 맞아서 배수시스템을 안 만든걸로 알고 있는데, 그 탓에 비가 오면 그대로 바닥에 빗물이 고인다. 이 정도 주기가 계속 된다면 배수 시스템을 안 깐 득보다 실이 더 많을 것 같다.
수업은 온라인으로 진행됐고, 캠퍼스센터도 문을 닫았다. 비는 한 두 시간 휘몰아치다가 금세 그쳤는데 말이다. 하루 종일 방 안에 박혀서 수업 듣고 과제를 했다. 꼭 4년 전 코로나 때 같았다.
답답해서 저녁 먹고 학교를 혼자 두 바퀴 돌았다. 바람이 선선했다. 물 비린내를 들이쉬며 발 밑의 웅덩이를 피해갔다. 먹구름 잔뜩 끼면 나도 덩달아 축 쳐져서 그런 날씨를 진짜 싫어한다. 하지만 이 나라에선 그게 너무 오랜만인지라 그것도 반가웠다.
다들 방 안에 박혀있었던지라 학교가 무서우리만치 조용했다. 그게 참 이질감이 들었다. 다들 떠나서 공간이 빈 것이 아닌, 실내에 박혀 공간이 빈 것이니까. 아무튼 나는 덕분에 오랜만에 그런 한적함을 즐겼다. 긴장이 풀리는 느낌이었다. 요즘 학교가 싫었던 이유는 어쩌면 장소가 아니라 좁아터진 공간에 아는 얼굴들이 너무 많아서였을지도 모르겠단 생각이 들었다.
치약이 다 떨어졌는데 학교 매점은 문을 닫아서 바로 맞은 편 슈퍼로 갔다. 초등학생 정도 되어 보이는 남매가 아이스크림을 사려 하더라. 그것까지 내가 계산했다. 그냥 오늘은 기분이 좋아서 그런 오지랖 한 번 부려보고 싶었다. 꼬마애가 날 보고 콧잔등을 찌그려뜨리며 웃는데, 거기에 완전히 녹아버렸다. 인종도 다른 남의 집 딸내미 보고도 이런데, 자기 자식이면 오죽할까. 이래서 아빠들이 딸바보 되는건가 싶다.
내일도 온라인 수업이다. 어차피 월/수는 수업이 없는지라 큰 변화는 없다만, 도서관은 열었으면 좋겠다. 난 방에서 일 잘 못한다.
아, 그리고 내일 모레는 뤼이드 면접이다. 혹시나 하고 지원해보았는데, 불러주시니 기분 좋다. 지금 와서 전공상식 벼락치기는 해봤자 의미 없을 것 같고, 내일 그냥 뭐 하는 회사인지 좀 뒤져봐야겠다. 전에 한 번 거기 ML옵스 엔지니어 리드 분이 강연한 걸 본 기억이 나는데, 꽤 재밌었던걸로 기억한다.
현재 AI는 무지막지한 데이터, 그리고 각종 뉴럴네트워크 아키텍쳐의 변주로 볼 수 있을 것 같다. 디퓨전이니, JEPA니, Transformer니, Dreamer니, 다 그런 식이다. 아예 무슨 배터리 혁신이나 양자컴퓨팅이나 초전도체 같은 새로운 패러다임이 나온다면 모를까, 아마 최소 5-10년 간은 이런 식으로 계속 갈 것 같다.
Martin Ford의 <Rule of the Robots> 챕터 5를 읽었다. AGI로 가기까지의 도전과 현재 기술력 한계를 설명한다. 책에 따르면 4가지 장애물이 있다.
Common sense
Unsupervised Learning
Understanding Causation
Transfer Learning
첫째로는 상식이다. 이런 예시들이 있다:
The city council refused the demonstrators a permit because they feared violence.Who feared violence? The answer is easy for virtually anyone: the city council. But now change just one word in the sentence: The city council refused the demonstrators a permit because they advocated violence. Who advocated violence?
It’s fairly easy for an AI system to learn factual material about photosynthesis from a biology textbook, for example. But the real challenge, says Etzioni, is when you have a question like “If you have a plant in a dark room and you move it nearer the window, will the plant’s leaves grow faster, slower or at the same rate?” This requires understanding that there will be more light closer to the window and the ability to reason that this will allow the plant to grow faster.
이렇듯, 인간에겐 너무 당연하게 여겨지는 것들을 기계가 알기는 어렵다는 것이다. 예를 들어 현재 transformer 기반의 LLM들은 그저 글들의 앞 뒤 배열들의 관계성을 파악하며 인간의 언어를 흉내내는 메커니즘이다. 거기에 인간이 어떻게 "상식"을 받아들이고 이해하는지는 고려되지 않았다. 이에 대해서 1년 전에 노엄촘스키가 뉴욕타임즈에 기고한 칼럼이 있는데, 논지가 비슷하다. 거기에 잘 설명이 되어있다.
하지만, 이러한 것도 요즘 들어선 큰 문제가 되진 않는 것 같다. 이 책은 2021년 책이라 벌써 구닥다리가 되었다. 요즘 ChatGPT4를 보면 LLM이 상식을 이해하는데 큰 어려움을 겪고 있지 않은 것 같다. 그냥 데이터 늘리고 파라미터 늘렸더니 알아서 잘 답을 하더라는 것이다.
그럼에도 불구하고 "상식"에 대한 생각은 일단 머릿속에 담아두는 것이 좋을 것 같다. 이 철학적 담론이 또 언제 대두될지 모른다.
둘째로는 unsupervised learning이다. 인간에겐 목적성이 불분명한 행동들이 있다. 이를테면 이런 것이 있다.
Newly born babies begin the process almost immediately, learning directly from their environment long before they have the physical ability to interact with it in any deliberate way. Somehow, they manage to develop a physical model of the world and begin to build the base of knowledge that underlies common sense. This ability to learn directly and without assistance from structured and labeled data is known as “unsupervised learning.” This remarkable ability may well be enabled by some kind of cognitive structure built into the child’s brain, but there is no doubt that the ability of a human child to learn independently, and especially to acquire language, vastly outpaces anything that can be accomplished with the most powerful deep learning system.
이를 구현하기 어려운 것은, 우리가 영유아가 세상을 이해하는 매커니즘을 잘 알지 못하기 때문이다. 세계와 상호작용하며 체득하는 감각은 과연 어떻게 정의할 수 있을까. 잘 모르겠지만 world model이 하나의 접근이 될 수도 있겠다는 생각도 든다. 얀레쿤이 특히 여기에 진심인데, 이 문제를 타파하지 못하면 인공지능 연구는 큰 진척이 없을 것 같다고 까지 한다.
셋째는 understanding causation이다. 상관관계와 인과관계는 완전히 별개라는 것은 계량경제학에서 귀에 딱지가 돋도록 듣는 말이다. 문제는 현재 인공지능은 상관관계에 의존을 한다는 것이다. 데이터 왕창 때려넣어서, "이게 x일 때 y는 이거야" 식의 무식한 학습법이니 당연히 상관관계에 머무를 수 밖에 없다. 밑에 비트코인과 아보카도 가격 추이의 상관성은 유명한 예시이다.
요즘 수업 과제로 계량경제학 논문들도 몇개 읽어보고 있다. 읽을 때 마다 느끼는데, causal inference는 수학적 모델링도 물론 중요하지만, 사고력과 직관이 훠어얼씬 중요하다. 이를테면 그 유명한 대런 아세모글루의 <The Colonial Origins of Development>연구는 식민지배 시대 당시 식민지의 유러피언 사망률을 도구변수 삼아 한 나라의 institution이 경제 발전에 미치는 영향을 추정한다. 성급한 가정도 많고 나중 가서 많이 반박이 된 연구이지만, 그 아이디어만큼은 진짜 천재적이다. 하지만 corr(z,x)!=0 && corr(z,u)==0이라는 변수간의 관계성을 기계가 어떻게 직관적으로 파악할 수 있을까. 그건 인간도 제대로 못하고 있는 영역이며, 가정들로 넘쳐나는 계량경제학 논문들을 읽고나면 대부분 잘 납득이 가지 않는 이유도 그것이지 않을까 싶다 (아 물론 내가 아는게 없어서 함부로 나불대는 헛소리일 가능성이 크다. 귀도 임벤스 같은 똑똑이들이 ML-based Causal IV 같은 연구도 활발히 진행하고 있는 것으로 알고 있다).
넷째는 transfer learning이다. 이를테면 바둑 두는 머리로 체스를 두는, 혹은 테트리스 하다가 아타리 게임하는, 비슷하지만 다른 경우의 것을 범용적으로 핸들할 수 있는 인공지능을 만드는 것이다.
책에선 이런 예시를 든다:
Could an artificial intelligence system read a historical document like the History of the Peloponnesian War and then successfully apply what it learns to a contemporary geopolitical situation?
가고 싶었지만 아쉽게 낙방한 그 회사가 하는 것도 비슷하다. 어떻게 AI가 사스 때의 데이터를 통해 코로나 때 벌어질 일을 유추할 수 있을까. 일종의 케이스 스터디다. 그래서 그렇게 연역적인 사고방식의 틀을 제공하여 학습을 시키는 것이다. 어쩌면 인과관계를 아는 것과 이 transfer learning은 같은 문제일지도 모르겠다. 기계에게 귀납적인 사고방식이 아닌 연역적인 추론법을 가르치는 문제이다.
여기까지 적다보니, 인공지능 발전의 병목은 인간지능에 대한 이해라고 생각이 든다. 어찌 보면 당연한 말이다. 인공지능이 인간의 지능을 흉내내는 것인데, 흉내낼 대상을 파악하지 못하면 흉내를 못 낼테니까. CNN은 사람이 어떻게 사물을 파악하는지 그 윤곽을 따는 메커니즘을 컨볼루션으로 흉내냈다. 알파고는 바둑기사의 수읽기를 MCTS로 흉내냈다. Transformer도 인간이 글의 맥락과 단어 간의 상호관계를 어떻게 파악하는지 attention으로 흉내냈다. 테슬라도 사람 따라하겠다고 라이다나 센서 대신 카메라를 고집한다. 이렇듯, 인간의 사고방식을 이해해야 그 흉내를 낼 수 있는 것이다. 그래서 최근 GTX에서 젠슨황이 코딩 말고 바이오 공부하라고 한 것 같기도 하다.


댓글