슬로우뉴스 구독자 여러분, 안녕하세요.
월요일 오후에 찾아오는 [AI in a week by 테크프론티어]입니다. 뉴스가 넘쳐나는 세상, 한상기(테크프론티어 대표)가 제안하는 AI 트렌드와 큰 그림, 맥락과 흐름을 살펴봅니다.
|
|
|
혹시
1. [슬로우레터] 구독을 끊고 [AI in a week by 테크프론티어]만 구독하고 싶으시거나,
2. [AI in a week by 테크프론티어]를 구독하고 싶지 않으신 분은 답장을 주시면 처리해 드리겠습니다. 저희가 주제별로 몇 가지 뉴스레터를 발행할 계획인데 각각 별도로 구독 신청을 받으려고 합니다. 디폴트는 전체 구독으로 하되 선택 가능한 옵션을 두려고 합니다. 고맙습니다.
|
|
|
[AI in a Week by TechFrontier] 한 주일의 주요 AI 뉴스, 논문, 칼럼을 ‘테크프론티어’ 한상기 박사가 리뷰합니다. (⏰21분)
|
|
|
지난 주에도 많은 논문과 발표문 그리고 기술 에세이가 쏟아졌다. 흥미로운 점은 구글에 관한 평가가 높아짐과 함께 구글 연구진들이 쓴 글이나 인터뷰가 많이 보였다는 점이다. 지금까지는 주로 오픈AI나 앤스로픽 소식이 많았다면 지난 주는 구글이 중심이었다. 여러 연구개발자들도 이제 구글이 그 잠재력을 보여주고 있다고 평가했다. 그 중심에는 제미나이 2.5 프로가 보여준 성능이 있다.
앞에 정리한 글 3개는 모두 AI의 미래나 앞으로 발전 방향에 관한 깊이 있는 논의를 선택했다. 오픈AI가 최첨단 논증 모델이라고 주장한 o3와 o4-미니를 간단히 소개했고, 마지막으로는 돌고래 소통을 이해하기 위한 프로젝트와 그를 위한 모델 돌핀젬마를 소개했다.
이 밖에도 많은 소식이 있었지만 지면 한계로 다 담지 못했다. 중요한 뉴스나 의견이면 다음 주라도 소개할 생각이다. 우리(나라)는 주로 AI 정책을 이야기 하고 어떻게 따라 잡을까를 이야기하고 있지만, 가장 앞서가는 기업은 AI가 궁극적으로 도달할 모습을 이야기한다. 그리고 인류에게 주어진 과제는 무엇이고, 앞으로 어떤 문제를 해결할 것인지에 관해 이야기한다. 그런 모습이 늘 나에게는 부러움을 자아낸다. 그리고 동시에 우리의 논의 수준을 어떻게 하면 끌어올 수 있을지 고민하게 한다. |
|
|
1. AI는 진화 중: 지능에 관한 이해가 바뀌고 있다 |
|
|
미국 LA에 있는 민간 싱크탱크 베르그루엔(Berggruen) 연구소에서 발행하는 노에마(NOEMA)는 미디어 플랫폼으로 매우 수준 높은 글을 게시한다. 이 글은 블레즈 아게라 이 아르카스(Blaise Agüera y Arcas) 구글 리서치 부사장과 구글-알파벳 수석 부사장으로 연구, 연구소, 기술 및 사회 부문 사장을 맡고 있는 제임스 매니카(James Manyika)가 작성한 에세이이다. 제임스 매니카는 미국 국가AI자문위원회 부의장과 유엔 사무총장 자문기구 공동의장을 맡고 있다.
이들은 한 마디로 AI의 극적인 발전으로 지능이 무엇인지에 관한 새로운 관점을 필요로 한다고 말한다. 우리는 이제 ‘지능’을 더 깊이 있게 이해할 수 있고, 그것은 패러다임 전환 상황에 들어섰다는 것이다. AI는 과거의 코페르니쿠스의 지동설 만큼 우리 관점을 변하게 한다. |
|
|
그 자신 ‘코페르니쿠스적 전환’이라는 혁명적 전환을 표현하는 관용구의 일부가 된 사나이. 과학혁명의 시작, 니콜라우스 코페르니쿠스(1473년 2월 19일 – 1543년 5월 24일) |
|
|
이 글에서는 AI 개발에 관련된 다섯 가지 상호 연관된 패러다임 전환을 얘기하는데, 자연 컴퓨팅, 신경 컴퓨팅, 예측 지능, 일반 지능, 그리고 집단 지능이다. 각각의 주제에 관해 저자들이 이야기 한 것을 요약해 본다.
1. 자연 컴퓨팅에서는 폰 노이만과 앨런 튜링이 생명체가 본질적으로 계산적이며, 물리학자 존 휠러가 ‘비트에서 시작한다’라는 가설에서 말한 것 처럼 컴퓨팅이 물리적 현실의 근간을 이룬다는 주장을 소개한다. 구글 지능 패러다임팀의 최근 실험은 계산을 지원할 수 있는 시뮬레이션된 장난감 우주에서 무작위성만 존재하는 가운데에서도 최소한의 ‘생명체’가 자발적으로 출현하는 단계로 나아갈 수 있음을 보였다.
이 진화 사다리의 첫 번째 단계에는 유전적 코드를 가진 생명체가 포함되지 않았다. 그러나 생명체들이 힘을 합치면서 살아 움직이게 되고, 따라서 계산 능력을 갖추게 되자, 이후의 모든 조합은 공생하는 전체의 잠재적인 컴퓨팅 능력을 증가시켰다.
2. 신경 컴퓨팅 패러다임에서는 고전적인 AI 방식인 GOFAI 방식이 실패했음에도, 계산 신경과학자들은 뇌를 정보처리시스템으로 계속 연구했다. 단 기존과는 근본적으로 다른 설계에 기반했다. 그러나 여전히 실행은 기존 컴퓨팅 방식으로 하고 있으며, 이를 통해 신경망 컴퓨터를 시뮬레이션 하는 것은 비효율적이다.
신경 컴퓨팅은 결국 광자, 생물학, 화학, 양자 또는 기타 완전히 새로운 기판에서 구현될 것이고 실리콘의 1제곱센티미터마다 뉴런과 같은 수백만 개의 정보 처리 노드가 동시에 작동하게 될 것이다. 이런 신경 칩은 프로그램을 실행하지 않는다. 신경 실리콘 두뇌는 매개변수를 원하는 대로 초기화하여 ‘플래시(flash)’할 수 있을 뿐만 아니라, 경험을 통해 학습하여 매개변수를 실시간으로 수정할 수도 있다. 계산은 분산되고 견고하며, 간헐적인 오류나 국지적인 손상은 문제가 되지 않을 것인데 이는 뇌가 갖는 자연의 구조와 유사할 것이다.
3. 예측 지능 패러다임은 언어 모델을 통해서 우리가 확인한 것이다. 다음 단어(또는 “다음 토큰”) 예측에만 기반한 AI의 명백한 보편성은 패러다임을 바꾸는 것이었다. 우리는 LLM들이 학습하는 알고리듬을 아직 완전히 이해하지는 못했지만, 다음 토큰을 예측하는 학습이 왜 그렇게 효과적인지 이해하기 시작했다. “예측 뇌 가설”은 신경과학에서도 오랜 역사를 갖고 있다. 이 가설은 뇌가 지각 환경, 자신, 자신의 행동, 그리고 그 행동이 자신과 환경에 미치는 영향에 대한 미래를 지속적으로 모델링하고 예측하도록 진화했다고 주장한다.
그러나 현재로서는 새롭게 습득한 지식은 일시적이며, ‘컨텍스트 윈도우’ 내에 있는 동안만 지속되며 모델 매개변수는 변하지 않는다. 행동과 예측을 통합하는 미래 모델은 우리처럼 점진적이고 개방적인 학습을 할 수 있어야 한다. 현재 이루어지는 ‘테스트 시간 확장’이라는 방식으로 더 강력해지고 있지만 뇌와 유사한 모델 설계는 이러한 순간적인 개선 사항이 누적되어 미래의 모든 대응에 도움이 될 수 있도록 해야 한다. 궁극적으로 유기체가 하는 모든 일은 자기실현적 예측으로 볼 수 있다. 생명은 스스로를 예측하여 지속적인 존재를 만들어내는 존재이며, 지능이 향상됨에 따라 그 예측은 더욱 정교해질 수 있다.
4. 일반 지능. 일부 사람은 LLM이 가짜 지능이라고 하고, 또 다른 많은 사람은 AI가 실재하며 우리가 ‘인공 일반 지능'(AGI)을 달성하는 문턱에 서 있다고 한다. 양쪽 진영 모두 AGI가 미래의 어느 시점에 (혹은 그렇지 않을지라도) 극복할 수 없는 불연속적인 한계점이라고 생각한다. 하지만 실제로는 그러한 한계점은 존재하지 않는 것으로 보이며, 설령 존재한다 하더라도 이미 넘어섰을 수도 있다.
암묵적이든 명시적이든, 많은 AI 회의론자들은 무엇을 달성하는지보다 어떻게 달성하는지에 더 관심을 갖는다. 그러나 자연은 ‘어떻게’ 달성하는지에 무관심하다. AGI의 한계를 넘었는 가를 파악하기 위해서는 역량을 시험할 벤치마크가 필요하다. 많은 제안이 있는데 프랑수아 숄레의 ‘ARC’같은 IQ와 유사한 테스트도 있고, 구글 딥마인드 처럼 역량 단계를 나눠서 판단할 수 있다.
지난 몇 년 동안 우리는 AI 성능을 누군가와 비교하여 측정하는 것에서 모든 사람과 비교하여 평가하는 것으로 전환했다. 이제 개인은 AI 모델보다 덜 ‘일반적’이다.
2002년의 AI 연구자가 오늘날의 LLM들과 어떻게든 소통할 수 있었다면, 그 연구자는 주저 없이 AGI가 이미 도래했다고 말할 것이다. AGI를 어떻게 달성했는지, 수십 년간의 실패한 시도 끝에 왜 최근에야 실현되었는지, 그리고 이것이 우리 자신의 정신에 대해 무엇을 말해주는지 이해하려면 AI에 대한 가장 기본적인 가정뿐 아니라 컴퓨팅 자체의 본질에 대한 가정도 다시 검토해야 한다.
5. 집단 지능. ‘사회 지능 가설‘은 우리처럼 두뇌가 발달한 종에서 지능 폭발이 사회적 피드백 고리에 의해 발생했다고 주장한다. 우리의 생존과 번식 성공은 친구를 사귀고, 파트너를 끌어들이고, 공유 자원을 활용하고, 특히 다른 사람들에게 자녀를 돌보도록 설득하는 능력에 달려 있다. 이 모든 것에는 상대방의 입장에서 생각할 수 있는 ‘마음 이론’이 필요하다.
타인의 심리 상태를 파악하는 것은 인지적 도전이다. 마음이론은 마키아벨리적인 측면을 지니고 있지만, 인간을 특별하게 만드는 고도의 협력 형태에도 필수적이다. 우리는 초유기체이다. 따라서 우리의 지능은 이미 집단적이며, 따라서 어떤 의미에서는 초인적이다. 이를 검증하려고 아는 시험이 ‘인류의 마지막 시험’이고 현재 최첨단 모델은 18.8%까지 도달하고 있다. |
|
|
AI 선구자 마빈 민스키는 우리의 겉보기에 단일한 ‘자아’가 사실은 여러 전문화된 상호작용 주체로 구성된 집단 정신이라고 가정하며 “마음의 사회”를 설명했다. 뇌 영역 자체가 더 작은 부분들의 공동체처럼 기능할까? 우리는 그렇다고 믿는다. 우리는 타인을 모방하도록 뇌를 성장시킴으로써만 더 큰 사회를 형성할 수 있었고, 우리의 뇌 자체도 유사한 내부 인지 노동 분업을 통해 커진 것이라고 본다.
실제로 많은 AI 모델이 ‘전문가 혼합’이라고 불리는, 전문화된 하위 모델들의 긴밀하게 연결된 ‘집단’을 명시적으로 학습하는 데 의존하며 스스로 자신을 분할하고 정복할 수 있는 전문화된 모듈로 분할하는 방법을 학습함으로써 확장된다. 지능을 사회성과 동시에 여러 규모에 걸친 인지 노동 분업의 관점에서 생각하는 것은 심오한 패러다임의 전환을 의미한다. 이는 정적이고 점점 더 거대해지는 단일 모델이 아닌, 성장하는 소셜 네트워크와 유사한 AI 아키텍처를 탐구하도록 장려한다.
수십 년간 미미한 AI 발전 끝에, 이제 우리는 단순히 개인의 지능을 모방하는 것이 아니라 인간을 초월하는 집단적 지능을 확장할 수 있는 시스템을 향해 빠르게 나아가고 있다. 우리는 이러한 급속한 발전에 기대감과 희망을 동시에 가지고 있지만, 이는 언제나 그렇듯 불안, 논쟁, 격변을 동반하는 중대한 패러다임 변화의 순간이라고 본다. 인류에게 이로운 지능을 개발하고, 과학을 발전시키고, 궁극적으로 우리 자신을 개인으로서, 더 작은 지능들의 생태계로서, 그리고 더 큰 전체의 구성 요소로서 이해하도록 돕는 새로운 패러다임이 필요할 것이다.
긴 글이지만, 지금까지 몇 십년 동안 발전한 AI 기술이 저자들이 말하는 지능 패러다임 또는 신경과학에서 이야기하는 지능의 특성을 갖추면서 발전해 왔음을 다시 확인하고 앞으로 집단 지능의 수준이 되어야 인간의 사회적 지능을 달성할 수 있음을 다시 강조한다.
부러운 것은 구글과 같은 대기업의 최고 연구자들이 이런 에세이를 쓰고 공개함으로써 일반 사람들이 지능과 AI의 관계를 다시 한 번 생각할 수 있는 기회를 제공한다는 점이다. 여기에는 요약했지만 독자들에게는 전체 문서를 번역기를 통해서 찬찬히 읽어 보기를 권한다. |
|
|
구글 딥마인드가 운영하는 유튜브 팟캐스트 채널에 올라온 인터뷰 영상이다. 알파고, 알파제로 개발의 주역이었던 데이비드 실버(David Silver)가 영국의 수학자이며 방송인인 하나 프라이(Hannah Fry) 교수와 대담을 통해 앞으로 AI가 어떻게 발전하고 진화할 것인지 말했다.
데이비드 실버는 강화학습으로 튜링상을 받은 리차드 서튼 교수와 함께 ‘경험의 시대에 온 것을 환영합니다’라는 논문을 통해 위 영상에서 말한 내용을 정리했다. AI 시대에 일어나는 중요한 패러다임 변화로 AI가 시뮬레이션 시대와 인간 데이터 시대를 거치고, 이제 RL 기반의 새로운 단계인 경험 시대로 진입하고 있다고 주장한다.
이 새로운 시대를 정의하는 네 가지 주요 특성은 다음과 같다.
- 에이전트는 짧은 상호작용의 단편보다는 경험의 흐름 속에서 살아갈 것이다 (스트림).
- 그들의 행동과 관찰은 인간과의 대화만을 통해 상호작용하는 것이 아니라, 환경에 풍부하게 기반을 둘 것이다 (행동과 관찰).
- 보상은 인간의 선입견에서 비롯되는 것이 아니라, 환경에 대한 경험에 기반을 둘 것이다 (보상).
- 단순히 인간의 관점으로만 추론하는 것이 아니라, 경험에 대해 계획하거나 논증할 것이다 (계획과 논증).
국제 수학 올림피아드에서 메달을 딴 AI 프로그램, 알파프루프(AlphaProof)를 예로 들어보면, 이 모델은 인간이 만든 수학 증명 10만 개를 학습하는 것으로 시작했다. 하지만 그 다음, 획기적인 일을 해냈는데, 논리 시스템과 상호작용하며 1억 개의 새로운 증명을 생성해낸 것이다. 시행착오와 학습을 통해 자체 데이터를 만들어낸 것이고, 이 과정에서 인간이 가르쳐주지 않은 문제 해결 방법을 찾아냈다. 이것이 바로 경험적 학습의 힘이며, 이는 AI가 무엇이 될 수 있는지를 바꾸고 있다.
데이비드 실버는 AI가 인간의 데이터를 기반으로 하는 시대는 이제 그 역할을 다했으며 오히려 AI가 인간 데이터를 기반으로 학습을 하는 것은 AI가 인간을 뛰어넘는데 방해가 될 뿐이라는 것이다. 그게 알파고와 알파제로의 차이라고 강조한다. |
|
|
논문에서 인간 데이터의 한계를 다음과 같이 이야기하고 있다:
“인간을 모방하는 것만으로도 많은 인간의 능력을 상당한 수준까지 재현할 수 있지만, 이 접근법만으로는 많은 중요한 주제와 과제에 걸쳐 초인적인 지능을 달성하지 못했고 앞으로도 달성할 수 없을 가능성이 높습니다. 수학, 코딩, 과학과 같은 핵심 영역에서는 인간 데이터로부터 추출된 지식이 빠르게 한계에 도달하고 있습니다. 강력한 에이전트의 성능을 실질적으로 향상시킬 수 있는 고품질 데이터 소스의 대부분은 이미 소비되었거나 곧 소비될 것입니다. 인간 데이터로부터의 지도 학습에만 의존한 발전 속도는 눈에 띄게 느려지고 있으며, 이는 새로운 접근법의 필요성을 시사합니다. 더욱이, 새로운 정리(theorem), 기술 또는 과학적 발견과 같은 가치 있는 새로운 통찰력은 현재 인간 이해의 경계를 넘어서 있으며 기존 인간 데이터로는 포착될 수 없습니다.”
두 사람은 ‘궁극적으로 경험적 데이터는 인간이 생성한 데이터의 규모와 질을 능가할 것이다. 강화 학습(RL)의 알고리즘 발전과 함께 이루어지는 이러한 패러다임 전환은, 많은 영역에서 어떤 인간이 가진 능력을 능가하는 새로운 능력을 열어줄 것이다.”라는 입장을 제시하고 있다. |
|
|
뉴욕 대학의 얀 르쿤 교수가 공유해서 알게된 기사이다. 벨 랩의 전 사장이었던 마커스 웰던(Marcus Weldon)이 작성했고, 로봇 공학자 로드니 브룩스와 신경과학자 데이비드 이글먼, 얀 르쿤 교수가 인터뷰를 했다. 뉴스위크 AI 임팩트 시리즈의 첫 세 가지 인터뷰이다.
8가지 원칙에 대한 각각의 의견을 요약한 내용이다.
- 마법적 사고: 인간은 모든 지능의 징후가 우리 자신의 지능과 동일하다고 생각하도록 반복적으로 유혹 받는데, 이런 ‘마술적 의인화’ 에 빠져 실제 능력에 대해 속는다. 로드니 브룩스는 만약 그것이 마법적으로 들린다면 이해하지 못하는 것이고 이해하지 못하는 것을 사면 안된다고 한다. 데이비드 이글먼은 우리가 AI가 정신이 있는 것으로 놀라거나 착각하는데 사실 그것은 다른 누군가가 이미 한 말을 되풀이하는 것에 불과하다고 했다.
- IQ 테스트를 넘어서: 인간의 지능은 인지적, 창의적, 사회적, 도덕적, 신체적 능력과 발달된 전문성이 복합적으로 상호작용하는 결과이기 때문에 단일 검사나 점수로 정량화할 수 없다. 데이비드 이글먼은 ‘지능에 대한 단일한 정의는 없다. AI가 정말 지능적일까? 이를 측정할 수 있는 명확한 기준은 없다.’고 했다. 얀 르쿤은 ‘지능은 두세 가지로 생각할 수 있다. 하나는 기술의 집합체이지만, 더 중요한 것은 최소한의 학습이나 전혀 학습하지 않고도 새로운 기술을 빠르게 습득하는 능력이다’라고 말했다.
- 빠르게 생각하되 천천히 생각하라: 노벨상을 받은 다니엘 카너먼은 인간의 뇌가 작동하는 방식을 이해하기 위해 빠르고 자동적이며 직관적인 시스템 1 모드와 더 느리고, 더 신중하며 분석적인 시스템 2 모드로 구성된 프레임워크를 제시했다. 현재 LLM은 시스템 1을 제공하는데, AI의 미래에는 현실 세계의 풍부한 추상적 표현과 시스템 2 추론 능력을 갖는 계층 구조가 필요하다. 로드니 브룩스는 시스템 2에는 사회역학 지식이 담겨 있고, 물리적 세계에 대한 지식도 있고, 미지의 세계를 시뮬레이션하는 창의적인 요소도 있다. 미지의 세계에 대한 일종의 흥미를 느끼는 것이라고 했다.
- 언어의 한계: 문자 언어는 물리적 세계와 그에 대한 인간의 경험을 신뢰성 있게 표현하기에 불충분한 기반이다. AI의 미래는 단순히 LLM의 확장, 조정 또는 향상에만 국한되지 않을 것이다. 얀 르쿤은 언어는 기본적으로 우리 생각의 직렬화된 버전이라고 했고, 데이비드 이글먼은 우리가 언어를 통해 맺는 연결은 대역폭이 극히 낮다고 했다. 로드니 브룩스는 언어 모델은 매우 피상적이고 목적 중심 모델로 가야한다고 했다.
- 기계의 사회: AI의 미래는 서로 다른 시스템들이 서로 상호작용하는 형태가 될 것이다. 이러한 기계들은 모라벡의 역설에서 묘사된 것처럼, 기계가 항상 그래왔듯이 인간의 능력을 증폭시키기 위해 협력하고 경쟁할 것이다. 얀 르쿤은 “상호 작용하는 기계 사회가 될 겁니다. 다른 시스템보다 더 똑똑하고 그들을 무너뜨릴 수 있는 AI 시스템이 생길 겁니다. 그러니까, 똑똑한 AI 경찰이 당신의 악당 AI에 맞서는 거죠.”라고 했다. 로드니 브룩스는 “로봇 손을 만드는 데 50년이 지났지만 큰 진전은 없었습니다. 일반적인 용도로 사용하기에 적합한 집기 기능이 없고, 집기 작업을 하는 로봇의 50%가 조금 넘는 로봇이 여전히 흡입 컵을 사용하고 있다”고 했다.
- 새로운 사회적 위계: 미래의 인간 사회는 인간과 지능형 기계로 구성된 위계 사회가 될 것이며, 기계는 인간과 같은 “자유 의지”를 갖지 못하고 내장된 가드레일에 얽매이기 때문에 위계 구조상 인간 아래에 위치하게 될 것이다. 얀 르쿤은 “인간의 업무 본질이 바뀔 것입니다… 인간은 위계 질서에서 한 단계 더 올라갈 것입니다. AI 시스템은 우리보다 더 똑똑할지는 모르지만, 우리의 명령을 따를 것입니다.”이라고 했고, 데이비드 이글먼은 “우리가 갖게 될 것은 경쟁적인 AI 시스템입니다. 다른 AI 시스템을 감시하는 AI 시스템을 구축할 겁니다… 저보다 1조 배는 더 빠르게 작동할 겁니다….어떤 식으로든 적대적인 시스템이 나타날 것이고, 모두가 서로를 감시하는 이러한 경쟁적인 AI 시스템들이 한데 모이게 될 겁니다.”라고 전망했다.
- 과대 평가된 지능의 힘: 지능의 힘 자체도 과대평가된 측면이 있으며, 인간이 물리적 또는 심리적 지배에 굴복하거나 자연재해나 질병 등 물리적 세계 권력의 희생자가 되는 경향에 대해 훨씬 더 경계해야 한다. 얀 르쿤은 “사람들은 순수한 지능에 너무 많은 신뢰와 힘을 부여합니다. 세상에 지능만이 유일한 힘은 아닙니다. 우리 중 가장 똑똑한 사람들이 리더가 되는 경향이 있는 것은 아닙니다.”라고 비판했다.
- 개방적이고 예측 가능한 미래: AI 시스템은 우리가 물리적 세계를 이해하는 방식뿐만 아니라 다양한 사회적, 도덕적, 문화적 환경에 대해서도 예측 가능하고 일관성이 있어야 하며, 우리가 선택한 조건에 따라 주관적인 개인 세계를 확대해야 한다. 얀 르쿤은 “이러한 시스템을 인간의 가치에 부합하는 방식으로 설계하려면 협력적인 노력이 필요합니다… 그리고 이를 위한 가장 좋은 방법은 개방적이고 협력적인 방식이라고 생각합니다.”라고 했다. 데이비드 이글먼은 “우리는 확실하게 통제할 수 있는 것만 수용합니다.”라고 말했고, 로드니 브룩스는 AI나 로봇 시스템이 “내 세계 모델에 플러그인되어 일관되고 예상대로 동작한다면, 추가하겠습니다.”라고 했다.
인터뷰를 진행한 마커스 웰던은 이런 원칙이 AI 진화를 정의 하는 원칙에 가장 가깝다고 하면서 지능을 어떻게 평가할 것인가 하는 질문을 다시 소환했다. 이글먼과 카너만의 프레임워크를 비교하면서 이들이 상호 보완적이고 하나는 ‘무엇’에 초점을 맞추고 다른 하나는 ‘어떻게’에 초점을 맞춘다고 봤다.
|
|
|
마커스 웰던은 AI에 초점을 맞춘 의료 및 의학과 같은 특정 산업과 창의 예술 및 일반 산업을 살펴보면서 조사 범위를 다양한 학문과 도메인으로 확장하면서 이러한 추세가 어떻게 진화하는지 보는 것이 흥미로울 것이라 했다.
읽어보면 알겠지만 세 사람 모두 현재 언어 모델에 대해서는 매우 비판적인 견해를 갖고 있는 사람들이고 지능의 본질적인 면에 대한 연구가 더 필요함을 강조한다. 지금 보이고 있는 AI나 로봇에 대한 열광에도 불구하고 앞으로 해결할 문제가 무척 많다는 것을 다시 알려주는 인터뷰 내용이다. |
|
|
오픈AI가 논증 모델인 o 시리즈의 최신 모델로 o3와 o4-미니를 공개했다. 이 모델은 ChatGPT 내의 모든 도구를 에이전트적으로 사용하고 결합할 수 있다. 여기에는 웹 검색, 파이썬을 이용한 업로드된 파일 및 기타 데이터 분석, 시각적 입력에 대한 심층적인 논증, 심지어 이미지 생성까지 포함한다. 중요한 점은, 이러한 모델들이 더 복잡한 문제를 해결하기 위해 도구를 언제 어떻게 사용하여 상세하고 사려 깊은 답변을 적절한 출력 형식으로 생성해야 하는지 논증하도록 학습했다는 점이다.
o3는 코딩, 수학, 과학, 시각 인식 등 다양한 분야에서 경계를 넓히는 가장 강력한 논증 모델이라는 것이고, o4-미니 는 빠르고 비용 효율적인 추론에 최적화된 소형 모델로, 특히 수학, 코딩 및 시각적 작업 에서 크기와 비용 대비 놀라운 성능을 발휘한다고 주장한다. 외부 전문가 평가자들은 향상된 지능과 웹 자료 포함 덕분에 두 모델 모두 이전 모델보다 향상된 수업 이해도와 더 유용하고 검증 가능한 응답을 제공한다고 평가했다.
오픈AI는 o3 개발 과정 전반에 걸쳐, 대규모 강화 학습이 GPT 시리즈 사전 학습에서 관찰된 것과 동일한 “컴퓨팅 증가 = 성능 향상” 추세를 보인다는 것을 관찰했다고 한다. 이는 모델이 더 많이 생각할 수 있을수록 성능이 지속적으로 향상됨을 입증한다. 두 모델 모두 강화 학습을 통해 도구를 사용하도록 학습시켰다. 도구를 사용하는 방법뿐만 아니라 언제 사용해야 하는지 논증하는 능력도 가르쳤다.
흥미로운 능력으로는 이미지를 사고의 사슬에 직접 통합해 이미지를 통해 생각할 수 있게 했다. 이를 통해 시각적 추론과 텍스트 추론을 융합하는 새로운 차원의 문제 해결이 가능해졌으며, 멀티모달 벤치마크에서 최첨단 성능을 보인다. 사람들은 화이트보드, 교과서 도표, 또는 손으로 그린 스케치 사진을 업로드할 수 있으며, 모델은 이미지가 흐릿하거나, 반전되었거나, 품질이 낮더라도 이를 해석할 수 있다. 이 기능은 다른 블로그 글로 설명하고 있다.
|
|
|
오픈AI o3 및 o4-미니는 ChatGPT 내 도구에 대한 모든 권한을 가질 뿐만 아니라 API에서 함수 호출을 통해 사용자 지정 도구도 사용할 수 있다. 예를 들어, 사용자가 “캘리포니아의 여름철 에너지 사용량은 작년과 비교하면 어떨까요?”라고 질문하면, 모델은 웹에서 공공 서비스 데이터를 검색하고, 파이썬 코드를 작성하여 예측을 작성하고, 그래프나 이미지를 생성하고, 여러 도구 호출을 연결하여 예측의 핵심 요소를 설명할 수 있다.
비용 측면에서도 효율적이라고 말하고 있는데, 예를 들어, 2025년 AIME 수학 경진대회에서 o3의 비용-성능 효율은 o1보다 크게 향상되었고, 마찬가지로 o4-미니의 효율도 o3-미니보다 크게 향상되었다. |
|
|
그러나 문제가 하나 나왔는데, 환각 증상이 이전 보다 매우 크게 악화되었다. 오픈AI는 모델이 사람에 대해 얼마나 알고 있는지 측정하는 자사 자체 벤치마크인 PersonQA에서 o3가 질문의 33%에 환각 반응을 보였다는 것을 발견했으며 그 이유가 뭔지 아직 모른다는 것이다. o4-미니는 환각이 48%에 이른다. 기술 보고서에 따르면, “전반적으로 더 많은 주장을 하기 때문에” “더 정확한 주장과 더 부정확하거나 환각적인 주장”을 하는 경우가 많다”는 것인데 이렇다면 실제 유용성은 떨어질 수 있다. 오픈AI는 강화 학습 과정에서 생기는 이 문제를 꾸준히 해결하겠다고 했지만, 논증 모델을 서둘러 발표한 것 아닌가 하는 의구심이 생긴다. 물론 위에서 말한 33%나 48%는 한 벤치마크의 경우이지 모든 프롬프트에 대한 것이라는 얘기는 아니다. |
|
|
5. 구글 돌핀젬마, 돌고래 의사 소통을 해석한다 |
|
|
4월 14일 국제 돌고래의 날을 맞아 구글은 조지아 공대 연구진 및 야생 돌고래 프로젝트(WDP) 현장 연구팀과 협력으로 돌고래 발성 구조를 학습하고 돌고래 특유의 독특한 소리 시퀀스를 생성하도록 훈련된 기초 AI 모델인 돌핀젬마(DolphinGemma)의 개발 진척 상황을 발표했다.
돌핀젬마라고 이름 붙인 이 LLM으로 과학자들이 돌고래들이 어떻게 소통하는지 연구하게 도와주는 모델이다. 앞으로는 돌고래가 무슨 말을 하는 지 알게 될 수 있기를 희망한다.
1985년부터 WDP는 세계에서 가장 오랫동안 진행된 수중 돌고래 연구 프로젝트를 수행하여 바하마의 야생 대서양알락돌고래(Stenella frontalis) 특정 군집을 여러 세대에 걸쳐 연구해 왔다. 비침습적 접근 방식을 통해 수십 년간의 수중 영상 및 오디오 데이터를 개별 돌고래의 정체성, 생활사, 그리고 관찰된 행동과 정밀하게 연결하여 풍부하고 고유한 데이터 세트를 제공했다.
WDP의 주요 초점은 돌고래의 자연스러운 의사소통과 사회적 상호작용을 관찰하고 분석하는 것으로, 수중 연구를 통해 연구자들은 수면 관찰로는 불가능한 방식으로 소리와 특정 행동을 직접 연결할 수 있다고 생각했다. 이들은 수십 년 동안 소리의 유형과 행동적 맥락을 연관시켜 왔는데, 이 관찰 연구의 궁극적인 목표는 이러한 자연스러운 소리 시퀀스 내의 구조와 잠재적 의미를 이해하고, 언어를 나타낼 수 있는 패턴과 규칙을 찾아내는 것이다. 자연 의사소통에 대한 이러한 장기적인 분석은 WDP 연구의 기반을 형성하며, 모든 AI 분석에 필수적인 맥락을 제공한다.
|
|
|
구글에서 개발한 이 AI 모델은특정 오디오 기술인 사운드스트림(SoundStream) 토크나이저로 돌고래 소리를 효율적으로 표현하고, 복잡한 시퀀스에 적합한 모델 아키텍처로 처리한다. 약 4억 개의 매개변수를 가진 이 모델은 WDP가 현장에서 사용하는 픽셀 휴대폰에서 바로 실행되도록 최적의 크기로 설계했다.
이 모델은 구글의 최첨단 경량 개방형 모델 모음인 젬마를 기반으로 구축했으며, WDP의 야생 대서양 점박이돌고래 음향 데이터베이스를 통해 광범위하게 학습했다. 돌핀젬마는 오디오 입력/출력 모델로 기능하며, 자연스러운 돌고래 소리 시퀀스를 처리하여 패턴과 구조를 파악하고, 궁극적으로 시퀀스에서 발생할 가능성이 높은 후속 소리를 예측한다. 반복되는 소리 패턴, 클러스터, 그리고 신뢰할 수 있는 시퀀스를 식별함으로써, 연구자들이 돌고래의 자연스러운 의사소통 속에 숨겨진 구조와 잠재적 의미를 발견하는 데 도움을 줄 수 있을 것으로 기대한다.
WDP는 자연 의사소통을 분석하는 것 외에도, 해양 기술을 활용하여 잠재적인 양방향 상호작용을 탐구하는 독특하고 병행적인 연구도 진행하고 있다. 조지아 공과대학교와 협력하여 CHAT(고래 청각 증강 원격 측정) 시스템을 개발했는데, 돌고래의 복잡한 자연어를 직접 해독하는 것이 아니라, 더 단순하고 공통적인 어휘를 구축하도록 설계된 수중 컴퓨터이다. 유튜브 영상은 여기에서 볼 수 있다. 이 개념은 먼저 CHAT에서 개발한, 돌고래의 자연음과는 다른 새로운 합성 휘파람 소리를 돌고래가 좋아하는 특정 물체, 예를 들어 모자반, 해초, 또는 연구자들이 사용하는 스카프와 연관시키는 데 기반한다. |
|
|
구글 픽셀 6는 돌고래 소리의 고충실도 분석을 실시간으로 처리했으며, 픽셀 9(2025년 여름 예정)를 중심으로 한 차세대 모델은 스피커/마이크 기능을 통합하고, 휴대폰의 고급 처리 기능을 활용하여 딥 러닝 모델과 템플릿 매칭 알고리즘을 동시에 실행함으로써 이러한 노력을 더욱 강화할 예정이다. 돌핀젬마의 예측 능력은 CHAT이 발성 시퀀스 초기에 잠재적인 모방을 예측하고 식별하는 데 도움을 줄 수 있으며, 이를 통해 연구자들이 돌고래에 반응하는 속도를 높이고 상호작용을 더욱 유연하고 강화할 수 있다.
돌핀젬마는 올 여름 오픈 모델로 공개할 예정이다. 대서양 점박이돌고래의 소리를 기반으로 학습되었지만, 병코돌고래나 스피너돌고래와 같은 다른 고래류를 연구하는 연구자들에게도 잠재적으로 유용할 것으로 기대한다. 종마다 발성 방식에 따라 미세 조정이 필요할 수 있으며, 모델을 공개함으로써 이러한 적응이 용이하게 이루어지게 할 예정이다. 이런 도구를 제공함으로써 전 세계 연구자들이 스스로 음향 데이터 세트를 조사하고, 패턴 검색을 가속화하고, 지능형 해양 포유류에 대한 이해를 더욱 심화할 수 있는 도구를 제공하고자 한다.
지능을 가진 동물의 의사 소통 방식에 대한 연구가 이제 관찰과 기록에서 머무는 것이 아니라 AI를 활용함으로써 인간의 언어 기반 모델이 다른 종의 소통 방식을 이해하는데 사용할 수 있을 것이라는 잠재성이 보이는 것이다.
|
|
|
- 오픈AI가 코딩에 초점을 맞춘 GPT-4.1 모델을 내놓았다 (오픈AI, 4월 14일). API로 접근할 수 있는 세 개의 모델로 GPT-4.1, GPT-4.1 미니, GPT-4.1 나노이다. 실세계 소프트웨어 엔지니어링 스킬을 측정하는 SWE-bench Verified에서 54.6%의 과제를 완료했는데, 이는 GPT-4o의 33%를 넘는 수준이다. 코딩 외에도 지시 사항 준수, 최대 100만 개 토큰을 지원하는 긴 맥락에 대한 개선 사항이 보였으며 GPT 모델에서는 처음으로 나노 모델을 소개했다.
|
|
|
- 허깅 페이스가 오픈 소스 로보틱스 스타트업인 폴렌 로보틱스를 인수해 로보틱스의 대중화를 돕겠다고 한다 (와이어드, 4월 14일). 곤충 눈과 두 팔을 가진 인간형 로봇인 리치 2를 개발한 프랑스 회사이며 허깅 페이스는 이 로봇을 판매해서 개발자들이 이 로봇 코드를 다운로드, 수정하고 개선 사항을 제안할 수 있도록 허용할 예정이다. 리치2의 동작 모습은 엑스에 올린 영상을 통해서 볼 수 있다.
|
|
|
- 구글이 공개한 601개의 생성형 AI 활용 사례 (구글, 4월 10일). 구글이 전 세계 기업들의 실제 AI 활용 사례 601개를 모아 블로그에 공개했다. 구글 클라우드 넥스트 행사를 통해 공개한 리스트인데 작년 101개에서 올해는 6배가 증가한 601개이다. 그러나 이 숫자도 기업 전반에 걸쳐 AI가 실현 가능한 가능성의 시작이라고 본다. 몇 가지만 예를 들어보면, 웬디스, 파파존스 피자, 우버는 드라이브 스루든 예측 AI 도구를 활용한 앱이든 주문을 더 빠르게 처리하고 있다. 메르세데스 벤츠와 제너럴 모터스는 차량 내 서비스를 강화했고, 삼성의 최신 휴대폰과 심지어 가정용 로봇인 볼리(Ballie)조차도 AI 덕분에 반응성이 더욱 뛰어나다. 시티은행, 도이체방크, 인테사 산파올로(Intesa Sanpaolo)와 같은 금융 기관들은 새로운 서비스를 안전하게 제공하고, 시장을 더 빠르게 모니터링하며, 새로운 방식으로 사기를 방지하고 있다. 이 목록은 11개 주요 산업 그룹으로 구성되어 있으며, 그 안에는 고객, 직원, 크리에이티브, 코드, 데이터, 보안의 6가지 에이전트 유형이 있다.
- UAE 정부가 세계 최초로 AI 기반 입법 시스템을 도입했다고 한다. 이원태 박사가 소식을 공유했고 다음과 같이 정리했다. “AI 기반 입법 정보 사무소(Legislative Intelligence Office)를 신설한 것인데, AI를 통해 사법 판결, 행정 절차 및 공공 서비스와 연결하여 UAE의 모든 연방법과 지방법을 통합하는 포괄적인 입법 계획을 수립하는 작업을 수행한다. 이 새로운 시스템을 사용하면 대규모 데이터를 사용하여 법률이 국민과 경제에 미치는 일일 영향을 추적할 수 있으며, 법률에 대한 정기적 업데이트를 제안할 수 있다. 이 입법 플랫폼은 UAE의 법률 제정 과정을 최대 70%까지 가속화하고, 정교화하며, 향상시켜, 급변하는 글로벌 환경에서 국가의 경쟁력과 적응력을 강화할 것입니다. 이 AI 입법 플랫폼은 또한 새로운 AI 기반 법적 기능을 도입하므로 입법 정보 분야의 새로운 전문가 세대를 준비하는 역할도 수행할 것이라고 한다.” UAE는 AI 시대 새로운 디지털 정부를 구현하는데 매우 적극적이며 우리에게 좋은 참고가 될 수 있는 나라다.
- 네이처에 올라온 ‘분자 세포 생물학을 위한 멀티모달 파운데이션 모델’은 다양한 생물학 데이터를 한 번에 학습함으로써 생명 과학이 새로운 단계로 나아가고 있음을 보여준다 (네이처, 4월 16일) 바이오넥서스 김태형 대표는 이 연구를 이렇게 평가했다. “그동안 유전자, 단백질, 대사물질 등 각 분야별로 따로 연구하던 방식에서 벗어나, 이제는 이 모든 데이터를 하나의 AI가 통합해 분석한다는 컨셉이다. 놀라운 점은 이 AI가 실험 결과를 예측하고, 그 예측을 실험으로 검증한 뒤 다시 AI를 개선하는 순환적 구조(‘Lab-in-the-loop’)를 통해 연구의 속도와 정확성을 크게 향상시킨다는 점이다. 앞으로 질병 치료와 신약 개발의 혁신을 이끌어낼 가능성을 열어주며, 생명과학 연구의 완전히 새로운 시대를 예고하고 있다.”
- The Verge에 따르면 오픈AI는 자사가 애용하는 이미지 생성 AI를 중심으로 플랫폼을 구축할 계획이라고 한다 (더 버지, 4월 16일). 프로젝트는 아직 초기 단계이지만, ChatGPT의 이미지 생성 기능에 초점을 맞춘 내부 프로토타입이 개발 중이며 소셜 피드 기능도 탑재되어 있다고 한다. 페이스북과 인스타그램 외에 또 다른 거대하고 지속 가능한 소셜 네트워크를 구축할 가능성이 있을까? 엑스나 틱톡, 블루스카이 등은 SNS가 아닌 소셜 미디어인데, AI 기반 SNS라는 새로운 개념이 등장할 가능성은 크지 않다.
- 마이크로소프트가 초경량 AI 모델인 ‘비트넷 b1.58 2B4T’ 기술 문서를 공개했다 (arXiv, 4월 16일). 이 비트넷 모델은 약 20억 개의 파라미터를 갖추고 있으며, 가중치를 (-1, 0, 1)의 세 가지 값으로만 양자화하는 방식을 사용한다. 4조 개의 토큰(약 3300만 권의 책 분량)으로 학습되었으며, 메타의 ‘라마3.2 1B’와 구글의 ‘젬마3 1B’, 알리바바의 ‘큐원 2.5 1.5B’ 등 경쟁 모델들보다 우수한 성능을 보였다고 마이크로소프트는 주장했다. 초경량이라 애플의 M2 같은 상용 CPU에서도 동작 가능하며 메모리 사용량도 0.4GB로 크게 줄였다. 사전학습, 지도 미세조정(SFT), 직접 선호 최적화(DPO) 단계로 학습을 했으며, 고품질 데이터셋과 합성 데이터를 활용해 수학 추론 능력을 향상했다. 향후에는 더 큰 규모의 모델과 데이터셋으로 확장 법칙을 확인하고 하드웨어를 같이 디자인해서 최적화를 모색하겠다고 한다. 또한 현재는 영어 데이터로만 학습한 것을 다국어로 확대한다는 계획도 있다. (하정우 센터장의 코멘트. 마이크로소프트 리서치의 연구 결과는 좀 시간을 갖고 검증할 필요가 있다).
|
|
|
슬로우뉴스 주식회사.
서울 중구 명동2길 57, 태평양빌딩 1002호. 0507-1328-1033
|
|
|
|