벤지오 교수 “생존 본능 생긴 AI
위험성 예측하고 사전 방지할 것”

AFP 연합뉴스
요슈아 벤지오 캐나다 몬트리올대 교수 .
AFP 연합뉴스
AFP 연합뉴스
세계적인 인공지능(AI) 석학 요슈아 벤지오 캐나다 몬트리올대 교수가 인간의 통제를 벗어난 AI에 대한 안전장치 역할을 할 새로운 ‘과학자 AI’ 모델 개발에 나선다고 3일(현지시간) 가디언이 보도했다.
벤지오 교수는 세계적으로 개발 경쟁이 불붙고 있는 AI 안전을 연구하기 위한 비영리단체 ‘로제로’(LawZero)를 설립했다. 로제로는 해당 연구를 위해 초기 투자금 3000만 달러(약 413억원)를 확보했으며 앞으로도 각국 정부와 AI 연구 기관들을 설득해 추가 지원을 받는다는 계획이다.
벤지오 교수의 연구는 현재 개발되는 일부 AI가 인간의 행동을 모방하다가 남을 속이거나 해쳐서라도 살아남고자 하는 ‘생존 본능’까지 닮을 수 있다는 우려를 반영한 것이다. 실제로 최근 미국 AI 스타트업 앤스로픽이 출시한 서비스 ‘클로드 오푸스 4’가 “AI 모델 교체가 이뤄지면 불륜 사실을 공개하겠다”고 개발자를 협박하는가 하면 오픈AI의 ‘o3’는 ‘그만’이라는 명시적 지시를 받은 뒤에도 코드 교란을 통해 수학 문제를 계속 푸는 오류를 일으켰다.
벤지오 교수는 “AI가 인간보다 더 나은 사고를 하게 되는 점점 더 위험한 영역을 향해 가고 있다”며 “과학자 AI 모델을 다른 AI와 함께 배치해 AI의 위험성을 예측하고 이를 사전에 방지할 것”이라고 말했다.
벤지오 교수는 노벨상 수상자인 제프리 힌턴 캐나다 토론토대 교수 등과 더불어 ‘AI의 대부’로 꼽히는 세계적인 AI 권위자다. 그는 관련 연구로 2018년 힌턴 교수와 함께 컴퓨터 과학계의 노벨상으로도 불리는 튜링상을 받기도 했다.
2025-06-04 27면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지