뷰페이지

단국대 한문교육연구소, 고문헌 한자 90% 인식 ‘AI 개발’

단국대 한문교육연구소, 고문헌 한자 90% 인식 ‘AI 개발’

입력 2023-01-09 11:21
업데이트 2023-01-09 11:21
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14
단국대 한문교육연구소가 개발한 인공지능 한자 인식기술. 사진=단국대 제공
단국대 한문교육연구소가 개발한 인공지능 한자 인식기술. 사진=단국대 제공
“고문헌 속 한자 90%를 인식할 수 있는 인공지능 개발로 조선왕조실록·일성록(日省錄) 등을 빠르게 연구할 수 있는 길이 열렸습니다.”

단국대학교는 부설 한문교육연구소가 자율형블록체인융합연구소와 흘림체 글자 등 복잡한 한자에 AI 기술을 적용해 한자를 자동으로 분할하고 인식하는 모델 개발에 성공했다고 9일 밝혔다.

이 모델은 3억 자 이상 한자의 이미지를 데이터베이스로 구축해 전체 한자의 90% 이상을 판별할 수 있다는 것이 단국대의 설명이다.

프로그램은 한자 이미지를 자동으로 분할하고, 이후 추출된 한자 자형 이미지에 맞는 한자 유니코드를 부여해 검색과 활용이 쉽게 정보 데이터베이스에 구축된다.

연구소는 데이터베이스 구축을 위해 개인 문집류 1259종과 조선왕조실록, 일성록 등에 표기된 1만593종의 글자를 확인했고, 이를 통해 3억 80만여 자의 한자 자형 이미지 추출에 성공했다.

프로그램은 금속활자본, 목활자본, 목판본, 납으로 만든 연활자본 등 다양한 판종을 기준으로 개발됐다.

정제된 필사본에 대해서는 뛰어난 해석 성능을 보였지만, 초서나 행서 등 흘림서체에 대해서는 일치율을 높여야 하는 과제는 남아 있다.

이 프로젝트는 단국대 한문교육연구소의 ‘한국 역대 한자 자형 자전(字典) 데이터베이스 구축 및 활용’ 과제로 수행됐고 2019년부터 2022년까지 3년간 한국학중앙연구원의 지원금 10억 5천만 원이 투입됐다.

김우정 소장은 “우리 민족의 지식 자산을 우리 기술로 처리하고 관리하는 시스템을 구축했다는 점에서 의미가 크다”고 설명했다. 단국대는 한국학중앙연구원의 허가를 받아 포털에 서비스를 제공한다는 계획이다.
천안 이종익 기자
많이 본 뉴스
‘민생회복지원금 25만원’ 당신의 생각은?
더불어민주당은 22대 국회에서 전 국민에게 1인당 25만원의 지역화폐를 지급해 내수 경기를 끌어올리는 ‘민생회복지원금법’을 발의하겠다고 밝혔습니다. 민주당은 빠른 경기 부양을 위해 특별법에 구체적 지원 방법을 담아 지원금을 즉각 집행하겠다는 입장입니다. 반면 국민의힘과 정부는 행정부의 예산편성권을 침해하는 ‘위헌’이라고 맞서는 상황입니다. 또 지원금이 물가 상승과 재정 적자를 심화시킬 수 있다고 우려합니다. 지원금 지급에 대한 당신의 생각은?
찬성
반대
모르겠다
광고삭제
위로