데이터 분포 변화에 대응하는 새로운 학습 데이터 선택 기술
시간에 따라 데이터 분포가 변화하는 환경서 좋은 성능 유지
지속 가능한 데이터 중심의 AI 학습 프레임워크 소개
인공지능이 상황에 따라 알아서 업데이트
국제학술대회 '국제인공지능학회(AAAI 2024)'에 발표

▲ 이번 연구에서 제안한 알고리즘이 드리프트 환경에서도 적절한 학습 데이터를 선택하는 예시
▲ 이번 연구에서 제안한 알고리즘이 드리프트 환경에서도 적절한 학습 데이터를 선택하는 예시

최근 인공지능 모델의 성능 저하 문제에 대한 해결책을 제시하는 연구가 화제다. 

KAIST의 황의종 교수 연구팀이 시간에 따라 데이터 분포가 변화하는 드리프트 환경에서도 안정적인 판단을 내릴 수 있는 새로운 학습 데이터 선택 기술을 개발했다.

인공지능의 발전으로 인간을 뛰어넘는 성능을 보이고 있지만, 많은 경우에 데이터 분포가 일정한 환경을 전제로 한다는 한계를 가지고 있다.

이에 반해 실제 환경에서는 데이터의 변화로 인한 성능 저하 문제가 발생할 수 있다. 

SK 하이닉스의 공정 과정에서도 시간에 따른 장비 노화로 인해 센서 데이터가 지속적으로 변화하는 드리프트 현상이 관측되고 있다.

▲ 왼쪽부터 전기및전자공학부 황의종 교수, 황성현 박사과정, 김민수 박사과정
▲ 왼쪽부터 전기및전자공학부 황의종 교수, 황성현 박사과정, 김민수 박사과정

이 문제를 해결하기 위해 연구팀은 데이터의 분포 변화를 고려한 새로운 학습 데이터 선택 기술을 개발했다.

이 기술은 데이터 분포와 결정 경계가 변화해도 모델을 강건하게 학습할 수 있는 지속 가능한 데이터 중심의 AI 학습 프레임워크를 제안한다.

1저자인 김민수 박사과정 학생은 "이번 연구를 통해 인공지능을 한번 잘 학습하는 것도 중요하지만, 그것을 변화하는 환경에 따라 계속해서 관리하고 성능을 유지하는 것도 중요하다는 사실을 알릴 수 있으면 좋겠다"고 밝혔다.

연구팀을 지도한 황의종 교수는 "인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되길 기대한다"고 말했다.

KAIST 전기및전자공학부의 김민수 박사과정이 1저자, 황성현 박사과정이 2저자, 황의종 교수(KAIST)가 교신 저자로 참여했다.

이번 연구는 국제 인공지능 학회(AAAI)에서 발표됐으며, SK 하이닉스 인공지능협력센터(AICC)와 정보통신기획평가원, 한국연구재단의 지원을 받은 과제의 성과 중 하나이다.

새로운 기술은 변화하는 환경에 적응하는 AI 모델을 위한 중요한 발전을 이끌 것으로 기대된다. /대전=이한영기자

저작권자 © 충청일보 무단전재 및 재배포 금지