스마트폰을 '손 대신 쓰는' 행동형 AI의 등장
630개 팀을 제치고 1위… 연구개발비 30억 확보
AI폰 시대의 출발점, 대화에서 행동으로 진화
스마트폰 화면을 눈으로 읽고, 상황을 판단해, 손 대신 명령을 수행하는 AI가 현실에 들어왔다.
이제 AI가 사람처럼 화면을 읽고 움직이며 스마트폰을 다루는 시대가 열리면서, 모바일 기술의 흐름이 새로운 국면에 들어섰다.
KAIST는 6일, 신인식 전산학부 교수가 이끄는 AutoPhone 팀(플루이즈·KAIST·고려대·성균관대 공동)이 과학기술정보통신부 주최 '2025 인공지능 챔피언(AI Champion) 경진대회'에서 초대 AI 챔피언으로 선정됐다고 밝혔다. 전국 630개 팀이 참여한 국내 최대 규모 AI 기술 경진대회에서 1위를 차지하며 연구개발비 30억원을 확보했다.
AutoPhone 팀이 선보인 핵심 기술은 'FluidGPT'. 사용자가 "서울역에서 부산 SRT 예약해줘", "택시 불러줘"라고 말하면, 이 AI는 스마트폰 화면을 스스로 분석하고 앱을 실행한 뒤 좌표를 인식해 버튼을 누르고, 입력창을 채우고, 결제까지 마친다.
사람이 스마트폰을 쓰는 방식을 그대로 학습한 '행동형 AI'다.
기술의 중심에는 비침습형 구조(API-Free) 설계가 있다. 특정 앱의 내부 API를 연결하는 방식이 아니라, AI가 기존 앱을 수정하지 않고 그대로 사용하며 화면(UI)을 직접 읽고 판단해 조작하도록 만든 것이다. 사용자의 눈과 손, 두뇌 역할을 모두 AI가 담당하는 셈이다.
업계에서는 이 기술을 "사람처럼 보고 판단해 움직이는 AI", "진짜 의미의 Agentic AI(행동형 인공지능)"로 평가한다.
FluidGPT는 스마트폰을 스스로 다루며 앱 클릭 → 입력 → 탐색 → 결제 등 복잡한 절차를 한 번에 수행하는 완전 자율형 구조를 구현했다. 이전의 음성비서가 말만 주고받는 보조 역할이었다면, 이번 기술은 사용자의 의도를 파악해 AI가 스스로 해결까지 수행하는 수준으로 진화했다.
신인식 교수는 "AI가 이제 대화 중심에서 행동 중심으로 진화하고 있다"며 "FluidGPT는 실제 앱을 스스로 실행하는 기술로, AI폰 시대의 출발점이 될 것"이라고 말했다. 이어 "AutoPhone 팀은 세계적 수준의 연구진이 합류한 팀으로, 누구나 쉽게 활용할 수 있는 AI 서비스 보급에 기여하겠다"고 밝혔다.
이광형 총장은 "이번 성과는 KAIST의 AI 융합 비전을 대표하는 상징적 결과"라며 "AI 기술이 국민의 생활 방식 전반에 새로운 변화를 만들고 있다"고 강조했다. 또 "KAIST는 AI·반도체·디지털 핵심기술에서 국가 경쟁력을 높이는 연구에 지속해 힘을 보태겠다"고 덧붙였다. /대전=이한영기자

