UNIST, 새 AI 학습기법 개발…"로봇, 자율주행차·드론에도 활용"
피지컬AI는 걷기나 전력 질주를 하는 법을 학습했더라도, 새로운 임무를 받으면 다리 각도나 힘 조절을 제대로 못 해 오류가 발생할 수 있다. 훈련 받지 않은 상황에 대한 피지컬AI의 적응력 부족이 원인이다.
울산과학기술원(UNIST) 인공지능대학원 한승열 교수팀은 피지컬AI 기술의 한계로 지적되는 이같은 문제를 해결할 수 있는 새로운 학습기법 'TAVT'(Task-Aware Virtual Training)를 개발했다고 19일 밝혔다.
이 기법은 AI 스스로 가상의 임무를 만들어 미리 학습하게 하는 방식으로 딥러닝 기반 표현 학습 모듈과 생성 모듈로 구성됐다.
표현 학습 모듈이 서로 다른 임무 간 유사도(거리)를 정량화해 임무 구조를 파악하면, 생성 모듈이 이를 조합해 새로운 가상의 임무를 만들어 스스로 학습한다.
제1저자 김정모 연구원은 "기존 강화학습은 하나의 임무에서 최적의 정책을 익히도록 설계돼 새로운 상황에서는 성능이 급격히 떨어진다"며 "다양한 임무를 경험하게 하는 메타 강화학습 기법도 있지만, 훈련 범위를 벗어난 상황에서는 적응이 쉽지 않다"고 말했다.
연구진은 새 학습기법을 치타, 개미, 2족 보행 로봇 등 다양한 로봇에 적용한 결과 훈련하지 않은 임무에 대한 적응력이 향상된 것을 확인했다.
한승열 교수는 "이 기법은 피지컬AI나 자율주행차, 드론 등 다양한 상황에서 유연한 대응이 필수적인 분야에 폭넓게 활용할 수 있을 것"이라고 말했다.
이런 연구 결과는 지난달 캐나다 밴쿠버에서 열린 세계 3대 AI 학회인 '2025 ICML'에서 발표됐다.
신주백 기자 jbshin@kmjournal.net