삼성·현대차·LG, 현장에서 나오는 사용자 데이터로 AI 고도화
왜 지금, 제품 기반 AI인가… ‘실험실 AI’에서 ‘현장 AI’로
인공지능(AI)은 오랫동안 연구소 중심으로 개발돼 왔다. 정제된 대규모 데이터셋을 반복 학습시키고, 이론적 성능을 지표로 평가하는 방식이 일반적이었다. 그러나 실제 환경의 변동성과 복잡성은 실험실 성능과 현장 성능 사이의 간극을 키워 왔다. 이 한계를 넘기 위해 국내 주요 기업과 정부는 시중에 보급된 제품에서 발생하는 실사용 데이터를 AI 학습에 활용하는 방향으로 전략을 전환하고 있다.
핵심은 제품→데이터 수집→AI 학습→제품 개선으로 이어지는 순환 구조다. 제품이 데이터 수집기의 역할을 수행하고, 학습 결과는 소프트웨어 업데이트나 신규 기능으로 다시 제품에 적용된다.
수천만 대 TV·가전이 실시간 데이터 수집기… 예측형 AI로 로봇·스마트홈 고도화
삼성전자는 전 세계에 보급된 스마트 TV·스마트폰·가전에서 발생하는 사용 행태 데이터를 기반으로 개인화 서비스와 제품 기능을 고도화하고 있다. 리모컨 클릭 시간, 자주 사용하는 앱 위치, 음성 명령 사용 빈도, 시청 도중의 정지·재생 패턴 등은 ‘사용자 맥락(Context)’ 정보로 분류돼 분석에 활용된다.
이러한 데이터는 사용자 동의와 설정 범위 내에서 수집·활용되며, 개인화 추천이나 인터페이스 최적화와 같은 기능 개선에 반영된다. 삼성은 홈 로봇 ‘Ballie’와 스마트홈 허브를 중심으로 예측형 상호작용을 확대하고 있다.
예컨대 사용자가 매일 밤 10시에 TV와 조명을 끄는 패턴이 관찰될 경우, 로봇이나 허브가 먼저 조명 제어를 제안하는 식이다. 다만 구체적인 학습 데이터의 출처·용도 및 로봇 적용 범위는 공개된 범위에서 확인되는 수준이다.
브레이크 반응·차선 변경·신호 인식까지 데이터화… 학습 결과를 차량에 반영
현대자동차는 자율주행·주행보조(ADAS) 영역에서 도로의 실제 상황 데이터를 폭넓게 수집·분석하고 있다. 돌발 상황에서의 제동 타이밍, 차선 변경 시 거리 유지, 운전자 수동 개입 빈도와 이유, 신호등 인식 보정 패턴 등이 대표적이다.
이 데이터는 클라우드 기반 주행 데이터 허브로 모여 알고리즘 개선에 쓰이며, OTA(Over-the-Air) 소프트웨어 업데이트를 통해 차량에 순차 반영된다. 차량 간 경험을 공유하는 ‘군집지능’ 개념 연구도 병행되고 있으나, 동일 차종 간 실시간 학습 공유의 일정·범위는 공식화되지 않았다.
정부는 V2X(차량-사물 통신) 인프라와 표준화 논의를 통해 자율주행 데이터 활용 생태계의 기반을 보완하고 있다.
생활 패턴을 읽고 선제 제안하는 가전… 외부 연동 열어 생태계 확장
LG전자는 냉장고·세탁기 등 가전에서 문 여닫는 시간대, 온도 설정 변화, 보관 식품의 변화 속도, 세탁 코스·시간·헹굼 횟수 등 생활 패턴 데이터를 수집·분석한다. 이를 통해 주말·평일 사용 차이에 따른 냉각 알고리즘 최적화, 유통기한 알림, 재고 파악, 사용자 맞춤 세탁 설정 자동 적용 등의 기능을 구현하고 있다.
또한 LG ThinQ 플랫폼의 API 개방 확대로 외부 개발자와 파트너가 연동 서비스를 만들 수 있는 기반을 마련했다. 다만 개별 스타트업·제품군과의 구체적 연동 범위는 공개되는 사례 중심으로 확인되는 단계다.
정부, 데이터 활용 프로그램 중심으로 지원… 민간 제품 데이터 개방은 ‘논의 진행’
과학기술정보통신부와 유관기관은 AI-Hub, AI 바우처 등 기존 프로그램을 통해 산업 데이터·AI API·컴퓨팅 자원을 민간에 제공하고 활용을 촉진하고 있다.
다만 대기업 제품에서 생성되는 민간 제품 데이터의 국가 자산화 및 일괄 API 개방과 같은 사안은 개인정보보호·가명처리·재식별 방지 등 규제 준수를 전제로 업계·정부 간 논의가 진행 중인 사안이다.
정부 관계자는 “AI가 연구소가 아닌 제품 현장에서 학습되고 다시 제품에 적용되는 순환 구조가 중요하다”며 “데이터 활용 촉진과 개인정보 보호의 균형을 바탕으로 산업 전반의 AI 경쟁력을 높이겠다”고 말했다.
신주백 기자 jbshin@kmjournal.net