멀티모달 AI와 함께하는 일의 새로운 흐름

누구나 일을 하며 기쁨과 슬픔을 느낀다. 일을 통해 성장 중인 우리 시대 스마트 워커를 위한 가이드.

화상으로 가끔 쓰던 구글미트(Google Meet)에 얼마 전 제미나이(Gemini)가 들어왔다. 스마트폰으로 쓰던 클로바노트에도 익숙했기에, 처음엔 ‘뭐가 얼마나 다르겠어’ 싶었다. 그런데 회의를 한번 해보고 나니, 생각이 달라졌다.

회의가 끝나기도 전에 알림이 떴다. “회의 요약본과 다음 액션을 정리했습니다.”

누가 무슨 말을 했고, 어떤 결론이 났으며, 다음에 누가 뭘 해야 하는지까지—별다른 요청도 없이 자동으로 정리돼 있었다. 늘 막내의 숙명처럼 여겨졌던 회의록 정리는, 이제 정말 필요 없는 일이 되어버렸다.

업데이트 된 제미나이 라이브는 더 새롭다.  멀티모달, 즉 텍스트, 오디오, 이미지, 영상까지 동시에 인식하고 이해한다.

회의 중 노트북을 카메라에 비췄더니, 제미나이가 말했다. “이 제품은 2023년형 모델이고, 주요 기능은 다음과 같습니다.”

말도 안 했는데, 보는 것만으로 정보를 척척 설명해준다.  아직은 스마트폰 카메라를 통해 보여줘야 하지만, 이 기술이 글래스 같은 웨어러블 디바이스로 넘어가면 진짜다. 내가 보는 것을 AI도 실시간으로 함께 보고, 필요한 정보를 눈앞에 띄워주는 세상. ‘보는 것이 곧 일’이 되는 미래가 성큼 다가오고 있다.

그리고 조만간 닥칠 일 하나. 지금은 조용히 회의 후 내용을 기록하고 요약해주는 제미나이가, 머지않아 회의의 모더레이터가 될지도 모른다. 자동 모더레이터 모드를 on 하면 이전 회의의 내용을 불러와 맥락을 정리하고, 관련 데이터를 기반으로 회사의 상황을 브리핑하며, 결정할 이슈들을 정리한 뒤 각 안의 장단점까지 제안할 것이다. 1시간 제한을 준다면 이에 맞춰 진행도 해줄 것 같다.

Google Beam 홍보영상=구글

더군다나 구글은 Google Beam 이라는 3D화상회의 솔루션까지 준비중이다. 언어의 장벽, 물리적 거리의 장벽까지 없어져 가고 있다. 

이제 사람이 하는 일의 중심은 ‘정보를 다루는 기술’에서 ‘의미를 감각하는 능력’으로 옮겨가고 있다. 엑셀을 채우고, PPT를 꾸미며 반복해온 보여주기용 가짜 일들은 서서히 사라지고 있다. 예전엔 회의가 끝나야 일이 시작됐지만, 지금은 회의 중에 결과물이 나온다. 생각을 말하면 그게 문서가 되고, 보여주면 설명이 따라오며, 질문 하나에 요약과 그래프가 즉시 생성된다. 일은 점점 더 즉시적이고, 인터랙티브하며, 본질에 가까워지고 있다.

그래서 결국 중요한 건 ‘속도’가 아니라 ‘질문’이다. 지금 우리에게 꼭 필요한 논의는 무엇인지, 이 결정을 내리기 전에 던져야 할 질문은 뭔지. 앞으로의 경쟁력은 정보를 많이 가진 사람이 아니라, 더 나은 질문을 던지는 사람에게로 옮겨갈 것이다.

‘일을 잘한다’는 말의 기준이 바뀌고 있다. 더 빠른 사람이 아니라, 더 깊이 있는 사람이. 많이 말하는 사람이 아니라, 제대로 묻는 사람이. 그 변화의 문턱에 우리는 서 있다. 그리고 조금 일찍 도착한 이들은 느낀다. 이제 일이 바뀌는 게 아니라, ‘일’이라는 개념 자체가 새롭게 써지고 있다는 걸.

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지