자연어로 말하면 실제 행동으로 이어지는 AI는 더 이상 미래의 개념이 아니다. 대형 언어모델이 대화 능력을 넘어 ‘실행력’을 갖추는 단계로 진입한 가운데, 구글이 클라우드 의존도를 과감히 낮춘 새로운 방향의 인공지능 모델을 내놓았다. 구글은 18일(현지시간) 기기 자체에서 자연어 명령을 곧바로 실행 가능한 코드로 변환하는 온디바이스 소형 언어모델 ‘펑션젬마(FunctionGemma)’를 공개했다.
![]() [코리안투데이] 구글이 자연어 명령 실행 가능한 함수 호출로 변환하는 소형 언어모델 펑션 젬마를 선보였다.(사진=구글 펑션젬마 설명 유튜브 캡쳐) © 변아롱 기자 |
구글은 이번 모델을 소개하며 AI 산업의 무게중심이 ‘말하는 도구’에서 ‘실제로 행동하는 에이전트’로 이동하고 있다고 강조했다. 스마트폰, 웹 브라우저, 각종 IoT 기기처럼 네트워크 환경이 불안정하거나 지연이 치명적인 엣지 환경에서는 가볍고 빠르며 신뢰할 수 있는 모델이 필수라는 판단이다. 펑션젬마는 이러한 요구에 맞춰 설계된, 철저히 실행 중심의 모델이다.
펑션젬마는 2억7000만 개 매개변수를 가진 ‘젬마 3’를 기반으로 네이티브 함수 호출 기능에 특화해 미세조정한 버전이다. 기존 소형 모델이 주로 자연어 응답 생성에 초점을 맞췄다면, 이 모델은 사용자의 명령을 실제 API 호출이나 시스템 액션으로 변환하는 데 목적을 둔다. 예컨대 “내일 오후 3시에 회의 잡아줘”라는 요청을 단순한 문장 응답이 아니라 일정 관리 API를 호출하는 코드로 바꿔 즉시 실행하는 방식이다.
이러한 구조는 AI를 단순한 인터페이스가 아니라 실제 업무를 처리하는 실행 주체로 확장한다. 펑션젬마는 오프라인에서도 작동하는 개인 비서형 에이전트로 활용될 수 있고, 대형 모델과 결합된 하이브리드 시스템에서는 엣지 단에서 트래픽을 조절하는 ‘프런트 컨트롤러’ 역할도 수행할 수 있다. 단순한 명령은 기기 내부에서 즉시 처리하고, 복잡한 요청만 대형 모델로 넘기는 방식이다.
구글이 강조한 핵심 경쟁력은 신뢰성이다. 내부 ‘모바일 액션’ 평가에서 범용 소형 모델의 함수 호출 정확도가 58% 수준에 머문 반면, 펑션젬마는 목적형 미세조정을 통해 85%까지 정확도를 끌어올렸다. 모델 크기보다 작업 특화 설계가 실사용 환경에서 더 중요하다는 점을 수치로 증명한 셈이다.
기술적 구조도 실행 중심으로 설계됐다. 펑션젬마는 구조화된 함수 호출을 생성한 뒤, 실행 결과를 다시 자연어로 요약해 사용자에게 전달한다. 사람과 컴퓨터 모두와 자연스럽게 소통하도록 설계된 이중 구조다. 여기에 엣지 환경에 최적화된 경량 설계, 행동과 대화를 동시에 처리하는 아키텍처, 폭넓은 개발 생태계 지원이 차별점으로 꼽힌다.
실행 환경의 제약도 크지 않다. 엔비디아 젯슨 나노 같은 소형 엣지 디바이스와 모바일 기기에서도 구동 가능하며, 최대 25만6000 토큰의 컨텍스트를 활용해 JSON 구조나 다국어 입력을 효율적으로 처리한다. 허깅페이스 트랜스포머, 케라스, 언슬로스, 엔비디아 네모 등으로 학습이 가능하고, LiteRT-LM, vLLM, Llama.cpp, Ollama, 버텍스 AI 등 다양한 배포 환경을 지원한다.
구글은 실제 활용 사례도 함께 공개했다. ‘구글 AI 엣지 갤러리’ 앱을 통해 서버 연결 없이 일정 추가, 연락처 등록, 손전등 켜기 등을 수행하는 오프라인 비서 데모를 선보였고, 음성 명령으로 게임 속 작물을 심고 물을 주는 인터랙티브 미니게임도 공개했다. 이는 2억7000만 매개변수 규모의 소형 모델이 모바일 기기에서 다단계 로직을 처리할 수 있음을 보여주는 사례다.
펑션젬마는 허깅페이스와 캐글을 통해 배포된다. 라이선스는 MIT나 아파치 같은 전통적 오픈소스와는 다르지만, 상업적 사용과 수정, 재배포가 허용된다. 다만 혐오 표현 생성이나 악성코드 제작 등 일부 용도는 제한되며, 구글이 약관을 업데이트할 권한을 가진다. 대부분의 스타트업과 개발자에게는 비교적 개방적인 조건이지만, 완전한 자유 활용을 기대하는 경우에는 주의가 필요하다.
이번 발표는 대형 모델 중심 경쟁에서 벗어나, 실제 현장에서 즉각적으로 작동하는 ‘실행형 AI’ 경쟁이 본격화되고 있음을 보여준다. 클라우드 비용과 지연, 개인정보 이슈를 동시에 해결하려는 온디바이스 전략은 향후 스마트폰, 자동차, 스마트홈, 산업용 IoT 전반으로 확산될 가능성이 크다.
구글의 펑션젬마는 그 출발점에 가깝다. 모델 크기를 키우는 대신 목적을 좁히고 실행력을 높이는 전략이 실제 성능으로 이어질 수 있음을 입증했기 때문이다. AI가 말을 잘하는 존재에서, 실제로 일을 처리하는 존재로 넘어가는 전환점에서 펑션젬마가 어떤 생태계를 만들어낼지 주목된다.
[ 변아롱 기자 : yangcheon@thekoreantoday.com ]
<저작권자 ⓒ 코리안투데이(The Korean Today) 무단전재 및 재배포 금지>




