구글, 제미나이에 이미지 생성 정식 탑재… 멀티모달 전환 본격화

구글이 텍스트 기반 챗봇을 넘어 본격적인 멀티모달 창작 도구로 방향을 선회했다. 30일(현지시간) 구글은 ‘제미나이’ 앱에 이미지 생성 기능을 정식으로 통합했다고 발표하며, 대형언어모델(LLM)의 활용 영역을 확장하고 있다고 밝혔다.

 

[코리안투데이] 구글은 30일(현지시간) 제미나이에 이미지 생성 기능을 통합 출시했다고 발표했다.
(이미지출처=구글 X) ©변아롱 기자

 

 

이번 업데이트는 전 세계 45개 이상 언어 사용자에게 순차적으로 적용되며, 특히 텍스트-이미지 통합 처리 기능을 통해 창작과 콘텐츠 제작의 효율성이 크게 향상될 것으로 기대된다.

 

 

구글은 기존에 ‘이매진(Imagen)’이라는 별도의 이미지 생성 모델을 운영해 왔다. 그러나 이번에는 오픈AI의 챗GPT처럼 이미지 기능을 제미나이 내부에 직접 내장하는 방식을 선택했다. 이로써 사용자들은 텍스트 명령에 따라 이미지를 생성하는 것은 물론, 자신의 사진을 업로드해 직접 수정·변형하는 편집 기능도 활용할 수 있게 됐다.

 

 

핵심은 ‘다단계 편집(Multi-step editing)’ 흐름이다. 사용자는 텍스트로 요청한 이미지에 머리색, 배경, 표정 등을 순차적으로 변경하거나, 기존 이미지를 기반으로 다양한 버전을 생성할 수 있다. 예를 들어 “아이와 고양이가 함께 노는 일러스트를 그려줘”라는 요청에 대해 제미나이는 삽화 스타일의 이미지를 생성한 뒤, “아이의 옷 색을 바꿔줘” 같은 후속 지시까지 반영할 수 있다. 이는 아동용 동화 제작, 만화 연출 등 다양한 콘텐츠 제작에 유용하게 적용될 수 있다.

 

 

이미지 생성의 정확도와 일관성 또한 한층 강화됐다. 사용자가 요청한 장면의 문맥적 흐름을 반영해 캐릭터나 배경 요소를 통일성 있게 유지하는 기능이 새롭게 도입됐으며, 이는 최근 4컷 만화, 영상 스토리보드 등 연속적인 이미지 창작 수요를 겨냥한 기능으로 평가된다.

 

 

이번 기능은 앞서 3월 ‘AI 스튜디오’를 통해 ‘제미나이 2.0 플래시’에서 실험적으로 선보였던 기술이기도 하다. 당시에는 고화질 이미지 생성 능력과 함께 워터마크 회피 문제로 논란을 빚기도 했다. 이에 대해 구글은 “제미나이를 통해 생성되거나 편집된 모든 이미지에는 보이지 않는 워터마크가 삽입되며, 시각적 워터마크 추가도 시험 중”이라고 공식적으로 밝혔다.

 

 

텍스트-음성-이미지 융합 기능을 통해 제미나이는 이제 단순한 정보형 챗봇을 넘어, 디지털 크리에이티브 플랫폼으로 진화하고 있다. 이번 업데이트는 단순히 기능 확장을 넘어서, 구글이 멀티모달 AI 전략을 본격화하고 있다는 신호이자, 생성형 AI 시장의 주도권을 놓고 경쟁 중인 오픈AI, 메타, 미드저니 등과의 격차를 좁히기 위한 구글의 전략적 행보로 해석된다.

 

 

[ 변아롱 기자 yangcheon@thekoreantoday.com ]

 

 

기사 원문 보기

<저작권자 ⓒ 코리안투데이(The Korean Today) 무단전재 및 재배포 금지>

Leave a Comment