이미지 생성 기술을 둘러싼 빅테크 경쟁이 새로운 국면에 들어섰다. 텍스트 생성에서 시작된 생성형 인공지능 경쟁은 이제 이미지와 영상, 멀티모달 사용자 경험으로 무게중심이 이동하고 있다. 이 흐름의 한가운데서 OpenAI가 챗GPT에 차세대 이미지 생성 모델을 전면 탑재하며 승부수를 던졌다. 단순한 기능 추가가 아니라, 사용자 경험 전반을 재설계하겠다는 선언에 가깝다.
![]() [코리안투데이] 사진=오픈AI © 변아롱 기자 |
오픈AI는 16일(현지시간) ‘GPT 이미지 1.5(gpt-image-1.5)’를 공개하고, 이날부터 모든 ChatGPT 사용자에게 순차 배포를 시작했다. 개발자들은 API에서도 동일한 모델을 ‘GPT 이미지 1.5’라는 이름으로 이용할 수 있다. 이번 업데이트는 오픈AI가 이달 초 선언한 ‘코드 레드(Code Red)’ 전략의 핵심 축 중 하나로 해석된다.
GPT 이미지 1.5의 가장 큰 특징은 ‘정밀한 이미지 편집’이다. 사용자가 이미지를 업로드한 뒤 수정 요청을 하면, 모델이 의도를 분석해 필요한 부분만 선택적으로 변경한다. 배경이나 인물의 전체 구성을 흐트러뜨리지 않으면서도, 작은 디테일까지 세밀하게 반영하는 방식이다. 오픈AI는 이 과정에서 시각적 일관성이 유지된다고 강조했다. 이는 그동안 생성형 이미지 모델의 약점으로 지적돼 온 ‘부분 수정 시 전체 붕괴’ 문제를 정면으로 개선한 접근이다.
스타일 변환 능력도 대폭 강화됐다. 단순한 필터 적용을 넘어, 실용적인 이미지 편집부터 예술적 재해석까지 폭넓게 대응할 수 있다는 설명이다. 업계에서는 이 기능이 구글의 ‘나노 바나나’ 이미지 편집 기능과 유사한 사용자 경험을 제공한다는 점에 주목하고 있다. 텍스트 렌더링 성능 역시 개선돼, 더 작고 빽빽한 글자도 안정적으로 이미지에 반영할 수 있다. 여기에 이미지 생성 속도는 이전 버전 대비 최대 4배 빨라졌다.
성능 지표에서도 변화는 분명하게 드러났다. 이날 공개된 LM Arena의 ‘텍스트-이미지(Text-to-Image)’ 리더보드에서 GPT 이미지 1.5는 1,264점을 기록하며 1위에 올랐다. 이는 1,235점을 기록한 구글의 ‘나노 바나나 프로’를 앞선 수치다. 이전 세대 모델이던 gpt-image-1이 14위에 머물렀던 것과 비교하면, 세대 교체 효과가 명확하게 확인된다.
오픈AI는 모델 성능 공개와 함께 챗GPT 내부에 ‘이미지 전용 공간’을 새로 추가했다. 모바일 앱의 사이드바와 웹 인터페이스에서 접근 가능하며, 수십 가지 사전 설정 필터와 샘플 프롬프트가 제공된다. 이 공간은 단순한 도구 모음이 아니라, 이미지 생성과 편집을 하나의 작업 흐름으로 묶은 전용 환경에 가깝다. 최신 트렌드를 반영해 정기적으로 업데이트된다는 점도 강조됐다.
피지 시모 오픈AI 애플리케이션 CEO는 별도의 블로그를 통해 이번 변화의 방향성을 설명했다. 그는 “인간은 단어로만 생각하지 않는다”며 “챗GPT는 텍스트 중심 인터페이스에서 멀티미디어와 동적 UI로 이동할 것”이라고 밝혔다. 이는 검색 결과와 대화 응답에 더 많은 시각적 요소가 포함될 것임을 시사한다. 이미지 생성과 편집을 하나의 독립된 작업 영역으로 분리한 것도 같은 맥락이다.
이번 업데이트는 구글과의 경쟁 구도를 의식한 행보로도 읽힌다. 최근 생성형 AI 사용자 증가의 핵심 동력으로 이미지 생성 기능이 꼽히고 있기 때문이다. 실제로 Google의 ‘나노 바나나’는 이미지 편집과 생성에서 빠른 반응을 얻으며 주목을 받아왔다. 오픈AI가 GPT 이미지 1.5를 통해 이를 정면으로 겨냥했다는 분석이 나온다.
한편 오픈AI는 이달 초 ‘코드 레드’를 발령하고 챗GPT 사용자 경험 개선에 모든 역량을 집중하겠다고 내부적으로 선언한 바 있다. 지난 11일 공개된 GPT-5.2 업데이트는 Gemini 3에 내줬던 일부 벤치마크 성능을 되찾았지만, 이는 주로 기업과 개발자 대상 성격이 강했다. 반면 이번 이미지 기능 강화는 일반 사용자 체감도가 높은 ‘프론트엔드’ 업데이트라는 점에서 의미가 다르다.
업계에서는 오픈AI가 내년 1월을 전후해 사용자 경험 중심의 추가 모델을 선보일 가능성에도 주목하고 있다. 회사 측은 사용자와 개발자 피드백을 반영해 이미지·멀티모달 기능을 지속적으로 고도화하겠다고 밝혔으며, 그때까지 코드 레드 체제는 유지될 전망이다.
결국 GPT 이미지 1.5의 출시는 하나의 기능 업데이트를 넘어, 챗GPT의 정체성을 재정의하는 신호로 읽힌다. 텍스트 중심 AI에서 이미지와 음성, 동적 인터페이스를 포괄하는 ‘멀티미디어 에이전트’로의 진화다. 이미지 생성 경쟁에서 한 발 앞서 나간 오픈AI의 선택이, 생성형 AI 시장의 다음 국면을 어떻게 바꿀지 주목된다.
[ 변아롱 기자 : yangcheon@thekoreantoday.com ]
<저작권자 ⓒ 코리안투데이(The Korean Today) 무단전재 및 재배포 금지>

