오픈AI가 최근 발표한 GPT-4o는 멀티모달 AI 모델로, 텍스트, 음성, 비디오 입력을 실시간으로 처리할 수 있다. ‘o’는 ‘omni’를 의미하며, 이 모델은 사용자의 지시에 대해 모든 형식을 추론하여 서비스를 제공한다. GPT-4o는 이전 모델에 비해 처리 속도가 두 배 빠르고, 비용은 절반이며, 글자 제한도 5배 더 많다 .
![]() ▲ https://openai.com/index/hello-gpt-4o/ |
“스타트업, 생존 전략이 필요하다”
GPT-4o의 등장은 AI 스타트업들에게 큰 위협이 되고 있다. 실시간 번역, 교육 등 특정 영역에서 서비스를 제공해왔던 스타트업들은 이 모델의 출현으로 큰 타격을 받을 전망이다. 특히 GPT-4o는 무료 사용자에게도 제공될 예정이어서, 기존의 유료 서비스 모델에 의존해왔던 스타트업들은 더욱 어려움을 겪을 것으로 보인다.
![]() ▲ 샘 올트만 OpenAI CEO |
“GPT-4o의 강력한 기능”
GPT-4o는 이미지, 텍스트, 음성을 동시에 분석하며, 평균 응답 속도가 320ms로 매우 빠르다. 또한, 사람의 감정과 얼굴 표정까지 인식할 수 있어 자연스러운 대화가 가능하다 . 이 모델은 실시간 번역 기능도 제공하며, 비영어권 언어에 대한 성능이 크게 향상되었다.
“AI 스타트업의 대응 방안”
전문가들은 AI 스타트업들이 GPT-4o와의 경쟁에서 살아남기 위해 차별화된 전략을 마련해야 한다고 조언한다. 특정 분야에서의 전문성을 강화하고, GPT-4o의 멀티모달 기능을 활용한 새로운 응용 프로그램을 개발하는 것이 중요하다. 또한, 소버린 AI를 통해 독립적인 AI 역량을 구축하고, 중동, 동남아 등 니치 마켓을 공략하는 전략도 필요하다.
<저작권자 ⓒ 코리안투데이(The Korean Today) 무단전재 및 재배포 금지>

