경제일보 - 아시아 경제시장의 맥을 짚다
패밀리 사이트
아주일보
베트남
회원서비스
로그인
회원가입
지면보기
네이버블로그
금융
산업
생활경제
IT
건설
정치
피플
국제
사회
문화
딥인사이트
검색
2026.04.22 수요일
맑음
서울 13˚C
흐림
부산 13˚C
맑음
대구 14˚C
맑음
인천 11˚C
흐림
광주 11˚C
흐림
대전 12˚C
흐림
울산 10˚C
흐림
강릉 14˚C
비
제주 12˚C
검색
검색 버튼
검색
'나노바나나'
검색결과
기간검색
1주일
1개월
6개월
직접입력
시작 날짜
~
마지막 날짜
검색영역
제목
내용
제목+내용
키워드
기자명
전체
검색어
검색
검색
검색결과 총
2
건
오픈AI 챗GPT 이미지 2.0 전격 공개 한글 깨짐 현상 완벽 해결
[경제일보] 미국 인공지능 개발사 오픈AI가 이미지 생성 도구의 최신 버전인 챗GPT 이미지 2.0을 21일 전격 공개했다. 이 서비스는 이미지젠(ImageGen) 2.0 모델을 기반으로 설계됐으며 앞서 인공지능 평가 플랫폼 아레나에서 압도적인 성능을 뽐낸 코드명 덕테이프(Duct Tape·덕트 테이프)의 정식 출시 버전이다. 기존 이미지 생성 모델들의 치명적인 단점으로 지적됐던 글자 표현 문제를 완벽에 가깝게 해결하며 글로벌 기술 업계의 뜨거운 관심을 모으고 있다. 그동안 인공지능이 생성한 이미지에 글자를 삽입할 경우 자음과 모음이 의미 없이 나열되거나 글자가 뭉개지는 현상이 빈번하게 발생했다. 이용자가 다시 정확하게 구현해 달라고 수정 지시를 내려도 오랜 시간이 걸리거나 오히려 더 어색한 결과물이 도출되는 경우가 많았다. 하지만 이번에 베일을 벗은 신규 모델은 한글을 이미지 내부에 정확하게 구현하며 인공지능 생성 이미지 특유의 위화감을 완전히 없앴다는 평가를 받는다. 해당 모델을 미리 접한 국내외 이용자들은 온라인 커뮤니티에 다양한 결과물을 공유하며 외계어 현상까지 사라지게 한 것은 혁신이라는 긍정적인 반응을 쏟아냈다. 이번 모델은 사용자의 세밀한 지시를 정밀하게 반영하여 실무 활용도가 매우 높은 결과물을 즉시 제공한다. 이미지 내 사물의 위치와 관계를 정교하게 구성하는 것은 물론이고 작은 글자와 아이콘 및 사용자 환경 요소까지 촘촘한 레이아웃에 맞춰 자연스럽게 배치한다. 최대 3대1에서 1대3에 이르는 폭넓은 화면 비율을 지원하며 사진과 만화 및 영화 등 다채로운 시각적 스타일을 고품질로 재현할 수 있다. 텍스트 렌더링 품질 역시 획기적으로 개선되어 한국어뿐만 아니라 일본어 중국어 힌디어 벵골어 등 비라틴 문자 기반 언어에서도 정교한 성능을 자랑한다. 오픈AI는 이러한 역량을 바탕으로 포스터나 설명 자료 및 다이어그램 등 전문적인 디자인 작업에 이 모델이 널리 쓰일 것으로 내다보고 있다. 특히 이번 버전은 오픈AI 최초로 챗GPT 이미지 사고 기반의 생성 기능을 탑재하여 기술적 차별화를 꾀했다. 이미지 생성 과정에 고도의 추론 능력을 더한 사고(Thinking) 모델과 프로(Pro) 모델은 웹 검색을 통한 최신 정보 탐색과 단일 프롬프트 기반 복수 이미지 생성 기능을 전폭적으로 지원한다. 사고의 연쇄 과정을 거치기 때문에 만화처럼 여러 장의 이미지를 생성할 때 등장인물의 외형이나 복장 등 캐릭터 일관성을 완벽하게 유지할 수 있다. 이번 신규 모델 공개는 오픈AI가 최근 사업 전략을 대폭 수정한 직후에 이뤄져 더욱 이목을 집중시킨다. 오픈AI는 핵심 사업에 역량을 집중하기 위해 세상을 놀라게 했던 동영상 생성 도구 소라(Sora) 서비스를 완전히 접겠다고 최근 공식 발표했다. 오픈AI 측 핵심 관계자는 챗GPT가 궁극적인 개인 비서로 진화하는 과정에서 이미지 생성은 필수적인 핵심 요소지만 동영상에 대한 시장의 수요는 아직 그에 미치지 못한다고 전략 수정의 배경을 설명했다. 실제 사진과 구별이 불가능할 정도로 정교해진 이미지 도구가 자칫 허위 정보 유포나 선거 등 정치적 목적에 악용될 수 있다는 우려에 대해서도 오픈AI는 강력한 방어책을 내놨다. 회사 측은 이용자의 악의적인 사용을 실시간으로 모니터링하고 생성된 콘텐츠가 사회에 미치는 파급력을 신중하게 통제하고 있다고 강조했다. 오남용을 원천적으로 막기 위해 신스ID(SynthID)와 같은 강력한 디지털 워터마크 기술을 도입하여 인공지능이 만든 결과물임을 누구나 쉽게 식별할 수 있도록 조치했다. 현재 챗GPT 이미지 2.0의 기본 기능은 무료 이용자를 포함한 플랫폼 내 모든 계정에서 즉시 사용할 수 있다. 반면 고도의 추론 능력이 필요한 사고 모델과 프로 모델의 고급 출력 기능은 월 20달러에서 200달러 사이의 요금제를 결제하는 플러스 및 비즈니스 구독자에게만 한정적으로 제공된다. 정보 접근성은 높이되 전문가 수준의 상업용 기능을 유료화하여 안정적인 수익 모델을 창출하려는 전략으로 풀이된다. 관련 업계에서는 이번 챗GPT 이미지 2.0 출시가 구글의 나노바나나 모델이 주도하던 이미지 생성 시장의 판도를 완전히 뒤집을 승부수가 될 것으로 전망하고 있다. 그동안 사진과 같은 정밀한 묘사력으로 시장을 선점했던 구글은 텍스트 구현 능력과 디자인 레이아웃 구성에서 압도적인 편의성을 내세운 오픈AI의 거센 도전에 직면하게 됐다. 공교롭게도 이번 신규 모델 공개 시점은 세계 최대 이미지 소프트웨어(SW) 기업인 어도비가 자사 연례행사인 어도비 서밋을 개최하는 기간과 정확히 맞물렸다. 인공지능 모델이 고도의 디자인 영역까지 진출함에 따라 전통적인 그래픽 소프트웨어 기업들과의 치열한 시장 경쟁이 불가피해졌다. 사힐 굽타 어도비 파트너십 수석 총괄은 고객들은 서로 다른 용도로 각 모델을 사용한다고 경쟁 우려를 일축했지만 시장의 위기감은 고조되는 분위기다. 인공지능 기술 전문가들은 이번 덕테이프의 정식 출시가 진위 판별이 무의미해진 새로운 시각 매체 시대의 서막을 열었다고 평가한다. 전문 디자이너의 영역으로 여겨졌던 상업용 이미지 편집과 타이포그래피 작업이 클릭 몇 번으로 완성되면서 콘텐츠 제작 업계 전반에 거대한 지각 변동이 일어날 전망이다. 기술의 비약적인 발전이 가져올 산업의 혁신과 윤리적 보호 장치 마련이라는 무거운 과제가 동시에 우리 앞에 던져졌다.
2026-04-22 17:38:36
"더 똑똑한 AI는 의미 없다"…오픈AI와 구글, '성능 경쟁' 끝내고 '용도 전쟁' 돌입
[이코노믹데일리] 오픈AI의 'GPT-5.1'과 구글의 '제미나이3(Gemini 3)'가 일주일 간격으로 시장에 쏟아지며 전 세계 AI 업계가 다시금 들썩이고 있다. 두 모델 모두 전작을 뛰어넘는 성능을 보여주고 있지만 과거처럼 '누가 더 똑똑한가'를 가리는 수직적 경쟁은 끝났다는 분석이 지배적이다. 대신 구글은 압도적인 '창의성과 멀티모달'을, 오픈AI는 극한의 '속도와 효율'을 택하며 각자의 생존 영역을 구축하는 '각자도생'의 길로 들어섰다. 구글이 내세운 제미나이3 시리즈의 핵심 무기는 '복합 멀티모달' 능력이다. 텍스트를 넘어 영상, 이미지, 대용량 문서(PDF)를 한 번에 처리하는 능력에서 경쟁사를 압도한다. 구글은 공식 블로그를 통해 인간 전문가 수준을 평가하는 ‘인류의 마지막 시험(Humanity's Last Exam, HLE)’ 벤치마크 결과 최상위 모델인 ‘제미나이3 프로’가 37.5%의 정답률을 기록해 26.5%에 그친 GPT-5.1을 큰 격차로 따돌렸다고 밝혔다. 여기에 100만 토큰 이상의 대규모 문맥 유지력과 안드로이드, 유튜브 등 구글 생태계와의 연동성은 제미나이3만의 강력한 해자(Moat)다. 특히 텍스트 명령만으로 3D 시뮬레이션과 게임 구조를 짜주는 '바이브 코딩(Vibe Coding)'과 4K 해상도 이미지를 생성하는 '나노바나나 프로'는 크리에이터들에게 대체 불가능한 옵션으로 자리 잡고 있다. 미국 테크 매체 톰스가이드가 진행한 비교 실험에서 제미나이3가 창의적 글쓰기, 이미지 분석 등 7개 항목에서 승리한 것도 이러한 특성을 뒷받침한다. 반면 오픈AI의 GPT-5.1은 철저히 '비즈니스 효율'에 초점을 맞췄다. '인스턴트(Instant)'와 '씽킹(Thinking)'으로 이원화된 적응형 추론 모드는 작업 난이도에 따라 리소스를 조절하며 속도와 비용을 최적화한다. 전작(GPT-5) 대비 2~3배 빨라진 속도와 절반으로 줄어든 토큰 비용은 기업 고객들에게 거부할 수 없는 매력이다. 코딩 벤치마크인 SWE-bench Verified에서 76.3%를 기록하며 제미나이3 프로(76.2%)를 근소하게 앞선 점도 실무 개발자들의 지지를 받는 요인이다. 레딧 등 개발자 커뮤니티에서는 "실시간 대화나 API 기반 서비스에선 GPT-5.1이 더 안정적"이라는 평가가 주를 이룬다. 하지만 화려한 성능표 뒤에는 두 기업이 감추고 싶은 '불편한 진실'도 존재한다. 구글 제미나이3의 경우 혁신적인 기능만큼이나 높은 '진입 장벽'이 문제다. 심층 추론 기능인 '딥싱크(DeepThink)'는 대규모 문맥 분석에 탁월하지만 초기 버전에서 간헐적인 추론 오류가 보고되고 있으며 무엇보다 API 단가가 지나치게 높다는 지적을 받는다. 아무리 성능이 좋아도 비용 효율이 떨어지면 대다수 기업이 도입하기 어렵다. '나노바나나 프로' 같은 도구 역시 고사양을 요구해 일반 사용자의 접근성은 떨어진다. 오픈AI의 GPT-5.1 역시 비판에서 자유롭지 않다. '효율'을 강조했지만 이는 역설적으로 기술적 혁신이 정체되었다는 방증이기도 하다. 복잡한 멀티모달 처리나 초장기 문맥 유지력에서 구글에 비해 보수적인 접근을 취하면서 "더 이상 오픈AI가 AI 트렌드를 선도하지 못한다"는 회의론도 고개를 들고 있다. 벤치마크 점수 0.1% 차이로 우위를 주장하는 마케팅 전쟁에 피로감을 호소하는 목소리도 높다. 결국 시장의 선택 기준은 '성능 우열'이 아닌 '목적 적합성'으로 이동하고 있다. 테크크런치는 "더 뛰어난 모델을 찾는 시대는 끝났다. 이제는 어떤 일을 누구에게 맡길지가 핵심"이라고 진단했다. 톰스가이드 역시 “창의적·복합적 사고가 필요하면 제미나이 3, 정밀성과 계산 중심 업무라면 GPT-5.1이 더 적합하다”고 평가했다. 이제 AI 전쟁의 승패는 누가 더 높은 점수를 받느냐가 아니라 누가 더 빨리 사용자의 구체적인 업무 파이프라인에 녹아드느냐에 달려있다. 2025년의 AI 시장은 '절대 강자'가 사라진 자리에 '최적의 도구'만이 살아남는 춘추전국시대로 접어들었다.
2025-11-23 15:07:31
처음
이전
1
다음
끝
많이 본 뉴스
1
2시간 줄 서서 굿즈 산다…2030 여성팬이 바꾼 한국 야구의 얼굴
2
"다채로운 꿈을 밝히고, 우정의 다리를 놓다" 국제 중국어의 날 행사, 서울랜드서 개최
3
납기·안정성 흔드는 노사 갈등…삼성전자 파업 변수, '코리아 디스카운트' 번지나
4
[베트남경제] 베트남, "성장률 두 자릿수 달성 위해 GDP 40% 투자할 것"
5
건설업계 '인력 구조조정' 확산…일감 감소·미분양 부담에 고용 한파 짙어져
6
[재계 DNA 분석① SK] 잿더미 선경직물에서 글로벌 AI 심장부로 비상한 SK 70년 혁신과 파격의 역사
7
수해 막으려다 토사에… 보령 하천 정비하던 60대, 끝내 '무너진 흙더미'에 숨져
8
로스트아크 신화 이끈 금강선 사단...초대형 신작 오르페우스 흥행 돌풍 예고
영상
Youtube 바로가기
오피니언
[사설] 양국 기업이 규제 없이 펄펄 날 수 있도록 상생의 새 틀 만들어야