구글 클라우드, 버텍스 AI에서 동영상 생성 모델 ‘비오’와 이미지 생성 모델 ‘이마젠 3’ 제공

박현아

입력 2024-12-05 10:37:44

비오, 간단한 텍스트·이미지만으로 고화질 동영상 빠르게 생성… 마케팅 및 제작 프로세스 획기적 단축
디지털 워터마킹, 안전 필터, 데이터 거버넌스 등 엔터프라이즈급 보안 및 안전성 지원


구글 클라우드가 구글의 최신 동영상 생성 모델인 비오(Veo)와 최고 품질의 이미지 생성 모델인 이마젠 3(Imagen 3)를 버텍스 AI(Vertex AI)를 통해 고객에게 제공한다고 밝혔다.

구글 클라우드는 3일부터 비오를 버텍스 AI에서 프라이빗 프리뷰(private preview)로 제공한다. 비오는 고객이 간단한 텍스트나 이미지 프롬프트를 통해 고품질 동영상을 손쉽게 생성할 수 있도록 지원한다. 구글 클라우드는 이미지 기반 동영상 생성(image-to-video) 모델을 제공하는 최초의 하이퍼스케일러(hyperscaler) 기업으로서, 동영상 제작 워크플로를 간소화하고 기업이 기존의 크리에이티브 자산을 역동적인 영상 콘텐츠로 전환하며 창의적 표현의 새로운 가능성을 열 수 있도록 지원한다.

또한 다음 주부터 이마젠 3를 모든 버텍스 AI 고객에게 제공한다. 이마젠 3는 단순한 텍스트 프롬프트를 통해 사실적인 고품질의 이미지를 생성하고, 이전 버전 대비 뛰어난 디테일과 조명 표현, 아티팩트 감소량을 자랑한다.

버텍스 AI는 기업 고객이 AI 모델을 간편하게 커스터마이징하고, 성능을 평가하며, 주요 인프라에 배포할 수 있도록 지원하는 오케스트레이션 플랫폼을 제공한다. 버텍스 AI에서 제공되는 비오와 이마젠 3의 개발 및 배포는 구글의 AI 원칙에 따라 디지털 워터마킹, 안전 필터, 데이터 거버넌스와 같이 기본으로 제공되는 보호 기능을 통해 안전과 책임을 우선시하도록 설계됐다.

고성능 동영상 생성 모델 ‘비오’를 이제 버텍스 AI에서

구글 딥마인드(Google DeepMind)에서 개발한 비오는 텍스트 또는 이미지 프롬프트를 기반으로 다양한 영화적, 시각적 스타일의 고화질 동영상을 빠르게 생성한다. 비오는 자연어와 시각적 의미에 대한 뛰어난 이해를 바탕으로 프롬프트와 밀접하게 부합하는 동영상을 생성해 사람, 동물, 사물이 영상 전반에서 사실적으로 움직이도록 일관성 있고 자연스러운 영상을 제작할 수 있다.

비오는 기존 이미지 또는 AI가 생성한 이미지를 기반으로 영상을 생성한다.

기업은 버텍스 AI에서 비오를 활용해 간단한 텍스트 또는 이미지 프롬프트로 고품질 비디오를 손쉽게 생성할 수 있다. 이를 통해 제작 시간을 단축하고 비용을 절감하면서도, 비디오 콘텐츠를 빠르게 시범 제작하거나 반복할 수 있다. 비오의 기술력은 작업자가 더 높은 수준의 작업에 집중할 수 있게 돕고, 동영상 제작 과정의 지루하거나 반복적인 작업을 AI로 처리할 수 있게 도와준다. 이러한 기술력을 바탕으로 인간의 창의성을 위한 훌륭한 파트너의 역할을 제공한다. 눈길을 끄는 SNS 게시물을 제작하는 마케터나, 설득력 있는 프레젠테이션을 만드는 영업팀, 혹은 새로운 콘셉트를 모색하는 제작팀에게 비오는 워크플로를 간소화하고 시각적 스토리텔링의 새로운 가능성을 열어주는 파트너가 돼 준다.

버텍스 AI에서 최고 품질의 이미지 생성 모델 이마젠 3 정식 제공

이마젠 3는 최고 품질의 텍스트 기반 이미지 생성 모델로, 뛰어난 수준의 디테일을 갖춘 사실적이고 생생한 이미지를 제작할 수 있으며, 시각적 오류 역시 이전 모델 대비 크게 감소했다. 다음 주부터 모든 구글 클라우드 고객은 버텍스 AI에서 이마젠 3를 사용할 수 있으며, 이를 통해 간단한 텍스트 프롬프트로 고해상도 이미지와 동영상을 생성할 수 있다.

나아가 구글 클라우드는 고객이 비즈니스 요건에 맞게 이미지를 편집하고 맞춤 설정하도록 지원하는 새로운 기능을 허용 목록(allowlist)에 등록된 고객을 대상으로 제공한다고 밝혔다. 이마젠 3는 모든 이미지를 다듬고 맞춤화할 수 있는 강력한 편집 기능을 사용자 친화적인 방법으로 제공한다. 간단한 텍스트 프롬프트로 사진을 편집하거나 제품의 배경 업데이트를 포함해 마스크 기능을 기반으로 이미지의 일부만 편집하거나 필요한 크기에 맞춰 이미지를 확대 조정할 수 있다.

또한 이마젠 3의 커스터마이즈(Customization) 기능을 통해 더욱 강력한 제어 기능을 제공하며 모델이 원하는 특성을 가진 이미지를 생성하도록 설정할 수 있게 지원한다. 고객은 새로운 이미지를 생성할 때 브랜드, 스타일, 로고, 주제 또는 제품 특징을 직접 입력할 수 있으며, 이를 통해 광고 및 마케팅 자산의 마케팅 프로세스를 강화하고 개발을 가속화해 새로운 창의적 가능성을 개척할 수 있다.

엔터프라이즈 수준의 안전성과 보안

구글 클라우드는 신뢰할 수 있고 안전하며 책임감 있는 AI를 설계하고 개발하는 것을 최우선으로 한다. 이러한 구글 클라우드의 AI 원칙에 따라 버텍스 AI의 비오와 이마젠 3는 안전성을 핵심 근간으로 개발됐다.

· 디지털 워터마킹(Digital watermarking): 구글 딥마인드의 신스ID(SynthID)는 이마젠 3와 비오가 생성하는 모든 이미지와 프레임에 보이지 않는 워터마크를 삽입해 잘못된 정보나 출처가 표시되는 상황을 미연에 방지한다.
· 안전 필터(Safety filters): 비오와 이마젠 3에는 모두 유해 콘텐츠 생성을 방지하고 구글의 책임감 있는 AI 원칙을 준수하는 안전장치가 내장돼 있다. 구글 클라우드는 모델의 안전성과 개인정보보호를 향상하기 위해 새로운 기술 개발에 지속적으로 투자하고 있다.
· 데이터 거버넌스(Data governance): 구글 클라우드는 자사의 데이터 거버넌스와 개인정보 관리 정책에 따라 고객 데이터를 모델 학습에 사용하지 않는다. 고객 데이터는 오직 고객이 허용한 범위에 따라 관리된다.
· 저작권 면책(Copyright indemnity): 구글 클라우드는 업계 최초로 저작권 문제에 안심할 수 있는 생성형 AI 면책 조항을 제공하고 있다.

다양한 글로벌 기업 고객이 버텍스 AI에서 비오와 이마젠을 활용해 가치를 창출하고 있다. 글로벌 마케팅 및 커뮤니케이션 서비스 그룹 WPP는 자사의 마케팅 혁신을 위한 AI 기반 운영 체제인 ‘WPP 오픈(WPP Open)’의 이미지 생성에 이마젠 3를 활용하고 있다. 곧 WPP는 동영상 생성 과정에도 비오를 통합해 콘텐츠의 아이디어 구상 및 제작 과정을 간소화할 예정이다. 이러한 도입 확장을 통해 WPP는 더 높은 수준의 창의성과 효율성을 실현할 수 있게 됐다.

글로벌 디지털 여행 플랫폼 아고다(Agoda)는 버텍스 AI에서 이마젠과 비오를 시각 콘텐츠 제작을 위해 테스트하고 있다. 여행지의 고유한 이미지를 생성하고 이를 동영상 제작에 활용한다. 아고다는 비오와 이마젠을 사용해 홍보 동영상을 제작했으며, 이를 통해 제작 시간을 크게 단축했다.

글로벌 스마트 기기 공급업체인 아너(Honor)는 현재 수백만 대의 스마트폰에 이마젠을 탑재해 사용자가 직접 AI 이미지 생성 기능을 사용할 수 있도록 제공하고 있다. 이를 통해 사용자는 아웃페인팅(outpainting) 및 스타일(stylization) 같은 기능을 사용해 손쉽게 사진을 편집하고 수정할 수 있다.



박현아


<ⓒ미디어경제뉴스, 미디어경제뉴스 무단 전재, 재배포 금지>

최신뉴스

  • LG U + ·토스 협업 캠페인 성료…'익시(ixi)' 180만 명에 알렸다
  • 포르쉐·벤츠 아니었다… 올해의 차는 스웨덴 전기차 ‘폴스타4’

    스웨덴 프리미엄 전기차 브랜드 폴스타의 ‘폴스타4’가 ‘2025 중앙일보 올해의 차(Car of the Year·COTY)’에 선정됐다. 올해의 차 심사위원들은 폴스타4에 대해 디자인, 퍼포먼스, 지속 가능성, 안전성 등 다방면에서 뛰어난 상품성을 보였다고 평가했다.스웨덴 프리미엄 전기차 브랜드 폴스타의 ‘폴스타4’가 '2025 중앙일보 올해의 차(Car of the Year·COTY)’로 선정됐다(제공=폴스타)지난 15일 경기도 화성시 한국교통안전공단 자동차안전연구원에서 중앙일보 올해의 차(Car Of The Year, COTY) 김진표 심사위원이 차량 제조사 관계자의 설명을 들으며 평가를 진행하고 있다.중앙일보 COTY 심사위원회는 지난 2개월에 걸쳐 총 13개 브랜드, 15개 신차를 심사했으며, 그 결

  • 엘앤에프 ‘인터배터리 어워즈 2025’ 소재·부품 분야 수상

    글로벌 이차전지 소재기업 엘앤에프가 24일 강남 코엑스에서 열린 제2회 ‘인터배터리 어워즈 2025’에서 ‘하이니켈(High-Ni, Ni≥95%) 복합 양극활물질’로 소재/부품(Material/Component) 분야 수상의 영예를 안았다.한국배터리산업협회와 코엑스가 주관하는 ‘인터배터리 어워즈’는 ‘인터배터리’ 참가 기업 중 배터리 산업의 우수 제품과 기술을 선정하고, 그 우수성을 산업 관계자 전체에 선보이는 행사다. △배터리 △소재·부품 △사용 후 배터리 활용 △장비·자동화 △스타트업 등 5개 출품 분야에서 기술 우수성, 혁신성, 상품성, 산업 발전 기여도 등을 평가해 수상작을 선정한다.이번 수상작인 ‘하이니켈 복합 양극활물질’은 니켈 함량 95% 이상의 다결정(Poly-crystal)과 단결정(Sing

  • KMONDS ‘72h 바이어 매칭 서비스’ 공식 론칭

    글로벌 세일즈 파트너 KMONDS (케이몬즈)가 혁신적인 바이어 매칭 플랫폼 ‘72h’를 공식 론칭하며, 해외 진출을 희망하는 한국 기업들에게 새로운 기회를 제시한다고 밝혔다.이번 서비스는 기존 글로벌 B2B 플랫폼의 한계를 보완하고, 보다 신뢰도 높은 수출 거래 환경을 마련하는 데 주안점을 두고 있다.◇ 프로토타입으로 검증한 숫자KMONDS는 본 서비스를 개발하기 전 프로토타입 개발을 통해 해외 시장 검증에 대한 가설검증을 진행했다. 그 결과, 전 세계 93개국에서 평균 2207.5명의 일간 활성 사용자(DAU)를 확보했으며, 일최고 방문자 수는 4806명을 달성했다.이러한 수치에 대해 KMONDS는 국내 기업들이 해외 바이어와 신속히 연결될 수 있는 잠재 시장이 매우 크고, 실제 바이어들의 방문이 상당했

  • 삼성전자·포스텍 ‘무색수차 메타렌즈’ 연구 논문, 네이처 머티리얼스에 게재

    삼성전자와 포스텍(POSTECH)이 산학협력을 통해 진행한 ‘무색수차 메타렌즈’ 연구 논문이 세계적인 학술지 ‘네이처 머티리얼스(Nature Materials)’에 게재됐다.메타렌즈는 빛의 회절을 제어할 수 있는 나노 크기의 구조체로 구성된 평면 렌즈이다. 디스플레이·카메라 등 광학 시스템 분야에서 차세대 소자로 주목받으며, 10여 년 전부터 업계에서 다양한 연구가 진행돼 왔다.특히 기존 볼록 광학 렌즈 대비 크기와 두께를 획기적으로 줄일 수 있는 장점이 있다. 하지만 큰 색수차로 이미지가 심각하게 왜곡되는 기술적 한계가 있어 실제 제품 개발로 이어지는 데 어려움이 있었다.※ 색수차(Chromatic Aberration): 렌즈를 통과하는 빛이 굴절될 때, 서로 다른 파장의 빛들이 굴절률이 달라 각기 다른