메타(META)의 '무비 젠', 영상 생성 AI 지각 변동

김민영 기자 / 기사승인 : 2024-10-10 09:04:36
  • -
  • +
  • 인쇄
(사진=연합뉴스)


[알파경제=박남숙 기자] 메타(META)가 텍스트 기반 동영상 생성 AI 모델인 '무비 젠(Movie Gen)'을 공개했다.

'무비 젠'은 텍스트 프롬프트 입력만으로 비디오 생성, 오디오 생성, 편집까지 모두 가능하며 공개된 모델은 영상(Movie Gen Video)과 오디오(Movie Gen Audio) 두 종류다. 영상 모델은 매개 변수 300억 개의 트랜스포머 아키텍처 기반으로 고품질의(1080p) 영상을 최대 16초 길이로 생성한다.

 

길이 자체는 길지 않지만 동영상 품질만 놓고 보면 현존하는 모델중 탑티어 수준이란 평가다. 프롬프트 관리 기능을 통해 카메라 모션, 객체 상호 작용, 환경 물리학 등의 복잡한 조건까지도 반영한다.

오디오 모델은 매개 변수 130억 개의 디퓨전 트랜스포머(DiT) 기반 모델로 48kHz의 고품질 시네마틱 오디오를 생성해 영상에 정확하게 동기화를 해준다. 이를 위해 플로우 매칭을 포함한 다양한 신기술들이 대거 적용됐다.

이영진 삼성증권 연구원은 "비록 통합된 모델은 아니지만, 오디오 생성 기능을 지원하지 않는 경쟁사 제품들 대비 확실한 차별점"이라고 분석했다. 

실제로 메타에서 제시한 인간 평가자 선호도 결과에 따르면 영상 일관성, 동작의 자연스러
움 등 다양한 부분에서 무비 젠이 런웨이의 ‘젠 3(Gen 3)’, 루마의 ‘드림머신(Dream Machine)’, 오픈AI의 ‘소라(Sora)’ 등을 모두 앞섰다.

이영진 연구원은 "그 밖에 이미지를 활용한 개인화 맞춤형 비디오 생성, 객체나 색상 변경 및 배경 교체, 정밀한 비디오 편집 등의 고급 기능들도 주목해야 한다"며 "메타 플랫폼스가 집중하고 있는 크리에이터 이코노미 활성화 전략에 도움이 될 것"이라고 예상했다. 내년 중 SNS 서비스에 통합되며 매출에 직접적인 영향을 미칠 가능성이 높다는 판단이다.

이어 "플로우 매칭 기술을 통한 자연스러운 영상 구현과 하드웨어와 플랫폼 간 시너지가 기대된다"고 전망했다. 

 

메타 종목진단 (출처=초이스스탁)

다만 관건은 비용과 영상 생성 시간이다.

 

정확한 정보가 공개된 것은 아니지만 최고 제품 책임자(CPO)인 크리스 콕스에 따르면 추가적인 개선이 필요하다는 의견이다. 그러나 영상 생성 AI 모델 전반의 빠른 발전 속도, 메타 플랫폼스의 막대한 AI 인프라(H100 기준 50만 대)를 감안하면 결국 시간의 문제일 것으로 보인다.

 

이 연구원은 "결국 AI가 생성하는 영상이 사람이 만든 영상을 양으로 넘어서는 시기는 예상보다 빠르게 찾아올 것"이라며 "동영상 생성 경쟁력이 디지털 광고 산업의 패권 경쟁을 위한 핵심 기술로 자리잡게 될 가능성이 높다"고 짚었다.


이번 무비젠은 메타 플랫폼스의 AI 경쟁력을 간접적으로 증명한 사례로 라마, AR 글래스에이어 자사의 AI 서비스에 최적화된 파이프라인을 차례로 구축하고 있다. 숏폼을 중심으로하는 메타의 고성장이 유지될 가능성이 더욱 높아졌다는 판단이다.

 

알파경제 김민영 기자(kimmy@alphabiz.co.kr)

주요기사

도요타(7203 JP), 자율주행 전기차 'e-Palette' 상용화 시작2025.09.16
닛케이 평균, 미국 하이테크 상승에 힘입어 4만5천엔 돌파 전망2025.09.16
캐논(7751 JP) vs. 니콘(7731 JP), 반도체 노광장치 시장에 새 바람2025.09.16
美트럼프, 일본산 車 관세 15% 인하…미·일 무역합의 후속 조치2025.09.16
알파벳(GOOGL.O), 시총 3조 달러 돌파…세계 네 번째 '3조 클럽' 합류2025.09.16
뉴스댓글 >