텍스트 입력하면 최대 1분 길이 동영상 제작 ‘뚝딱’
프롬프트 내용 충실히 반영…시각적 품질도 우수
AI(인공지능) 반도체 제조에 직접 나서겠다는 뜻을 내비친 오픈AI가 텍스트를 동영상으로 변환해주는 AI 시스템을 공개하며 글로벌 AI 경쟁에 뛰어들었다.
오픈AI는 지난 15일(현지시간) 혁신적인 AI 기능을 갖춘 ‘텍스트 투 비디오(Text to Video)’ 모델 ‘소라(Sora)’를 선보였다.
소라는 텍스트만으로 동영상을 생성할 수 있는 AI 시스템이다. 다른 텍스트 투 비디오 모델에 비해 시각적 품질이 좋고, 프롬프트의 내용에 충실한 그림을 그려주는 게 특징이다.
오픈AI 관계자는 “소라를 통해 텍스트만 가지고도 여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있다”고 밝혔다.
이어 “소라는 언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고, 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”며 “사용자가 프롬프트에서 요구한 것뿐만 아니라 이것이 물리적 세계에 어떻게 존재하는지도 이해한다”고 덧붙였다.
소라를 활용해 생성한 동영상도 소개했다. 소라는 오픈AI가 ‘아름답게 눈이 내리는 도시, 도쿄는 분주합니다. 카메라는 눈 내리는 날씨를 즐기며 쇼핑하는 사람들을 따라 번화한 도시 거리를 이동합니다. 화려한 벚꽃잎이 눈꽃과 함께 바람을 타고 날아갑니다’라는 프롬프트를 기반으로 17초짜리 동영상을 뚝딱 만들어냈다.
비단 텍스트에 그치지 않는다. 소라는 기존의 이미지를 통해 동영상을 만들 수 있을 뿐만 아니라 기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다.
이번 AI 시스템에 한번에 여러 프레임을 예측할 수 있는 기능도 장착했다. 이에 피사체가 일시적으로 시야에서 사라져도 동일하게 유지되도록 하는 까다로운 문제도 해결했다.
다만 이번에 공개된 최신 AI 시스템은 ‘제한된 수의 창작자’만 사용할 수 있도록 허용될 전망이다. 샘 올트먼 오픈AI CEO(최고경영자)는 X(구 트위터)를 통해 “초기에는 일부의 창작자만 소라를 이용할 수 있도록 할 방침이다”고 밝혔다.
오픈AI는 소라를 다양한 제품에 적용하기 전에 전문가에게 맡겨 안전성 여부를 평가할 계획이다.
[CEO스코어데일리 / 오창영 기자 / dongl@ceoscore.co.kr]
댓글
[ 300자 이내 / 현재: 0자 ]
현재 총 0개의 댓글이 있습니다.