상세 컨텐츠

본문 제목

오픈AI가 또 큰 걸 공개했다…영상 생성AI '소라' 공개

빅테크

by 오카랑 2024. 2. 16. 08:04

본문

728x90

챗GPT를 개발한 인공지능(AI) 기업 오픈AI가 텍스트를 영상으로 변환해주는 AI 모델 '소라(SORA)'를 공개했습니다. 소라의 결과물을 보면서 입 밖으로 "미쳤나봐 얘네"라는 말만 되풀이 할 수 밖에 없었습니다. 

오픈AI는 15일(현지시간) 텍스트 투 비디오(Text To Video) 모델 '소라'를 공개하고 테스트에 돌입했다고 밝혔습니다. 오픈AI는 레드팀이 안전 평가를 시작했고 피드백을 얻기위해 다수의 시각 예술가, 디자이너, 영화제작자에게도 접근권을 부여했다고 합니다. 우리가 실제 사용하기에는 시간이 더 필요해 보입니다. 

소라는 프로프트에 입력된 텍스트를 영상으로 만들어주는 생성형 AI 모델로 최대 1분 길이의 영상을 제작할 수 있습니다.이는 기존 비디오 생성 AI가 짧은 초 단위의 영상만이 제작했던 것과 비교하면 월등한 수치입니다.  

소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일 포함된 복잡한 장면을 생성할 수 있다고 합니다.또한 프롬프트로 요청한 내용뿐 아니라 실제 세계에서 이 사물이 어떻게 존재하는지도 이해하고 있다고 하니 놀라운 수준입니다.  

오픈AI는 소라가 아직은 한계점도 가지고 있다고 설명합니다. 복잡한 장면의 물리현상을 정확하게 시뮬레이션하는 것, 원인과 결과의 특정 사례를 이해하지 못하는 문제가 있다고 합니다. 또한 공간 내 상황을 혼동하거나 시간에 따라 발생하는 이벤트를 정확하게 설명하는데 어려움을 겪을 수 있다고 합니다. 

오픈AI는 소라를 공개하면서 프롬프트에 극단적인 폭력, 성적 콘텐츠, 혐오 이미지, 유명인의 초상화, 타인의 IP 요청 등의 내용을 적을 시 생성을 제한하는 방안도 마련 중이라고 합니다. 딥페이크 등에 적극 대처하겠다는 의미로 해석됩니다. 

2023년은 텍스트 투 이미지 AI모델이 발전한 시기였다면 2024년은 텍스트 투 비디오 모델이 확대되는 시기라고 합니다. 챗GPT로 생성형AI 시대를 연 오픈AI가 그 포문을 연 가운데 다른 기업들의 되치기가 기대되는 시점입니다.

 

 

 

※첨부된 영상과 이미지는 모두 소라가 생성형 결과물입니다.

728x90

관련글 더보기