본문 바로가기
IT 트랜드

OpenAI의 SORA 또 한 번의 파장

by 발빠른IT 2024. 2. 18.

챗GPT의 큰물결

챗GPT의 대장하면 단연코 openAI아닐까요? 이번에는 확실한 굳히기가 들어가는 것 같습니다.

OpenAI에서 SORA라는 프롬프트로 동영상제작이 가능한 챗GPT엔진이 2월15일 소개되었습니다.

 

 

프롬프트의 예시를 홈페이지에서 소개했습니다.

 

[Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.] 괄호안의 프롬프트를 예시로 만들어진 영상의 일부는 아래와 같습니다.

 

 

오픈 AI 의 'SORA'로 생성한 영상 '도쿄 워크( Tokyo Walk )'/ 사진출처 = openAI

 

소라(SORA) 소개

  • 오픈AI가 개발한 새로운 생성형 AI 모델 '소라(SORA)' 소개
  • 기존에는 텍스트와 이미지 생성에 주력하다가 영상 생성 기능 추가

활용 방법과 기능

  • '달리(DALL-E)'와 유사한 이미지 생성 AI와 비교
  • 사용자가 명령어(프롬프트)를 입력하면 고화질 영상 클립 생성
  • 영상의 '확장판' 생성 및 누락된 프레임 보완 기능 소개

소라의 능력과 특징

  • 여러 명의 등장인물, 특정한 움직임, 피사체와 배경의 구체성을 고려하여 복잡한 장면 생성
  • 등장인물의 시각적 디테일을 정확하게 유지하는 능력 강조
  • 사용자가 원하는 영상 장면을 다양하고 생생하게 구현 가능

홈페이지서 소개한 '도쿄 워크(Tokyo Walk)'

  • '도쿄 워크' 명령어를 통한 구체적인 예시 소개
  • 스타일리시한 여성의 도쿄거리 산책, 착용한 의상과 액세서리에 대한 자세한 설명
  • '도쿄 워크'를 통해 소라가 얼마나 다양하고 생동감 있는 영상을 생성할 수 있는지 시연

소라의 한계와 어려움

  • 오픈AI는 소라의 한계를 인정, 복잡한 장면에서 등장인물의 움직임이 어색할 수 있음을 밝힘
  • 장면 간의 인과관계를 이해하는 데 한계가 있어 영상 흐름이 어설플 수 있음을 언급
  • 예를 들어, 과자를 베어 물었지만 다음 장면에서는 베어 문 자국이 없는 등의 불일치 발생 가능성 언급

소라의 활용 우려사항

  • 외신(CNBC 등)은 '소라'가 생성형 AI의 차세대를 개척할 수 있을 것으로 기대
  • 그러나, 전세계적으로 중요한 선거 등과 관련하여 심각한 가짜 정보를 퍼뜨릴 우려 제기
  • 영상 생성 능력으로 인해 실제와 구별이 어려워져 가짜 정보 확산 가능성에 대한 우려 표현을 했습니다.