텍스트에서 저해상도 3D 모델을 생성한 후 고해상도로 최적화

매직3D는 텍스트에서 저해상도 3D 모델을 생성한 후 고해상도로 최적화하는 2단계 프로세스로 구성된다.(사진=엔비디아)
매직3D는 텍스트에서 저해상도 3D 모델을 생성한 후 고해상도로 최적화하는 2단계 프로세스로 구성된다.(사진=엔비디아)

엔비디아가 텍스트 설명에서 3D 모델을 생성할  수 있는 AI 모델 '매직3D(Magic3D)’를 공개했다고 아스 테크니카가 22일(현지시간) 보도했다.

매직3D는 텍스트 프롬프트를 입력하면 약 40분 안에 컬러 텍스처로 완성된 3D 메쉬 모델을 생성한다. 생성된 결과 모델은 비디오 게임 및 VR 응용 프로그램의 개발 속도를 높일 수 있으며 영화 및 TV용 특수 효과 제작에 적용할 수 있다.

이 모델은 지난 9월 구글이 발표한 텍스트-3D 모델인 드림퓨전보다 2배  빠르게 3D 개체를 생성할 수 있다. 드림퓨전은 텍스트-이미지 생성 AI 모델을 사용해 2D 이미지를 생성한 다음 NeRF(Neural radiance field) 모델을 사용해 2D 이미지를 3D로 변환하는 것과 유사하게 매직3D는 텍스트에서 저해상도 3D 모델을 생성한 다음 고해상도로 최적화하는 2단계 프로세스를 사용한다. 그 결과 매직3D는 텍스트 프롬프트에서 고품질의 3D 출력을 빠르게 제공할 수 있다.

매직3D는 텍스트에서 저해상도 3D 모델을 생성한 후 고해상도로 최적화하는 2단계 프로세스로 구성된다.(사진=엔비디아)
매직3D는 텍스트에서 저해상도 3D 모델을 생성한 후 고해상도로 최적화하는 2단계 프로세스로 구성된다.(사진=엔비디아)

이 모델은 또한 프롬프트 기반 편집을 허용한다. 매직3D는 저해상도 3D 모델과 기본 텍스트 프롬프트가 주어지면 텍스트를 변경해 결과 모델을 편집할 수 있다. 또 입체파 그림과 같은 2D 이미지의 스타일을 3D 모델에 적용할 수도 있다.

61.7%의 사용자가 매직3D에서 생성된 모델의 품질이 드림퓨전보다 우수하다고 답했다.(사진=엔비디아)
61.7%의 사용자가 매직3D에서 생성된 모델의 품질이 드림퓨전보다 우수하다고 답했다.(사진=엔비디아)

비교를 위해 동일한 텍스트 프롬프트를 사용하여 구글의 드림퓨전과 매직3D에서 각각 생성한 두 개의 3D 생성 모델을 사용자들에게 보여주고 품질이 우수한 것을 선택하게 했다. 그 결과 총 1191개의 피드백 중 61.7%의 사용자가 매직3D에서 생성된 모델의 품질이 드림퓨전보다 우수하다고 답했다.

엔비디아는 "우리는 매직3D를 통해 3D 생성 기술을 더욱 대중화하고 3D 콘텐츠에서 모든 사람의 창의성을 고취할 수 있기를 바란다"고 말했다.

박찬 위원 cpark@aitimes.com

키워드 관련기사
  • 어도비, 메타버스용 3D 콘텐츠 제작 도구 출시
  • 구글, 3D 데이터 세트 없이 3D 이미지 생성하는 AI 모델 공개
  • 메타버스용 3D 이미지 생성 AI모델도 나왔다...엔비디아, ‘GET3D’ 출시