“누구든 AI에 쓸 수 있어야” vs  "위험성 고려한 접근 필요해"
이미지 생성 AI도구 오픈 소스 공개가 논란 불러와

정병일 전문위원
정병일 전문위원

'달리2(DALL-E2)'를 비롯한 이미지 생성 인공지능(AI) 모델이 폭발적 인기를 모으고 있는 가운데  최근 오픈 소스로 공개된 새로운 이미지 생성 모델을 두고 논란이 일고 있다.

'누구나 AI에 접근하고 쓸 수 있게 하자'는 캐치프레이즈로 '민주적(Democratic) AI'를 주창하며 오픈소스로 내놓았지만 이를 악용한 사례가 이어진 때문이다.

논란의 중심에 선 것은 영국의 스타트업 스태빌리티 AI(Stability AI)가 지난 10일 소스코드를 오픈소스로 공개한 이미지 생성 AI 도구 ‘스테이블 디퓨전(Stable Diffusion)’이다.

스테이블 디퓨전은 개발자는 물론이고 일반인도 무료로 자유롭게 사용할 수 있는 모델이다. '누구나 AI에 접근하고 쓸 수 있게 하자'는 민주적(Democratic) AI 가치관을 따랐다.

회사측은 개발자를 대상으로 공개하면서 블로그에 일반인도 사용할 수 있도록 하겠다고 밝혔다. 

개발자들은 마음대로 스테이블 디퓨전의 코드를 복제해 쓸 수 있다. 앞서 언어 AI모델이 오픈 소스로 공개된 적은 있으나 이미지 생성 AI 모델이 대중에게 오픈 소스로 공개된 것은 처음이다. 

[관련 기사] 오픈 소스 언어 모델 ‘블룸(BLOOM)’ 출시…오픈AI와 구글에 도전

그러나 이 오픈 소스  AI모델을 공개한 직후 악용 사례가 나오면서 '민주적 AI'라는 개념에 상처를 내고 있다.  AI의 민주화나 대중화는 큰 위험을 수반한다는 지적이 이어졌다.

이미지 생성 AI도구를 개발해 공개한 스태빌리티AI 홈페이지 사진. 모토가 링컨의 민주주의에 대한 명언을 떠올리게 한다.
이미지 생성 AI도구를 개발해 공개한 스태빌리티AI 홈페이지 사진. 모토가 링컨의 민주주의에 대한 명언을 떠올리게 한다.

이 모델은 공개된 지 보름만에 아트브리더(Artbreeder), 픽셀스.ai(Pixelz.ai), 미드저니(Midjourney) 등 다수의 아트 생성 서비스에 채택됐다.

그런데, 대표적인 음모론 웹사이트인 '4 CHAN'에 이 도구를 이용한 가짜 또는 혐오 사진이 올라오는 부작용도 나타났다.

[관련 기사] AI 이미지 생성기 무료 공개는 위험?...악용 소지 커 논란

스테이블 디퓨전은 명령글을 입력하면 이미지를 생성해 주는 AI 모델이다. 회사측은 기존 이미지 생성 모델보다 속도와 품질을 개선했다고 주장한다. 10GB 용량의 비디오 메모리(VRAM)가 있는 일반 컴퓨터의 GPU에서 512X512 픽셀의 이미지를 몇 초안에 만들어 내기 때문에 개발자는 물론 일반인도 손쉽게 사용할 수 있어 이미지 생성을 민주화하는데 크게 기여할 것이라는 기대도 내놨다.

이와 관련해 블룸버그의 칼럼니스트인 파미 올슨은 25일 워싱턴포스트에 게재한 글에서 "이 도구를 써보니 거의 마술적이고 섬뜩하기 조차 했다"고 전했다.

그러면서 그는 스태빌리티AI의 이런 개방적 접근 방식은 달리2를 만든 오픈AI나 이마겐(Imagen)을 개발한 구글과는 정반대 방향이라고 평했다. 이들 두 이미지 생성 AI모델은 악용 가능성을 우려해 일반인의 접근을 제한하고 코드도 공개하지 않았다. 

올슨은 이어 스태빌리티  AI의 모델은 가짜 이미지를 만들 수 있는 거대한 잠재력을 제공한다고 지적했다. 직접 스테이블 디퓨전을 이용해 영국의 보리스 존슨이 젊은 여인과 어색하게 춤을 추는 사진이나 배우 톰 크루즈가  우크라이나 전장의 폐허를 걷는 사진을 만들어 보니 가짜 티가 나긴 했지만 일부 사진은 진짜로 보일 수도 있을 것 같았다는 것이다.

스테이블 디퓨전을 이용해 만든 그림(사진=스태빌리티AI 블로그)
스테이블 디퓨전을 이용해 만든 그림(사진=스태빌리티AI 블로그)

올슨은 또 '소수의 거대 기술 기업이 AI모델을 통제해선 안되며 많은 사람들이 더 자유롭게 쓸 수 있도록 해야 한다'는 모스타크의 주장을 전했다. 이마드 모스타크(Emad Mostaque) 스태빌리티 AI의 CEO가 자신과의 인터뷰에서 "이런 모델이 일부 팔로 알토(PaloAlto)의 전문가들에 의해 통제돼선 안된다고 믿는다. 대중에 공개돼야 한다"며 입장을 표했다는 내용이다.

거대 기술기업이 통제권을 쥐면 언젠가는 기업의 이해에 따라 이를 행사할 수 밖에 없다는 게 AI 민주화 또는 대중화를 주장하는 전문가들의 시각이다.

올슨은 이런 주장은 고귀한 것이지만 위험도 따른다고 지적한다. AI가 가짜뉴스 캠페인에 이용되거나 신종 인터넷 사기의 도구로 활용되는 등 의도하지 않은 결과를 초래할 수 있고, 이는 많은 사람의 피해로 이어질 수 있다는 우려다.

AI는 오늘날 인프라가 되고 있다. 금융회사의 AI 챗봇 상담사는 점점 더 역할을 넓혀가고 있으며, 성능도 갈수록 좋아지면서 구글의 챗봇 '람다(LaMDA)'는 지각이 있는 존재라는 주장까지 나오는 실정이다.

대출자격심사를 AI에게 맡기는 금융회사가 늘어나고 있고, 경찰은 범죄수사에서 AI의 도움을 받는다. 소셜미디어와 OTT에서 AI는 내가 좋아하는 콘텐츠를 신기할 정도로 정확히 추천한다. 군사 영역에서 AI는 인간 병사를 대체해 나가고 있다. 

나아가 오픈 AI의 언어모델인 GPT3는 이제 영화의 각본을 쓰고 마케팅용 이메일을 작성하는가 하면 비디오게임 개발에도 참여하고 있다. 특히 알파고로 널리 알려진 구글 딥마인드는 올 여름에 알파폴드(Alphafold)로 2억개의 단백질 구조를 예측하는 성과를 내며 의약부문에서 큰 진전을 예고했다 . 

지난 10년간 AI는 이처럼 예상을 뛰어넘는 속도로 발전해 왔다. 지금은 ‘AI 황금시대’라고 불릴 정도의 성과를 내고 있는 시점이다.

스테이블 디퓨전으로 생성한 이미지(사진=스태빌리티AI 블로그)
스테이블 디퓨전으로 생성한 이미지(사진=스태빌리티AI 블로그)

그러나 그만큼 윤리 측면이나 부작용면에서 우려도 높아지고 있다. AI의 민주화 또는 대중화에 부정적인 전문가도 적지 않다. 

뉴욕타임스 테크 칼럼니스트 케빈 루스(Kevin Roose)는 25일 게재한 칼럼에서 AI시스템이 실제 할 수 있는 일이 무엇인지, 어떤 특별한 위험과 기회가 있는지를 가치 중립적으로 판단하는 것이 필요하다고 지적했다.

그는 규제기관과 정부에서 첨단 AI 연구에서 무슨 일이 벌어지고 있는지를 빨리 파악할 것과 막대한 자금을 AI 개발에 퍼붓고 있는 기술 기업들이 무엇을 하고 있는지 좀 더 잘 설명할 것을 제안했다. 

그는 또 언론매체들은 비전문가인 독자들에게 AI의 발전상을 더 잘 설명해야 한다고 요구했다. 머신러닝 성과를 소개하면서 '로봇이 온다!'는 제목을 달거나 AI를 설명하는 기사에 공장 로봇 사진을 쓰는 것은 자전거 기사를 쓰면서 BMW 자동차 사진을 쓰는 거나 마찬가지라는 것이다.

GPT-3 같은 대규모 언어 모델을 영화 터미네이터에 등장하는 '스카이넷'이나 영화 스페이스 오딧세이에 나오는 'HALL 9000'과 같은 슈퍼컴퓨터에 비교하기도 한다. 이같은 언론의 과장이 AI에 대한 불안심리를 부추기는 것은 아닌지 염려된다.

AI타임스 정병일 위원 jbi@aitimes.com

키워드 관련기사
  • AI 전략적 적용 늘었다...가트너 연례설문조사 결과
  • AI 앱으로 스마트폰 배터리 수명 30% 향상
  • [AI 주간 브리핑] AI 황금시대, 새 기술 봇물