크라켄·데이터이쿠 등 소규모 플랫폼부터 AWS까지
무료체험판·유료버전 모델 구축 차이가 큰 단점
국내에 생소한 얼터릭스·래피드마이너 소개

(사진=셔터스톡).
(사진=셔터스톡).

데이터 수집부터 고객관리에 이르기까지 전반적 기업 운용체계에 AI 소프트웨어를 도입하는 추세가 늘고 있다. 이에 글로벌 IT 대기업 외에도 기술력을 보유한 스타트업이 증가하는 상황이다. 빅데이터에 기반해 신속·정확하게 예측하고 비전을 제시하는 머신러닝 솔루션은 최적의 비즈니스 모델 수립에 긍정적인 효과를 불러온다.

다음은 미 IT 업계를 대상으로 컨설팅을 담당하는 IT 비즈니스 엣지가 선정한 올해 가장 많이 쓰이는 머신러닝 플랫폼 열 가지를 나열한 리스트다. 플랫폼별 주요 특징부터 가격, 장단점을 짚었다.

1. 래피드마이너(RapidMiner)

래피드마이너는 데이터처리를 비롯해 머신러닝·딥러닝·텍스트마이닝·예측분석을 지원하는 예측적 데이터 분석(Predictive Data Analytics) 플랫폼이다. 2006년 래피드아이(Rapid-i)라는 스타트업이 개발했으며, 현재 HP, P&G, 비자 등 전 세계 300개 이상의 기업이 사용하고 있다. 2019년 글로벌 시장조사기관 가트너가 ‘우수 머신러닝 솔루션 기업’으로 선정했을 만큼 최고의 자동화·워크플로우 설계를 제공하는 것으로 유명하다.

래피드마이너는 모든 기업에 통용되는 가격보다 기업 요청에 따라 합리적인 가격을 제시한다고 알려져 있다. 무료버전도 사용할 수 있는데, 이때 제공되는 데이터 수는 약 1만개. 클릭 한 번으로 교차 검증을 허용하고, 오버핏을 제거하는 모델 검증 방식이 큰 장점이다. 그러나 초기 설정이 어렵다는 점이 접근을 막는 단점 중 하나. 이 때문인지 국내에서는 사용하는 기업이 드물다.

2. 데이터이쿠 DSS(Dataiku DSS)

프랑스 스타트업 데이터이쿠 DSS는 기업 규모에 맞춰 고급 ML 분석 기능을 제공하는 것을 원칙으로 론칭한 데이터 과학·머신러닝 플랫폼이다. 모든 클라이언트 기업이 디지털 혁신을 이루는 것이 목표이며, CPU·GPU에 대한 교육을 포함해 케라스·텐서플로우를 통한 딥러닝을 지원한다. 사용자는 또 파이썬을 사용해 지정 모델을 설정할 수도 있다.

이 플랫폼을 사용하면 데이터과학자, 애널리스트, 엔지니어가 실시간으로 데이터 솔루션을 구축·제공할 수 있다. 주요 고객기업으로는 AXA보험사가 있다.

최대 14일 무료체험 서비스를 제공하며 이후 기업별 특성에 맞춰 가격이 제시된다. 데이터 시각화 기능 등의 장점도 있지만 소규모 기업이 사용할 때 초기 설치 비용이 많이 든다는 단점도 존재한다.

3. 크라켄(Kraken)

빅스퀴드(Big Squid)사가 개발한 크라켄(Kraken)은 코딩이 필요없는 ML 플랫폼이다. 빅스퀴드는 30일 간 크라켄 사용방법을 배울 수 있는 가이드라인 소나(SONAR)를 제공하기도 한다. 직관적이고 사용하기 편리한 인터페이스가 큰 장점. 또 자동으로 최적의 성능을 발휘하는 알고리즘을 선택하는 동시에 도중에 탐색한 다른 알고리즘을 선택할 수 있는 옵션도 제공된다. 그러나 가동 중 버그가 발생할 수 있다는 큰 단점도 있다.

초보 사용자를 위한 ‘스타터(Starter)’ 가격은 2000달러부터이며, ML 전문가를 위한 ‘프로페셔널’ 단계는 3000달러부터 시작된다. 기업을 위한 ‘엔터프라이즈’ 옵션은 타 플랫폼과 마찬가지로 조정가능하다.

4. 얼터릭스(Alteryx Intelligence Suite)

자동화된 머신러닝을 제공하는 얼터릭스 인텔리전스는 일명 ‘머린이’부터 숙련된 데이터 과학자까지 모두가 사용할 수 있도록 다양한 옵션을 제공한다. 얼터릭스는 자연어처리(NLP)를 포함하는 텍스트 마이닝 기능과 함께 ML 모델을 빠르고 쉽게 만드는 것을 목표로 한다.

가격은 연간 2300달러에 제공되며 정형, 비정형 데이터, 안내 모델링, 시각적 텍스트 분석, OCR·NLP에 대한 액세스를 포함한다.

스타터키트에는 코딩 없이 보조 모델링을 위한 분석 템플릿이 포함돼 있다. 또 회사의 애널리틱스 허브나 얼터릭스 디자이너와 협력해 초보자가 예측 모델을 구축하도록 지원도 해준다. 그러나 일부 사용기업이 인터페이스가 혼란스럽고 지나치게 복잡하며, 다른 데이터 플랫폼과의 통합이 원활하지 않다고 보고했다는 기록이 있다.

5. 매트랩(MatLab)

매스웍스사에서 개발한 공학용 소프트웨어 매트랩은 데이터 분석, 알고리즘 개발, 모델 및 응용 프로그램 생성에 초점을 맞추고 있다. 데스크톱 애플리케이션인 이 플랫폼은 딥러닝, 이미지 처리 및 신호 처리 기술로 작업하는 데이터 과학자와 개발자에게 특히 유용하다. 리눅스, 윈도우즈, 맥 등 운영 체제 전반에 걸쳐 설치가 가능하며, 데이터 시각화 도구를 사용해 데이터를 탐색하고 실행 가능한 통찰력을 얻을 수 있다. 그러나 초보자가 사용하기 쉽지 않고, 매트랩만의 프로그래밍 언어를 이해해야 한다는 단점이 있다.

가격은 표준 영구 라이선스는 2150달러(약 240만원), 연간 라이선스는 860달러(약 96만원) 선이다. 학생 개개인부터 교육기관 용도로 사용할 수 있는 다양한 가격 옵션이 있다.

6. 사스(SAS)

사스는 금융, 의료계, 제조·유통 등 대부분 산업분야에서 수요가 높다. 단일 셀프 인터페이스를 통해 시각적으로 데이터 탐색은 물론 대화형 보고서를 생성하고, 공유까지 자유롭게 이뤄진다. 또 NLP 기능을 사용해 프로젝트 요약 작성도 가능하다. 파이썬, 자바, R 등의 코딩을 지원하며, 프레임워크 간 모델을 이동하는 ONNX(Open Neural Network Exchange)를 지원한다.

30일 무료 체험판을 지원하지만 소규모 기업이 지속적으로 사용하기에 비용이 많이 든다는 것이 단점이다. 또 분석제품 종류가 지나치게(?) 많아 니즈에 맞는 제품을 선택하는 것이 어려울 수도 있다.

7. 마이크로소프트(MS) 애저 머신러닝 스튜디오(Azure ML Studio)

MS 애저 ML 스튜디오는 초보자와 데이터 전문가 모두를 지원한다. 사전 훈련된 모델을 드래그 앤 드롭 디자이너로 초보자도 간편히 사용할 수 있으며, 자동화된 머신러닝을 제공해 규모에 맞는 모델을 구축하는 것이 큰 강점이다. 워크플로우를 관리하기 위한 MLOps 지원도 제공한다. 또 멀티 클라우드 환경 전반에서 쿠버네티스(Kubernetes) 클러스터를 사용해 하이브리드 인프라에서 모델을 교육할 수 있다. 파이토치나 텐서플로우를 포함한 오픈소스 툴과 프레임워크를 지원하는 것도 장점 중 하나다.

그러나 제한된 기능세트를 제공하는 등 무료버전과 유료버전의 차이가 크고, 초보자가 접근하기 복잡하고 가파른 학습 곡선이 문제가 되기도 한다.

8. IBM 왓슨 스튜디오(IBM Watson Studio)

IBM 왓슨 머신러닝은 데이터 과학자와 개발자가 IBM 클라우드에서뿐만 아니라 다른 클라우드 서비스에도 ML을 포함한 AI 모델을 규모에 맞게 배치할 수 있도록 설계됐다. 풍부한 기능 세트를 통해 지속적인 학습이 가능한 모델을 재교육하고, AP 기반 애플리케이션 구축을 위한 API를 자동으로 생성시킨다.

원클릭으로 머신러닝을 구축하고 딥러닝 기반 의사결정에 최적화된 모델을 지원한다. 하이브리드나 멀티클라우드 환경에서 모델 구현이 가능하며, 텐서플로우, 파이토치, 케라스를 비롯해 널리 사용되는 프레임워크를 지원한다. 뿐만 아니라 독자적 NLC(Natural Language Classifier, 자연어분류) 기술로 텍스트를 분석한다.

그러나 MS와 마찬가지로 소규모 기업의 경우 가격이 비싸고, 모델 구축에 시간이 많이 걸린다는 것이 단점이다. 또 일부 사용자로부터 데이터 과학자가 모델을 교육하는 동안 왓슨 통합 환경에서 모델 스택을 커스터마이징하는 데 한계가 있다는 불만이 제기되기도 했다.

9. 구글 클라우드 AI(Google Cloud AI)

구글은 이미 AI와 머신러닝을 활용해 독자적인 머신러닝 인프라를 활용하고 구축하는 것으로 잘 알려져있다. 거대 기업을 대상으로 AI, AutoML, MLOps 플랫폼을 통합하는 것이 주요 특징이다.

인기 오픈소스 딥러닝 프레임워크인 텐서플로우를 만든 구글의 AI 플랫폼은 모든 기술셋이 구축하기 쉽도록 액세스 하는 것을 목표로 한다. 구축 후에는 MLOps를 통해 ML 워크플로우를 간소화하고 확장할 수 있다. 드래그 앤 드롭 기능으로 인터페이스 사용이 편리하며, 텐서플로우를 이용해 사용자 요구에 따라 확장 가능한 ML 모델 구축이 가능하다. 또 AutoML을 사용하면 사용자 경험에 따라 맞춤형 ML 모델을 구축하고 교육할 수 있다.

단 하이브리드 클라우드 모델에 대한 지원이 부족하고, 한 번에 최대 25개 모델까지만 실행할 수 있다는 것이 단점이다.

10. 아마존웹서비스(Amazon Web Service, AWS)

세이지메이커(Sage Maker) 제품군은 AWS 머신러닝 제품 생태계의 핵심이다. 머린이부터 데이터 과학자에 이르기까지 모든 사람이 사용할 수 있으며, 한 번의 클릭 프로세스와 사전 설정을 통해 ML 모델을 쉽게 지정할 수 있도록 지원한다. 또 여러 서버에 걸쳐 대규모 데이터셋을 관리한다. 뿐만 아니라 모델을 시각화하고, 재현하기 위해 원클릭 노트북을 통해 심층 협업을 생성할 수 있다.

그러나 세이지메이커는 수요가 늘어날수록 가격이 빠르게 오른다는 단점이 있다. AWS 사용자는 이 플랫폼을 무료 체험판의 일부로 사용할 수 있지만 유료버전에 비해 제한된 모델을 제시해 ‘학습용’이라는 평가를 받는다. 또 초보자도 사용할 수 있는 플랫폼이라는 자체 평가와 달리 코딩이나 고급 데이터 지식이 기반돼야 사용이 쉽다는 의견도 있다.

AI타임스 박혜섭 기자 phs@aitimes.com

 

[관련기사] 블루욘더 선정, 세계에서 가장 영향력 있는 AI 리더 50인

[관련기사] 코딩 배우자!…빌 게이츠 추천 무료 강좌 프로그램 8

키워드 관련기사
  • 책 읽어주는 클로바 램프, 영어책 실시간 번역해준다
  • 문재인 대통령 "종합 반도체 강국 도약, 강력히 지원하겠다"
  • SK텔레콤 인적분할, AI와 반도체 사업 속도 낸다