[머신러닝 특집] 강남역 3번 자판기가 일주일 뒤 고장납니다
MS 애저 머신러닝
https://www.imaso.co.kr/news/article_view.php?article_idx=20151005114240
모두를 위한 데이터 문화
사티아 나델라(Satya Nadella) 마이크로소프트(MS) 최고경영자(CEO)는 2014년 취임 직후 ‘모두를 위한 데이터 문화’를 강조했다. 기업 내 모든 사용자(DBAs, BI 개발자, 비즈니스 유저, 데이터 분석가, 데이터 사이언티스트, C레벨 등)가 직관이 아닌 데이터로 통찰력을 얻어야 하며 각 역할에 적합한 도구가 제공됐을 때 이런 문화가 정착할 수 있다는 것이 나델라 CEO의 메시지의 핵심이다.
학위를 보유한 박사가 알고리즘에 대한 배경지식을 갖췄기 때문에 분석 모델을 더 잘 설명할 수 있겠지만 항상 더 나은 모델을 만든다고는 할 수 없다. 몇 년 전까지만 해도 데이터 과학 분야는 제반 기술이 성숙하지 않고 기술의 난이도도 높아서 일부 전문가를 제외하고 접근하기 어려운 영역이었던 것을 생각하면 상황이 많이 바뀌었다.
빅데이터의 다음 단계, 예측 분석
시장조사 기관 가트너는 빅데이터 분석 영역을 두 부분으로 나눈다. 전통적인 BI(비즈니스 인텔리전스)와 고급 분석이다. BI 영역에서는 과거에 무슨 일이 있었고 왜 일어났는지를 분석한다. 고급 분석 영역에 속한 예측분석은 급변하는 비즈니스 환경에서 지금 무슨 일이 일어나고 있으며 앞으로는 어떨지를 보여준다.
예측 분석을 위해 사용되는 머신러닝이라는 용어 자체는 새로울 것이 없다. 하지만 클라우드, 빅데이터, IoT(사물 인터넷), 인메모리와 같은 제반 기술의 발전에 힘입어 비즈니스 영역에서의 활용 가치가 활발하게 논의되고 있다.
애저 머신러닝(Azure ML)
MS는 각광받고 있는 예측 분석 솔루션으로서의 머신러닝을 ‘기존 데이터를 학습해 미래의 동작, 결과, 추세를 예측하는 모델을 사용하는 컴퓨팅 시스템’으로 설명한다. 머신러닝은 온라인 쇼핑 사이트에서 보는 제품 추천, 신용카드 사용 시 부정행위 검색 등 생활 밀착형 서비스뿐만 아니라 제조 분야에서의 예방 정비와 의료업계의 개인화 서비스, 도시공학에서 교통량 분산까지 다양한 산업분야에서 위력을 발휘하고 있다.
애저 머신러닝은 이렇게 강력한 예측 모델을 신속하게 만들고 분석 솔루션으로 배포할 수 있도록 지원하는 클라우드 기반의 예측 분석 서비스다. 애저 머신러닝의 가장 큰 특징 세 가지를 살펴보겠다.
1. 익숙한 방법으로 예측 모델 생성
고급 분석 영역에서의 도구는 비싼 상업용 소프트웨어나 복잡한 프로그래밍으로 작성해야 하는 R, 파이썬(Python) 등이다. 또 대용량의 데이터를 이용해 모델을 작성하려면 적합한 스토리지와 컴퓨팅 파워가 필요해서 전문가가 아니면 접근하기 어려운 영역이었다.
애저 머신러닝 서비스는 쉽다. 웹 브라우저로 ML 스튜디오(ML Studio)에 접속한 뒤 단순한 데이터 흐름을 통해 모델을 생성할 수 있다. 이미 구현된 R과 파이썬 패키지를 최소한의 수정만으로 애저 머신러닝 내에 통합하는 기능도 있다. 프로그래밍에 익숙지 않은 사용자도 고급 분석을 경험할 수 있도록 샘플 실험을 제공한다. 모든 데이터 과학자의 기술 수준에 맞춘 개발 환경을 제공하는 것이다.
애저 머신러닝에서 제공하는 라이브러리는 핫메일(Hotmail), 빙(Bing), 엑스박스(Xbox), 스카이프(Skype)와 같이 MS 비즈니스에서 이미 검증된 알고리즘으로 이뤄져 있다. 모델 생성 시 제공되는 알고리즘은 가장 많이 쓰이는 기본값으로 설정됐다. 때문에 상세 설정에 대한 고민 없이 모델을 만들고 테스트할 수 있다.
작성된 모델을 누구든 재사용하도록 공유할 수 있다. 한 명의 데이터 과학자가 실험을 하다가 중단한 경우 다른 사용자에게 실험을 공유할 수 있다. 중단된 시점부터 다른 데이터 과학자가 실험을 이어나갈 수 있다. 또는 진행중인 실험을 복사해 다른 데이터 과학자가 사용할 수도 있다. 모델의 완성도를 높이기 위해 다양한 관점의 방안을 제시하는 과정이다.
2. 훈련된 모델을 몇 분 만에 웹 서비스로 배포
기존의 도구로 모델을 성공적으로 만들었다고 해도 실제 운영에 적용해 비즈니스 가치를 창출하는 건 쉬운 일이 아니다. 그래서 애저 머신러닝은 설계부터 응용을 염두에 두고 개발됐다. 이런 모델을 한 번의 클릭만으로 웹 서비스로 배포할 수 있다. 완성된 모델을 몇 분만에 웹 서비스로 배포해 손쉽게 응용 프로그램에 활용될 수 있으므로 상품화하는 데까지의 시간을 획기적으로 단축한다는 의미다.
배포된 웹 서비스는 요구-응답(Request-Response)과 배치 실행(Batch Execution) 두 가지 형태로 사용 가능하다. 요구-응답 서비스는 레코드를 하나씩 받아서 처리하므로 지연이 적고 대규모로 확장 가능한 인터페이스를 제공한다. 배치 실행 서비스는 비동기 방식으로 대용량 데이터의 레코드를 한 번의 배치로 처리한다. 각각의 장점이 있으므로 비즈니스 목적에 맞게 선택해 사용하면 된다.
웹 서비스는 클라우드 포털로 관리할 수 있다. 예를 들면 웹 서비스를 실행 가능한 두 가지 형태로 테스트할 수 있는 UI를 제공하고 접근을 위한 키를 관리하거나 요구 사항이 바뀌었을 때 솔루션을 업데이트하고 변경 뒤 배포된 웹 서비스를 운영 모드로 전환하는 작업 등을 웹 브라우저에서 수행 가능하다.
3. 만들어진 솔루션을 세계로 확대
다양한 실험을 거쳐 완성한 솔루션은 생태계에서 사용할만한 가치가 있다. 클릭 한 번으로 솔루션을 애저 머신러닝 갤러리에 공유하면 된다. 커뮤니티 멤버의 성공에 기여할 수도 있고 다른 데이터 과학자가 더 나은 솔루션으로 발전하도록 지원할 수도 있다. 완성도가 높고 상업적 가치가 있는 솔루션은 애저 마켓플레이스에 게시해 가격을 책정하면 세계 사용자를 상대로 당장 수익을 낼 수도 있다.
'프로그래밍 > Architect' 카테고리의 다른 글
s2graph - https://github.com/kakao/s2graph (0) | 2015.10.29 |
---|---|
neo4j - http://neo4j.com/developer/get-started/ (0) | 2015.10.29 |
[Chrome] remote - Debugging (0) | 2015.09.22 |
엑셀 하이퍼링크 함수 (0) | 2015.09.01 |
[iPad] iPad CSS Layout with landscape / portrait orientation modes (0) | 2015.08.20 |