반응형
반응형


네이버 비즈니스 플랫폼(NBP)의 클라우드 서비스인 ‘네이버 클라우드 플랫폼‘은 매달 마지막 주 목요일 저녁마다 신규 상품을 추가한다. NBP는 이번에도 네이버 클라우드 플랫폼에 네이버 API 중심의 신규상품 14개가 새롭게 추가됐다고 6월30일 홈페이지를 통해 밝혔다.

공개된 AI API는 ▲클로바 스피치 리코그니션 ▲클로바 스피치 씬티시스 ▲클로바 페이스 리코그니션 등을 포함해 총 6종이다. 이 외에 네이버 지도를 포함한 네이버 서비스 API는 3종, 보안 컴퓨팅 상품 6종이 있다.

신규 AI API 5종

■ 클로바 스피치 레코그니션(Clova Speech Recognition, CSR)
– 사람의 목소리를 텍스트로 바꿔 음성 인식 서비스에 활용할 수 있다. 한국어와 영어, 일어, 중국어(간체)를 지원한다.

■ 클로바 스피치 씬티시스(Clova Speech Synthesis, CSS)
– 음성 합성 API로 입력한 텍스트를 자연스러운 목소리로 재생해준다.

■ 클로바 페이스 레코그니션(Clova Face Recognition, CFR)
– 이미지 속의 얼굴을 감지하고 인식하여 얻은 정보를 제공한다. 네이버가 보유한 이미지 DB를 이용한다.

■ 파파고 SMT
– 대규모 학습 데이터에 기반을 두어 언어 자동 번역 서비스를 제공한다. 네이버 서비스를 통해 번역 품질에 대한 축적된 피드백으로 기술 한계를 보완했다.

■ 파파고 한국어 이름 로마화 (Papago Korean Name Romanizer)
– 현행 로마자 표기법에 맞춰 한글 이름을 로마자로 변환하는 서비스. 영어판 명함 작성, 신용카드 발급, 여권 발급 등에 사용할 수 있는 API이다.

신규 네이버 서비스 API 3종

■ 네이버 지도 API
– 네이버 지도 기능을 활용해 위치 기반 서비스를 만들 수 있도록 돕는다. 실시간 교통상황을 표시하거나 360도 파노라마 뷰를 활용하는 등 필요에 맞는 지도를 만들 수 있다.

■ 캡차 (CAPTCHA)
– 이미지를 보여주고 정답을 맞히게 해 사람과 컴퓨터를 판별하고 어뷰징을 막아준다. 입력 주체가 사람인지 컴퓨터인지 판별하기 위해 스타일이 다른 두 종류의 캡차 이미지를 랜덤으로 제공한다.

■ nShortURL
– 긴 URL을 짧게 줄여 글자수 제한이 있는 SNS나 SMS를 이용할 때 도움을 준다. 최근 유해 정보를 통해 유해 사이트 URL 단축은 차단한다. QR코드 이미지를 무료로 함께 생성할 수 있다.

박원기 NBP 대표는 “네이버의 기술과 서비스 노하우가 반영된 API 상품들은 고객들이 가장 기대하고 있는 상품 중 하나로, 이러한 클라우드 상품을 통해 기업들은 기술 및 장애 대응 등의 지원을 받으며 네이버의 서비스를 한껏 활용할 수 있게 됐다”라며 “앞으로도 AI 및 API 상품 라인업을 지속해서 추가함으로써 클라우드 플랫폼을 통해 내부의 기술과 노하우들을 널리 확산하도록 할 것”이라고 덧붙였다.

반응형
반응형

인공지능 비서 앱 ‘네이버-클로바’ 베타 테스트 시작  


http://www.bloter.net/archives/279357



네이버가 ‘클로바‘를 탑재한 인공지능(AI) 비서 앱 ‘네이버-클로바’의 베타 테스트를 시작한다고 5월12일 밝혔다.


네이버는 AI 비서 서비스에 대한 이용자 접근성 강화를 위해 스마트폰 앱 형태로 출시, 이용자들이 스피커 등의 기기나 OS에 구애받지 않고 누구나 편리하게 활용할 수 있도록 했다. 이번 앱은 네이버와 라인이 공동 개발하고 있는 AI 플랫폼 클로바 기술을 적용해, 지식 정보 검색, 음악 추천, 통·번역, 영어회화, 감성 대화 등이 가능한 인공지능 비서를 표방한다.


‘네이버-클로바’의 가장 큰 강점은 지식 정보 검색이다. “올해 추석 언제야”, “500유로가 얼마야”와 같은 정답형 검색뿐 아니라 “한남동 회식 장소 추천해줘”, “영어 동화 들려줘” 등의 사용자가 원하는 정보도 추천한다.


음악 추천 같은 경우도 “신나는 노래 들려줘”, “80년대 여자 가수 노래 틀어줘” 등의 명령을 내리면, 다양한 조건과 취향에 맞는 음악을 바로 감상할 수 있다. 통역은 물론, 영어회화도 할 수 있다. “중국어(영어·일본어)로 ‘얼마에요’가 뭐야?” 등 외국어 통·번역과 함께 “영어 대화하자”라는 명령으로 영어대화 모드를 실행하고 영어 회화 연습도 할 수 있다.


이 외에도 “노래 불러줘”, “외로워”, “심심해” 등의 다양한 감정에 반응해 대화를 나눌 수 있는 등, 이용자들은 다양한 방식으로 AI 비서 서비스를 경험해볼 수 있다.


네이버는 “이용자들의 사용에 따라 학습하며 성장하는 AI 특성상, 네이버 AI 비서 앱 이용자들은 시간이 지날수록 자신에게 특화된 정보, 콘텐츠를 제공하는 차별화된 AI 비서 서비스 경험을 해 나가게 될 것으로 기대한다”라고 덧붙였다.


네이버는 이번 앱에 다양한 기능을 추가하며 비서의 지능을 높여갈 뿐 아니라, 이미 베타 테스트를 진행하고 있는 대화형 엔진 ‘네이버i’ 를 비롯한 ‘에어스(AiRS)’ 등 다양한 서비스를 통해 각각의 상황에서의 AI 사용성을 점검하며 클로바의 성능을 높여 나갈 계획이다.


안드로이드는 출시됐으며, iOS 버전은 조만간 출시 예정이다.

반응형
반응형
네이버, AI 기반 콘텐츠 큐레이션 서비스 ‘디스코’ 출시
AI 플랫폼 클로바의 추천 엔진을 탑재

네이버가 인공지능(AI) 플랫폼 클로바의 추천 엔진을 탑재한 콘텐츠 큐레이션 서비스 ‘디스코’(DISCO)를 출시했다고 5월31일 밝혔다. ‘콘텐츠’보다는 ‘추천’에 방점이 찍혀 있다. 디스코는 클로바의 고도화에 기여하는 서비스다.

디스코는 네이버의 콘텐츠 추천기술 ‘에어스'(AiRS) 등이 적용된 AI 플랫폼 클로바의 추천 엔진을 활용해 제작된 서비스다. 네이버는 ”갈수록 폭증하는 콘텐츠 환경에서 이용자가 자신의 취향에 맞는 콘텐츠를 서비스에서 발견하게 될 것이라는 의미로 ‘Discovery(발견)’에서 명명했다”라고 설명했다.

이용자는 디스코 앱을 실행하고 관심주제를 설정한 뒤, 해당 주제에 속하는 콘텐츠에 대해 ‘좋아’ 혹은 ‘싫어’ 같은 피드백을 제공한다. 그러면 디스코의 추천 엔진이 이용자 취향을 학습해, 이를 바탕으로 더욱 고도화된 추천 서비스를 제공한다. 이런 식으로 궁극적으로 이용자 취향에 맞는 콘텐츠들을 선별해 제공한다.

기본적으로는 이용자가 올린 콘텐츠 중에서 추천 콘텐츠를 고른다. 때문에 네이버가 제공하는 서비스이지만 브런치나 티스토리 등등 다양한 플랫폼의 글을 볼 수 있다. 이처럼 디스코는 내가 좋아하는 주제에 대한 콘텐츠 추천은 물론, 나와 콘텐츠 취향이 유사한 이용자들도 추천해 새로운 주제와 콘텐츠를 발견하고 함께 즐길 수 있도록 지원한다. 또한 비슷한 취향별로 이용자들이 자동 연계되는 구조를 통해, 생산자 혹은 큐레이터는 비슷한 취향의 이들에게 자신이 작성하고 수집한 정보를 자동으로 전달할 수 있다.

네이버는 “콘텐츠 유통을 위한 별도의 네트워크를 구축해야 했던 콘텐츠 생산자와 큐레이터는, 콘텐츠 작성과 수집에만 집중해도 기존 네트워크 이상 규모의 이용자들에게 자동으로 자신의 콘텐츠를 노출시킬 수 있게 됐다”라고 설명했다. 팔로워가 따로 없어도 자신이 생산한 콘텐츠를 유통시킬 수 있는 방법이 생겼다는 의미다. ‘비슷한 취향의 사람들이 좋아한 글’로 올려주는 방식이기 때문에 특정 분야만 잘 파도 어느 정도 유통이 될 수 있다.

개인 페이지에서는 자신이 ‘좋아’한 콘텐츠와 별도로 저장한 콘텐츠가 자동으로 분류 및 저장돼, 아카이브한 콘텐츠를 파악할 수 있도록 했다.

네이버는 “앞으로도 디스코 이용자들의 사용 행태와 다양한 피드백을 통해 서비스를 더욱 고도화하며, 지금까지와는 차별화되는 개인별 맞춤 콘텐츠 큐레이션 서비스를 선보여 나갈 예정”이라며 “디스코 이용자들의 피드백을 반영한 고도화된 추천 기술을 베타 테스트 진행 중인 인공지능 비서 앱 ‘네이버-클로바’의 사용성 개선에도 반영할 방침”이라고 밝혔다.


반응형
반응형

컴퓨테이셔널 저널리즘  http://www.bloter.net/archives/276095


‘컴퓨테이셔널 저널리즘(Computational Journalism)’은 뉴스 콘텐츠의 생산 과정에도 컴퓨팅을 활용하는 저널리즘의 한 방식을 지칭한다. 컴퓨팅 능력의 향상에 따라 활용할 수 있는 영역이 넓어지면서 등장했다. 아직은 완벽히 정립된 개념은 아니다. 컴퓨테이셔널 저널리즘이 다루는 내용은 아직 완벽하게 언론사들이 활용하고 있다기보다는, 실험적으로 시도되고 있는 측면이 크다. 인간의 수많은 행동이 데이터로 기록되고, 알고리즘의 영향을 받아 행동하는 경향이 증가하는 추세다. 이 때문에 컴퓨테이셔널 저널리즘은 향후 성장가능성이 돋보이는 저널리즘의 한 분야다.


컴퓨테이셔널 저널리즘을 수행하려면 알고리즘에 대한 이해와 대규모 데이터 처리 능력이 필요하다.


알고리즘에 의한 스토리


‘알고리즘에 의한 스토리(story BY algorithm)’는 스포츠, 증권, 부동산 가격, 속보, 날씨 등의 분야에서 알고리즘이 직접 작성하는 뉴스를 말한다. 흔히 ‘로봇 저널리즘’으로 알려져 있다. 로봇 저널리즘은 컴퓨팅 기술에 기초해 소프트웨어를 활용하는 기사 작성법을 일컫는다. 실제 로봇이 펜을 쥐거나 키보드를 타이핑해 기사를 작성하는 건 아니고, 데이터를 바탕으로 소프트웨어가 뉴스를 작성하는 방식이다. 로봇 저널리즘은 캘리포니아대학교 정보컴퓨터과학과 제임스 미한 교수의 ‘테일스핀, 이야기를 쓰는 인터랙티브 프로그램’이라는 논문에서 처음 고안된 개념이다.


“백인식이 선발로 등판한 SK는 이태양이 나선 NC에게 6:8로 패하며 안방에서 승리를 내주었다. 경기의 승패에 결정적인 영향을 미친 키 플레이어는 손시헌이었다. 손시헌은 4회초 SK 고효준을 상대로 3점을 뽑아내어 팀의 승리에 결정적으로 기여했다. SK는 임창민을 끝까지 공략하지 못하며 안방에서 NC에 2점차 승리를 내주었다. 한편 오늘 NC에게 패한 SK는 4연패를 기록하며 수렁에 빠졌다.” – 실제로 로봇이 작성한 기사


국내에서는 서울대학교에서 본격적으로 알고리즘을 활용하는 기사 생산을 연구하고 있다. 로봇 저널리즘의 장점은 단연 ‘효율성’이다. 단순히 기사를 빠르게, 많이 쏟아내는 것을 넘어 속보 처리 등 단순업무에 가까운 뉴스 콘텐츠 제작에 들어가는 인력을 줄여 기자들이 더 좋은 콘텐츠를 만들 수 있게 돕는다.


알고리즘을 통해 발견한 스토리


스탠포드대학 컴퓨테이셔널 저널리즘 랩과 마샬 프로젝트는 미국 내 20개 주에서 교통경찰관이 운행 중인 차량을 무작위로 불러세우는 임의 차량 검문과 관련된 데이터 6천만건을 분석했다. 임의 검문임에도 백인 운전자의 차량을 멈춰세우는 비율보다 다른 인종 운전자의 차량을 멈춰 세우는 비율이 높다는 걸 검증했고, 이는 ‘차량 검문과 운전자 인종의 상관관계’라는 콘텐츠로 만들어졌다.


차량 임의 검문과 운전자의 인종 사이에 상관관계가 있다는 합리적 의심을 먼저 품지 않는다면 6천만건의 데이터는 아무 가치 없는 숫자에 불과했을 것이다. 숫자에 합리적 의심이 더해지면 가치를 지닌 데이터가 된다. ‘알고리즘을 통한 스토리 발견(story THROUGH algorithm)’이다. 흔히 ‘데이터 저널리즘’이라 부르는 영역이다.


보통 기자는 문제의식을 뼈대 삼아 인터뷰, 취재 등을 통해 내용을 보충한다. ‘알고리즘을 통한 스토리 발견’에서는 이 취재과정이 ‘데이터 수집→정제→패턴 발견 및 의미 도출’로 바뀐다. 알고리즘을 통한 스토리 발견은 기존 데이터 저널리즘에서 한발 더 나아간다. 뉴스 아이템을 수집하는 단계에서 기여할 수도 있다. 예컨대 인터넷 트래픽을 분석해 사건의 발견을 탐지할 수도 있다. 전 세계의 인터넷 사용량을 살펴보다가 갑자기 트래픽이 폭증하는 장소를 발견하고, 수없이 올라오는 이미지 등을 분석해 화재나 테러 등이 발생했다는 사실을 감지할 수도 있다. 이렇게 사건을 발견해 거의 실시간으로 언론사가 뉴스를 작성할 수도 있다.


알고리즘에 대한 스토리


알고리즘에 대한 스토리는 소재가 ‘알고리즘’인 뉴스를 말한다. 알고리즘은 일견 기계가 결정한다는 점에서 공평하고 정확할 것 같지만, 결국 알고리즘을 짜는 것도 사람이기 때문에 그 결과가 실수나 편견에서 벗어날 수는 없다.


비영리 탐사보도 매체 <프로퍼블리카>의 보도가 적절한 사례다. 미국 사교육업체 프린스턴리뷰는 지역마다 온라인 SAT(Scholastic Aptitude Test) 개인지도 패키지 가격을 다르게 판매했다. 가격 책정은 알고리즘에 의해 이뤄졌는데, 그러면서 아시아인들이 같은 강의를 훨씬 비싼 돈을 내면서 듣는 결과가 나왔다. <프로퍼블리카> 보도에 따르면 아시아인이 아닌 사람과 비교했을 때 아시아인은 높은 가격을 제시받을 확률이 거의 2배에 이르렀으며, 저소득층 지역 아시아인에게 가장 높은 가격을 부과한 사례도 발견됐다.


최근 이슈가 된 ‘필터 버블’(Filter Bubble)도 마찬가지다. 개인 맞춤 추천 알고리즘이 시야를 ‘거품’에 갇히게 했기 때문이다. 디지털 기술이 일상에 스며들면서 삶의 많은 부분이 알고리즘의 영향을 받는다. 이처럼 ‘알고리즘에 대한 스토리’는 공공의 문제가 될 수 있는 알고리즘을 이해하고 견제하는 것을 목표로 한다.

반응형
반응형

MS, 신경망 번역에 ‘한국어’ 추가…11개 언어 지원

마이크로소프트(MS)가 인공지능(AI) 기반으로 개발한 자사 신경망 기반 번역 서비스에 한국어를 추가했다. 최대 1만자까지 신경망 기술을 이용해 번역한다.


신경망 기반 번역은 단편적인 단어에 대한 직역이 아닌, 문장 전체의 맥락을 파악해 사람이 말하는 것처럼 자연스러운 번역이 특징이다. 구글과 네이버도 최근 신경망 기술을 이용한 번역 서비스인 ‘구글 번역’과 ‘파파고’를 선보였다. 구글 신경망 번역은 7가지 언어, 네이버 파파고는 한영 번역을 최대 200자 이내 번역한다.


MS는 지난해 11월 처음으로 신경망 기반 번역 서비스를 공개했다. 당시 영어, 독일어, 아랍어, 중국어, 일본어를 포함한 10가지 언어를 지원했다. 이번에 한국어가 추가하면서 총 11가지 언어를 번역한다.


신경망 번역 원리

신경망 번역 원리


MS 신경망 기반 번역은 인공지능과 머신러닝 알고리즘을 통해 언어를 학습한다. 총 두 단계에 걸쳐 번역한다. 먼저, 번역 대상이 되는 문장을 인공지능으로 분석해, 해당 문자에 사용된 언어가 어떤 문맥을 가졌는지 파악한다. 그다음 문장에 맞는 단어를 골라 뜻을 배치하고 번역한다. 단순히 해당 문장 안에 단어가 몇 개 들어가 있고, 각 단어의 뜻을 기계적으로 번역해서 보여주는 게 아니라 문장 전체 의미를 파악해서 이에 가장 잘 맞는 뜻을 가진 단어를 골라 번역한다.


예를 들어, ‘개가 매우 행복해 보인다. 그 개는 강아지 6마리를 낳았다’라는 문장을 프랑스인과 미국인이 MS 신경망 번역을 이용해 문장을 번역했다 치자. 미국인에게는 ‘The dog looks very happy. The dog bore 6 puppies’라고, 프랑스인에게는 ‘La chienne a l’air très heureux. La chienne portait 6 chiots’라고 보여준다.


프랑스어에서는 똑같은 단어라도 모든 명사에 남성형과 여성형으로 성이 나뉜다. 이 성별이 무엇이냐에 따라 뒤따라오는 동사 형태가 미묘하게 다르다. 여기서 신경망 분석이 빛을 발한다. 신경망 분석은 ‘그 개는 강아지 6마리를 낳았다’라는 문장의 의미를 해석해 ‘그 개 성별은 암컷이다’라고 추론했다. 불어로 ‘개’는 남성형 명사로 ‘le chine’으로 표현하지만, 이 문장에서는 암컷이라고 생각해 여성 형태의 ‘La chienne’를 쓴다. 흐름을 파악해서 자연스러운 번역을 제공한다.


이날 MS는 언어의 의도(Intent)와 실체(Entity)를 파악하는 자연어 처리 서비스 ‘루이스(LUIS, Language Understanding Intelligent Service)’도 이제 한국어를 지원한다고 밝혔다.


루이스는 챗봇과 앱, 그리고 다양한 서비스와 결합해 사용자의 의도를 파악하고, 이에 맞는 서비스를 제공한다. 예를 들어 ‘파리행 티켓을 예약해줘’라는 문장을 입력하면, 루이스와 결합한 서비스 플랫폼에서 파리행 티켓을 예약할 수 있는 웹사이트를 불러온다.


MS 측은 “이미 IT, 제조, 교통, 물류, 쇼핑, 미디어 등 다양한 분야의 국내 많은 기업이 마이크로소프트 루이스 기반의 AI 챗봇과 앱을 통해 서비스를 준비하고 있다”라며 “파트너와 함께 클라우드 기반의 AI 서비스를 활발히 개발 중으로, 이번 루이스의 한국어 지원을 통해 스마트 스피커, ARS 부가 서비스, 상품 예약 및 조회 등 다양한 한국어 애플리케이션들이 개발될 것으로 기대된다”라고 밝혔다.







.

반응형
반응형
초보자를 위한 RNNs과 LSTM 가이드



이 포스팅은 RNNs(Recurrent Neural Networks), 특히 RNNs의 한 종류인 LSTM(Long Short-Term Memory)을 설명하는 포스팅입니다.

RNNs은 글, 유전자, 손글씨, 음성 신호, 센서가 감지한 데이타, 주가 등 배열(sequence, 또는 시계열 데이터)의 형태를 갖는 데이터에서 패턴을 인식하는 인공 신경망 입니다.

RNNs은 궁극의 인공 신경망 구조라고 주장하는 사람들이 있을 정도로 강력합니다. RNNs은 배열 형태가 아닌 데이터에도 적용할 수 있습니다. 예를 들어 이미지에 작은 이미지 패치(필터)를 순차적으로 적용하면 배열 데이터를 다루듯 RNNs을 적용할 수 있습니다.

RNNs은 배열에 등장했던 패턴을 ‘기억’할 수 있는 능력이 있습니다. 이 부분은 사람의 기억과 기억력에 비유하면 아주 간결하게 설명할 수 있어서 종종 RNNs을 사람의 뇌처럼 취급합니다.






반응형

+ Recent posts