반응형
반응형

OTSAW Robotics O-R3. World's first ground-aerial outdoor security robot

 로봇자율주행, 무인감시

두바이 거리 순찰, 자율주행차가 맡는다


반응형
반응형


네이버 비즈니스 플랫폼(NBP)의 클라우드 서비스인 ‘네이버 클라우드 플랫폼‘은 매달 마지막 주 목요일 저녁마다 신규 상품을 추가한다. NBP는 이번에도 네이버 클라우드 플랫폼에 네이버 API 중심의 신규상품 14개가 새롭게 추가됐다고 6월30일 홈페이지를 통해 밝혔다.

공개된 AI API는 ▲클로바 스피치 리코그니션 ▲클로바 스피치 씬티시스 ▲클로바 페이스 리코그니션 등을 포함해 총 6종이다. 이 외에 네이버 지도를 포함한 네이버 서비스 API는 3종, 보안 컴퓨팅 상품 6종이 있다.

신규 AI API 5종

■ 클로바 스피치 레코그니션(Clova Speech Recognition, CSR)
– 사람의 목소리를 텍스트로 바꿔 음성 인식 서비스에 활용할 수 있다. 한국어와 영어, 일어, 중국어(간체)를 지원한다.

■ 클로바 스피치 씬티시스(Clova Speech Synthesis, CSS)
– 음성 합성 API로 입력한 텍스트를 자연스러운 목소리로 재생해준다.

■ 클로바 페이스 레코그니션(Clova Face Recognition, CFR)
– 이미지 속의 얼굴을 감지하고 인식하여 얻은 정보를 제공한다. 네이버가 보유한 이미지 DB를 이용한다.

■ 파파고 SMT
– 대규모 학습 데이터에 기반을 두어 언어 자동 번역 서비스를 제공한다. 네이버 서비스를 통해 번역 품질에 대한 축적된 피드백으로 기술 한계를 보완했다.

■ 파파고 한국어 이름 로마화 (Papago Korean Name Romanizer)
– 현행 로마자 표기법에 맞춰 한글 이름을 로마자로 변환하는 서비스. 영어판 명함 작성, 신용카드 발급, 여권 발급 등에 사용할 수 있는 API이다.

신규 네이버 서비스 API 3종

■ 네이버 지도 API
– 네이버 지도 기능을 활용해 위치 기반 서비스를 만들 수 있도록 돕는다. 실시간 교통상황을 표시하거나 360도 파노라마 뷰를 활용하는 등 필요에 맞는 지도를 만들 수 있다.

■ 캡차 (CAPTCHA)
– 이미지를 보여주고 정답을 맞히게 해 사람과 컴퓨터를 판별하고 어뷰징을 막아준다. 입력 주체가 사람인지 컴퓨터인지 판별하기 위해 스타일이 다른 두 종류의 캡차 이미지를 랜덤으로 제공한다.

■ nShortURL
– 긴 URL을 짧게 줄여 글자수 제한이 있는 SNS나 SMS를 이용할 때 도움을 준다. 최근 유해 정보를 통해 유해 사이트 URL 단축은 차단한다. QR코드 이미지를 무료로 함께 생성할 수 있다.

박원기 NBP 대표는 “네이버의 기술과 서비스 노하우가 반영된 API 상품들은 고객들이 가장 기대하고 있는 상품 중 하나로, 이러한 클라우드 상품을 통해 기업들은 기술 및 장애 대응 등의 지원을 받으며 네이버의 서비스를 한껏 활용할 수 있게 됐다”라며 “앞으로도 AI 및 API 상품 라인업을 지속해서 추가함으로써 클라우드 플랫폼을 통해 내부의 기술과 노하우들을 널리 확산하도록 할 것”이라고 덧붙였다.

반응형
반응형

구주이배


구하는게 뭐지?

주어진게 뭐지?

이것을 어떻게 이용하지?

배운게 뭐가 있지?



...

반응형
반응형

비슷한 말로 '말초적'

반응형
반응형

gensim + word2vec 모델 만들어서 사용하기 



참고 : https://www.lucypark.kr/courses/2015-ba/text-mining.html



#Load data

from konlpy.corpus import kobill

docs_ko = [kobill.open(i).read() for i in kobill.fileids()]


#Tokenize

from konlpy.tag import Twitter; t = Twitter()

pos = lambda d: ['/'.join(p) for p in t.pos(d)]

texts_ko = [pos(doc) for doc in docs_ko]


#Train

from gensim.models import word2vec

wv_model_ko = word2vec.Word2Vec(texts_ko)

wv_model_ko.init_sims(replace=True)

wv_model_ko.save('ko_word2vec.model')    #model create


#Test - 유사도 분석

wv_model_ko.most_similar(pos('정부'))

wv_model_ko.most_similar(pos('초등학교'))





  * 저장된 model 사용하기 : https://radimrehurek.com/gensim/models/word2vec.html


Initialize a model with e.g.:

>>> model = Word2Vec(sentences, size=100, window=5, min_count=5, workers=4)

Persist a model to disk with:

>>> model.save(fname)
>>> model = Word2Vec.load(fname)  # you can continue training with the loaded model!

The word vectors are stored in a KeyedVectors instance in model.wv. This separates the read-only word vector lookup operations in KeyedVectors from the training code in Word2Vec.

>>> model.wv['computer']  # numpy vector of a word
array([-0.00449447, -0.00310097,  0.02421786, ...], dtype=float32)


model 이 잘 불러와졌는지 확인하려면 model의 내용을 보자. 

model.vocab 하며 내용을 볼 수 있다. 

most_similar 에서 vocaburary에 단어가 없다고 에러나오면 내용을 확인 후 다시 검색해보면 된다. 

저장된 vocab이 '국어' 인지, '국어/Noun' 인지 확인 바람요! 


>>>len(model.vocab)

9867

>>>model.vocab 



Code for the word2vec HTTP server running at https://rare-technologies.com/word2vec-tutorial/#bonus_app



*** 대화 형 word2vec 데모 용 전체 HTTP 서버 코드 : 

     https://github.com/RaRe-Technologies/w2v_server_googlenews



모델 저장 및로드

표준 gensim 메소드를 사용하여 모델을 저장 /로드 할 수 있습니다.

1
2
model.save('/tmp/mymodel')
new_model = gensim.models.Word2Vec.load('/tmp/mymodel')

내부적으로 피클을 사용하는 선택적 mmap를 프로세스 간 메모리 공유 디스크 파일에서 직접 가상 메모리에 모델의 내부 큰 NumPy와 행렬을 보내고 '.

또한 텍스트 및 이진 형식을 사용하여 원본 C 도구로 만든 모델을로드 할 수 있습니다.

1
2
model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False)
# using gzipped/bz2 input works too, no need to unzip:
model = Word2Vec.load_word2vec_format('/tmp/vectors.bin.gz', binary=True)

온라인 교육 / 훈련 재개

고급 사용자는 모델을로드하고 더 많은 문장으로 계속 교육 할 수 있습니다.

1
2
model = gensim.models.Word2Vec.load('/tmp/mymodel')
model.train(more_sentences)

시뮬레이트 할 학습 속도 감소에 따라 total_words 매개 변수를 train ()에 맞게 조정해야 할 수도 있습니다 .

C 도구 load_word2vec_format ()에 의해 생성 된 모델로는 교육을 재개 할 수 없습니다 당신은 여전히 ​​그것들을 질의 / 유사성을 위해 사용할 수 있지만, 훈련에 필수적인 정보 (보캐 트리)가 거기에 없습니다.

모델 사용

Word2vec는 여러 단어 유사 작업을 즉시 지원합니다.

1
2
4
5
6
model.most_similar(positive=['woman', 'king'], negative=['man'], topn=1)
[('queen', 0.50882536)]
model.doesnt_match("breakfast cereal dinner lunch";.split())
'cereal'
model.similarity('woman', 'man')
0.73723527

응용 프로그램에서 원시 출력 벡터가 필요한 경우에는 단어 단위로 이들에 액세스 할 수 있습니다

1
2
model['computer'# raw NumPy vector of a word
array([-0.00449447, -0.003100970.02421786, ...], dtype=float32)

... 또는 en-masse를 model.syn0 의 2D NumPy 행렬로 사용 하십시오 .



...

반응형
반응형

Flask 설치 - http://flask-docs-kr.readthedocs.io/ko/latest/installation.html


소개 : https://code.tutsplus.com/ko/tutorials/an-introduction-to-pythons-flask-framework--net-28822



플라스크는 작고 강력한 파이썬의 웹 프레임워크 입니다. 플라스크는 배우기 쉽고, 짧은 시간에 웹앱을 만들수 있습니다.


Flask의 세계에 오신것을 환영합니다.

Flask: web development, one drop at a time

Flask 문서에 오신것을 환영합니다. 이 문서는 다양한 파트로 나누어져 있습니다. 저자는 설치하기 와 빠르게 시작하기 를 먼저 보실것을 추천합니다. 빠르게 시작하기 뿐만아니라, 어떻게 Flask 어플리케이션을 만들 수 있는지 좀 더 상세하게 다루는 튜토리얼 또한 볼 수 있습니다.

만약 여러분이 오히려 Flask의 내부로 직접 뛰어 들고 싶은 경우라면,
API 문서를 확인하십시오. 일반적으로 사용되는 패턴들은

Flask를 위한 패턴들 섹션을 확인하면 됩니다..

Flask는 두개의 외부 라이브러리에 의존합니다.: 바로 Jinja2 템플릿엔진과 Werkzeug WSGI 툴킷입니다. 이 라이브러리들은 이 문서에서 다루지않습니다. 만약 여러분이 이 라이브러리들에 대해서 깊이 알고 싶다면 다음의 링크를 확인하십시오.


반응형

+ Recent posts