본문 바로가기

반응형

Model

[python] Word2Vec 모델 만들기 Word2Vec 모델 만들기 sdc-james.gitbook.io/onebook/5./6.1./6.1.3.-word2vec 6.1.3. Word2Vec 모델 만들기 sdc-james.gitbook.io 다음 예제는 네이버 영화 리뷰를 정리해둔 Naver sentiment movie corpus v1.0(https://github.com/e9t/nsmc) 를 사용하여 Word Embedding Model (Word2Vec)을 빌드하는 것입니다. 일단 다음 명령으로 genism 라이브러리를 설치합니다. NLTK는 자연어 처리를 위해 광범위하게 쓰이는 Python library입니다. (onebook) > pip install lxml (onebook) > pip install utils (onebook) >.. 더보기
[python] gensim.models.Word2Vec.train gensim.models.Word2Vec.train Word2Vec.train(sentences, total_words=None, word_count=0, total_examples=None, queue_factor=2, report_delay=1.0) Update the model’s neural weights from a sequence of sentences (can be a once-only generator stream). For Word2Vec, each sentence must be a list of unicode strings. (Subclasses may accept other examples.)문장의 시퀀스에서 모델의 신경 가중치를 업데이트하십시오 (한 번만 생성기 스트림 일 수 있음).. 더보기
[python] gensim + word2vec 모델 만들어서 사용하기 gensim + word2vec 모델 만들어서 사용하기 참고 : https://www.lucypark.kr/courses/2015-ba/text-mining.html #Load datafrom konlpy.corpus import kobilldocs_ko = [kobill.open(i).read() for i in kobill.fileids()] #Tokenizefrom konlpy.tag import Twitter; t = Twitter()pos = lambda d: ['/'.join(p) for p in t.pos(d)]texts_ko = [pos(doc) for doc in docs_ko] #Trainfrom gensim.models import word2vecwv_model_ko = word2ve.. 더보기

반응형