본문 바로가기

말뭉치

모두의 말뭉치 모두의 말뭉치 모두의 말뭉치 미래를 준비하는 소중한 우리말 자원 corpus.korean.go.kr 더보기
인공지능 씨앗 한글 말뭉치, 2007년 멈춰선 까닭 인공지능 씨앗 한글 말뭉치, 2007년 멈춰선 까닭 http://www.bloter.net/archives/260569 자연어 처리는 인공지능 기술에서 중요한 축을 담당한다. 인간의 말을 인식해 메시지를 분석하고 다시 답변을 내놓으려면 자연어를 처리할 수 있는 향상된 기술이 필요하다. 현재 많은 연구들이 인간의 눈을 대체하는 ‘비전 인식’에 몰두하고 있다. 이미지나 영상을 기계가 인식해 사물을 분별하고 나누고 예측하는 다양한 기술들이 선보이고 있다. 인간의 입과 귀를 보완하거나 대신하기 위한 연구도 한창이긴 하다. 애플이 시리나 썸리와 같은 기사 요약 서비스 등이 여기에 해당한다. 번역에서도 자연어 처리는 필수적이다. 하지만 비전 인식에 비해 더딜 수밖에 없다. 문자 언어가 깊숙이 관여돼있기 때문이다. .. 더보기
[python] gensim + word2vec 모델 만들어서 사용하기 gensim + word2vec 모델 만들어서 사용하기 참고 : https://www.lucypark.kr/courses/2015-ba/text-mining.html #Load datafrom konlpy.corpus import kobilldocs_ko = [kobill.open(i).read() for i in kobill.fileids()] #Tokenizefrom konlpy.tag import Twitter; t = Twitter()pos = lambda d: ['/'.join(p) for p in t.pos(d)]texts_ko = [pos(doc) for doc in docs_ko] #Trainfrom gensim.models import word2vecwv_model_ko = word2ve.. 더보기
KoNLPy 에서 테스트 오류 날때. jpype 관련 - 문서탐색하기 테스트중. 문서탐색하기 테스트 중 오류 발생 http://konlpy.org/ko/latest/examples/explore/ Traceback (most recent call last): File "doc_find.py", line 6, in from konlpy.corpus import kolaw File "/anaconda/lib/python3.6/site-packages/konlpy/__init__.py", line 15, in from . import tag File "/anaconda/lib/python3.6/site-packages/konlpy/tag/__init__.py", line 4, in from ._hannanum import Hannanum File "/anaconda/lib/python3... 더보기