Python Numpy Tutorial http://cs231n.github.io/python-numpy-tutorial/ Table of contents:PythonBasic data typesContainersListsDictionariesSetsTuplesFunctionsClassesNumpyArraysArray indexingDatatypesArray mathBroadcastingSciPyImage operationsMATLAB filesDistance between pointsMatplotlibPlottingSubplotsImages
최규민: 추천시스템이 word2vec을 만났을때 - PyCon Korea 2015 2015 py con word2vec이 추천시스템을 만났을때 from choi kyumin ...
It's Easy (On Mac):Install easy_install curl https://bootstrap.pypa.io/ez_setup.py -o - | sudo python Install pip sudo easy_install pip Install regex module pip install regex https://www.lucypark.kr/blog/2013/03/21/chunking-korean-one-liner/ 한국어처럼 Unicode가 사용된 경우에는 위 방법을 이용할 수 없다. 대신 한국어 어절을 분리하고 싶을 때는 regex를 쓰면 편하다.2>>> import regex >>> regex.findall(ur'\p{Hangul}+', u'다람쥐 헌 쳇바퀴에 타고파.') [u'\ub2..
문자열 비교 string1 = 'Hello'string2 = 'hello' if string1.lower() == string2.lower(): print "같은 스트링"else: print "다른 스트링"
Python List sort() Method * 오름차순이 .sort(), 내림차순은 .sort(reverse=True) DescriptionThe method sort() sorts objects of list, use compare func if given.SyntaxFollowing is the syntax for sort() method −list.sort([func])ParametersNAReturn ValueThis method does not return any value but reverse the given object from the list.ExampleThe following example shows the usage of sort() method.#!/usr/bin/python ..
단어 임베딩의 원리와 gensim.word2vec 사용법 단어 임베딩(Word Embedding)이란 텍스트를 구성하는 하나의 단어를 수치화하는 방법의 일종이다.텍스트 분석에서 흔히 사용하는 방식은 단어 하나에 인덱스 정수를 할당하는 Bag of Words 방법이다. 이 방법을 사용하면 문서는 단어장에 있는 단어의 갯수와 같은 크기의 벡터가 되고 단어장의 각 단어가 그 문서에 나온 횟수만큼 벡터의 인덱스 위치의 숫자를 증가시킨다.즉 단어장이 "I", "am", "a", "boy", "girl" 다섯개의 단어로 이루어진 경우 각 단어에 다음과 같이 숫자를 할당한다."I": 0 "am": 1 "a": 2 "boy": 3 "girl": 4이 때 "I am a girl" 이라는 문서는 다음과 같이 벡터로 만들 ..