반응형

Awesome-Korean-NLP


Github https://github.com/datanada/Awesome-Korean-NLP


참고 : http://konlpy.org/en/v0.4.4/



A curated list of Natural Language Processing (NLP) of

  • NLP of Korean Text
  • NLP information written in Korean.

Feel free to contribute! or blab it here

Maintainer: Jaemin Cho

Index

  1. Tools
  2. Dataset
  3. Blogs / Slides / Researchers
  4. Papers
  5. Lectures
  6. Journals / Conferences / Institutes / Events
  7. Online Communities
  8. How to contribute

1. Tools

(Korean-specific tools are listed ahead of language-agnostic tools.)

1.1. Morpheme/형태소 분석기 + Part of Speech(PoS)/품사 Tagger

  • Hannanum (한나눔) (Java, C) [link]
    • KoNLPy (Python) [link]
  • Kkma (꼬꼬마) (Java) [link] [paper]
    • KoNLPy (Python) [link]
  • Komoran (Java) [link]
    • KoNLPy (Python) [link]
  • Mecab-ko (C++) [link]
    • KoNLPy (Python) [link]
  • Twitter (Scala, Java) [link]
    • KoNLPy (Python) [link]
    • .NET, Node.js, Python, Ruby, Elasitc Search bindings
  • dparser (REST API) [link]
  • UTagger [link]
  • Arirang (Lucence, Java) [link]
  • Rouzeta [link] [slide] [video]
  • seunjeon (Scala, Java) [link]
  • RHINO (라이노) [link]
  • KTS [paper]
  • 깜짝새 [link]

1.2. Named Entity(NE) Tagger / 개체명 인식기

1.3. Spell Checker / 맞춤법 검사기

  • PNU Spell Checker [link]
  • Naver Spell Checker [link]
  • Daum Spell Checker [link]
  • hunspell-ko [link]

1.4. Syntax Parser / 구문 분석기

  • dparser (REST API) [link]
  • NLP HUB (Java) [link]

1.5. Sentimental Analysis / 감정 분석기

1.6. Translator / 번역기

1.7. Packages

1.8. Others / 기타

  • Hangulpy (Python) [link]
    • 자동 조사/접미사 첨부, 자모 분해 및 결합
  • Hangulize (Python) [link]
    • 외래어 한글 변환
  • Hanja (Python) [link]
    • 한자 한글 변환
  • kroman [link]
  • hangul (Perl) [link]
    • Hangul Romanization
  • textrankr (Python) [link] [demo]
    • TextRank 기반 한국어 문서 요약
  • 한국어 Word2Vec [demo] [paper]
    • 한국어 Word2Vec의 analogy test 데모
  • 나쁜 단어 사전 [link]
    • crowdsourced dic about badword in korean

2. Dataset

  • Sejong Corpus [link]
  • KAIST Corpus [link]
  • Yonsei Univ. Corpus
  • Korea Univ. Corpus
  • Ulsan Univ. Corpus [link]
  • Wikipedia Dump [link] [Extractor]
  • NamuWiki Dump [link] [Extractor]
  • Naver News Archive [link]
  • Chosun Archive [link]
  • Naver sentiment movie corpus [link]
  • sci-news-sum-kr-50 [link]

3. Blogs / Slides / Researchers

3.1. Blogs

  • dsindex's blog [link]
  • 엑사젠, "혼자 힘으로 한국어 챗봇 개발하기" [link]
  • Beomsu Kim, "word2vec 관련 이론 정리" [link]
  • CPUU, "Google 자연어 처리 오픈소스 SyntaxNet 공개" (Korean tranlsation of Google blog) [link]
  • theeluwin, "python-crfsuite를 사용해서 한국어 자동 띄어쓰기를 학습해보자" [link]
  • Jaesoo Lim, "한국어 형태소 분석기 동향" [link]

3.2. Slides

  • Lucy Park, "한국어와 NLTK, Gensim의 만남" (PyCon APAC 2015) [link]
  • Jeongkyu Shin, "Building AI Chat bot using Python 3 & TensorFlow" (PyCon APAC 2016) [link]
  • Changki Lee, "RNN & NLP Application" (Kangwon Univ. Machine Learning course) [link]
  • Kyunghoon Kim, "뉴스를 재미있게 만드는 방법; 뉴스잼" (PyCon APAC 2016) [link]
  • Hongjoo Lee, "Python 으로 19대 국회 뽀개기" (PyCon APAC 2016) [link]
  • Kyumin Choi,"word2vec이 추천시스템을 만났을 때" (PyCon APAC 2015) [link]
  • 進藤裕之 (translated by Hongbae Kim), "딥러닝을 이용한 자연어처리의 연구동향" [link]
  • Hongbae Kim, "머신러닝의 자연어 처리기술(I)" [link]
  • Changki Lee, "자연어처리를 위한 기계학습 소개" [link]
  • Taeil Kim, Daeneung Son, "기계 번역 모델 기반 질의 교정 시스템" (Naver DEVIEW 2015) [link]

4. Papers

4.1. Korean

  • 김동준, 이연수, 장정선, 임해창, 고려대학교, (주)엔씨소프트, "한국어 대화 화행 분류를 위한 어휘 자질의 임베딩(2015년 동계학술발표회 논문집)" [paper] link dead

4.2. English

5. Lectures

5.1. Korean Lectures

  • Kangwon Univ. 자연언어처리 [link]
  • 데이터 사이언스 스쿨 [link]
  • SNU Data Mining / Business Analytics [link]

5.2. English Lectures

  • Stanford CS224n: Natural Language Processing [link] [YouTube]
  • Stanford CS224d: Deep Learning for Natural Language Processing [link] [YouTube]
  • NLTK with Python 3 for NLP (by Sentdex) [YouTube]
  • LDA Topic Models [link]

6. Conferences / Institutes / Events

6.1. Conferences

  • 한글 및 한국어 정보처리 학술대회 [link]
  • KIPS (한국정보처리학회) [link]
  • 한국음성학회 학술대회 [link]

6.2. Institutes

  • 언어공학연구회 [link]
    • 한글 및 한국어 정보처리 학술대회 (Since 1989, 매년 개최) [link]
    • 국어 정보 처리 시스템 경진대회 (Since 2010, 매년 개최, 주최: 문화체육관광부 및 국립국어원) [link]
    • 자연언어처리 튜토리얼 (비정기적) [link]
    • 자연어처리 및 정보검색 워크샵 [link]
  • 한국음성학회 [link]

6.3. Events / Contests

  • 국어 정보 처리 시스템 경진 대회 [link]

7. Online Communities

  • Tensorflow KR (Facebook Group) [link]
  • AI Korea (Facebook Group) [link]
  • Bot Group (Facebook Group) [link]
  • 바벨피쉬 (Facebook Group) [link]
  • Reddit Machine Learning Top posts [link]

8. How to contribute

  1. Fork this Repository, by clicking on "fork" icon at the top right corner.

  2. Get the link for the forked repo, by clicking on the green button on your page. something like, "https://github.com/[username]/Awesome-Korean-NLP.git"

  3. On your local machine, "git clone https://github.com/[username]/Awesome-Korean-NLP.git"

  4. "cd Awesome-Korean-NLP"

  5. open "README.md" with your favorite text editor.

  6. Edit.

  7. git commit -a -m "added section 8: emoticons"

  8. git push, and verify on your fork

  9. goto https://github.com/datanada/Awesome-Korean-NLP and create pull request.

  10. "compare across forks" with base: datanada/Awesome.. and head: [username]/Awesome..

[beginners guide]





.........

반응형
반응형

[MAC] 맥북에서 ssh 원격접속 하기- like Putty


윈도우에서는 Putty로 잘 접속했는데, 맥에선 해본적이 없어서. 


기본적으로 터미널이 있다. 

터미널에서 ssh 입력하고 엔터. 하니 설명이 나온다. 


>ssh root@~~ ip~~ -p 포트번호 


이렇게 입력하면 바로 접속. 비밀번호 입력하면 끝. 

이렇게 간단한 것을. 

반응형
반응형

[MAC] 맥북에서 윈도우서버 원격접속 하기 앱. 


Open the Mac App Store to buy and download apps.


https://itunes.apple.com/us/app/microsoft-remote-desktop/id715768417?mt=12






반응형
반응형

이 세상에서 가장 부유하고 지혜롭고 건강한 수퍼 히어로들,

세계적 클래스의 타이탄들도 초능력이 없었다.

대신 그들에게는 뚜렷한 목표가 있었다.

물론 우리에게도 목표가 있다.

다만 결정적인 차이가 하나 있다.

타이탄들이 갖고 있는 목표는 종종 일반 사람들의 눈에는

정말 터무니없거나 실현 불가능한 것처럼 비친다는 것이다.

- 팀 페리스, ‘타이탄의 도구들’에서

 

타이탄들은 말합니다.

“당신이 지금껏 성공하지 못한 사람이라고 느껴진다면,

그건 당신이 상식적이고 합리적인 사람이기 때문이다.”

그들 역시 우리와 같이 빈틈이 있는 사람들입니다.

그들 역시 우리처럼 초능력이 없습니다.

터무니없는 실현 불가능해 보이는 목표가 수퍼 히어로를 만듭니다.



.

반응형
반응형

좋은 아이디어를 떠올리지 못해 힘겨워하는 사람들은

사실 신통찮은 아이디어도 별로 떠올리지 못한다.

반면에 좋은 아이디어가 많은 사람들은,

황당하고 터무니없는 아이디어를 그보다 몇 배는 더 많이 갖고 있다.

황당한 아이디어를 끊임없이 내놓다보면

좋은 아이디어도 몇 개쯤은 반짝 나타나는 법이다.

- 세스 고딘

 

헤지펀드 매니저 제임스 알투처는 말합니다.

“아이디어 10개가 떠오르지 않으면 20개를 생각하면 된다.

우리는 스스로에게 완벽한 아이디어를 꺼내라고

심한 압박을 가한다. 완벽주의는 아이디어 근육의 ‘적’이다.”

바보스럽다고 느껴지는 아이디어라도 많이 내다보면

자연스럽게 보석 같은 아이디어도 탄생합니다.



.

반응형
반응형

산삼의 약효를 

최대한 얻기 위해서는 

먹는 방법에도 신경을 써야 한다. 산삼을 

먹기 전에 목욕을 하라는 이야기도 있는데, 

틀린 말이 아니다. 목욕을 하면 혈액순환이 잘되고, 

산삼의 효과가 온몸에 고루 흡수되기 때문이다. 

혹은 하루 정도 죽만 먹은 후, 산삼을 생으로 

꿀을 찍어 먹은 다음 다음 날도 죽만 

먹는다. 소화, 흡수를 위해서다. 


- 신혜정의《엄마의 약초산행》중에서 -  


* 잘 알다시피

산삼은 매우 귀한 것입니다.

귀한 것은 귀하게 대접해야 합니다.

산삼을 먹기 전에 목욕을 하라는 말은

단지 혈액순환의 차원을 넘어 그만큼 귀하게 

대하라는 뜻입니다. 귀한 만큼 마음의 준비를 하고

먹어야 효과가 극대화됩니다. 내 옆에 있는

사람도 산삼처럼 귀하게 대접하면

나도 귀한 존재가 됩니다.



.



반응형
반응형

세계적인 명연설가였던 

미국의 존 F. 케네디 대통령은 

대중연설이 계획된 전날은 잠자리에 

들기 전 반드시 상상 속에서 연설을 하곤 했다. 

머릿속으로 연단에 올라선 자신의 모습을 떠올리며 

약 10분 동안 연설 내용을 쭉 훑어보는 것이었다. 

청중들이 환호하는 모습, 자신이 취해야 할 

제스처, 미소, 목소리 톤까지 

구체적으로 그렸다. 


- 김상운의《왓칭》중에서 - 


* '명연설'은 

한순간에 탄생하지 않습니다.

오래 준비하고 오래 연습된 연설입니다.

우선 내용이 좋아야 하고, 자세와 표정과 시선과

목소리가 맞아야 합니다. 많은 사람 앞에 서기 전에  

모래밭이나 숲속에서 모래나 나무를 사람이라

생각하고 연습을 반복하다 보면 어느덧

'명연설' 하나가 탄생합니다.




.


반응형

'생활의 발견 > 아침편지' 카테고리의 다른 글

'예술의 어머니'  (0) 2017.06.08
산삼을 대하는 태도  (0) 2017.06.07
목련 한 그루, 그리고 정원사  (0) 2017.06.07
삶은 늘 공사 중입니다  (0) 2017.06.07
딱 한 사람만 있어도  (0) 2017.06.02
반응형

목련 한 그루를 

심었습니다. 불행하게도 

그 나무는 몇 달 지나지 않아 죽었습니다. 

옮겨 심어진 첫해는 나무에게 대단히 위험한 

해입니다. 토양과 빛, 습도 같은 조건이 본래의 

환경 조건과 다르기 때문입니다. 그래서 나무에게

옮겨진 첫해는 새로운 환경과 밀착하고 

결합하는 일이 가장 중요한 해입니다. 


- 김용규의《당신이 숲으로 와준다면》중에서 -


* 제 경험으로도

나무 한 그루 옮겨 심기가 쉽지 않습니다.

목련, 소나무가 특히 더 어렵습니다. 더 많은 사랑과 

정성과 시간을 쏟아부어야 합니다. 사람 하나 키우기는 

더 말할 나위도 없습니다. 참으로 어렵습니다. 

새로운 환경, 새로운 경험에 도전할 때마다 

뿌리를 잘 내릴 수 있도록 도와주는

좋은 정원사가 필요합니다.



.

반응형

'생활의 발견 > 아침편지' 카테고리의 다른 글

산삼을 대하는 태도  (0) 2017.06.07
케네디의 명연설은 어떻게 탄생했나  (0) 2017.06.07
삶은 늘 공사 중입니다  (0) 2017.06.07
딱 한 사람만 있어도  (0) 2017.06.02
'똥차 가고 벤츠 온다'  (0) 2017.06.01

+ Recent posts