반응형
반응형

Gensim word vector visualization of various word vectors

web.stanford.edu/class/cs224n/materials/Gensim%20word%20vector%20visualization.html

 

Gensim word vector visualization

For looking at word vectors, I'll use Gensim. We also use it in hw1 for word vectors. Gensim isn't really a deep learning package. It's a package for for word and text similarity modeling, which started with (LDA-style) topic models and grew into SVD and n

web.stanford.edu

import numpy as np

# Get the interactive Tools for Matplotlib
%matplotlib notebook
import matplotlib.pyplot as plt
plt.style.use('ggplot')

from sklearn.decomposition import PCA

from gensim.test.utils import datapath, get_tmpfile
from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec
 
glove_file = datapath('/Users/manning/Corpora/GloVe/glove.6B.100d.txt')
word2vec_glove_file = get_tmpfile("glove.6B.100d.word2vec.txt")
glove2word2vec(glove_file, word2vec_glove_file)
model = KeyedVectors.load_word2vec_format(word2vec_glove_file)
model.most_similar('obama')
model.most_similar('banana')
model.most_similar(negative='banana')
result = model.most_similar(positive=['woman', 'king'], negative=['man'])
print("{}: {:.4f}".format(*result[0]))
def analogy(x1, x2, y1):
    result = model.most_similar(positive=[y1, x2], negative=[x1])
    return result[0][0]
Analogy

analogy('japan', 'japanese', 'australia')
analogy('australia', 'beer', 'france')
analogy('obama', 'clinton', 'reagan')
analogy('tall', 'tallest', 'long')
analogy('good', 'fantastic', 'bad')
print(model.doesnt_match("breakfast cereal dinner lunch".split()))
 
def display_pca_scatterplot(model, words=None, sample=0):
    if words == None:
        if sample > 0:
            words = np.random.choice(list(model.vocab.keys()), sample)
        else:
            words = [ word for word in model.vocab ]
        
    word_vectors = np.array([model[w] for w in words])

    twodim = PCA().fit_transform(word_vectors)[:,:2]
    
    plt.figure(figsize=(6,6))
    plt.scatter(twodim[:,0], twodim[:,1], edgecolors='k', c='r')
    for word, (x,y) in zip(words, twodim):
        plt.text(x+0.05, y+0.05, word)
 
display_pca_scatterplot(model, 
                        ['coffee', 'tea', 'beer', 'wine', 'brandy', 'rum', 'champagne', 'water',
                         'spaghetti', 'borscht', 'hamburger', 'pizza', 'falafel', 'sushi', 'meatballs',
                         'dog', 'horse', 'cat', 'monkey', 'parrot', 'koala', 'lizard',
                         'frog', 'toad', 'monkey', 'ape', 'kangaroo', 'wombat', 'wolf',
                         'france', 'germany', 'hungary', 'luxembourg', 'australia', 'fiji', 'china',
                         'homework', 'assignment', 'problem', 'exam', 'test', 'class',
                         'school', 'college', 'university', 'institute'])
display_pca_scatterplot(model, sample=300)
반응형
반응형

Naver sentiment movie corpus

www.lucypark.kr/docs/2015-pyconkr/#1

 

한국어와 NLTK, Gensim의 만남 - PyCon Korea 2015

 

www.lucypark.kr

github.com/e9t/nsmc

 

e9t/nsmc

Naver sentiment movie corpus. Contribute to e9t/nsmc development by creating an account on GitHub.

github.com

 

반응형
반응형

Stanford Pos Tagger를 이용한 POS Tagging

from nltk.tag import StanfordPOSTagger
from nltk.tokenize import word_tokenize

STANFORD_POS_MODEL_PATH = "압축 푼 디렉토리/stanford-postagger-full-2018-02-27/models/english-bidirectional-distsim.tagger"
STANFORD_POS_JAR_PATH = "압축 푼 디렉토리/stanford-postagger-full-2018-02-27/stanford-postagger-3.9.1.jar"

pos_tagger = StanfordPOSTagger(STANFORD_POS_MODEL_PATH, STANFORD_POS_JAR_PATH)

text = """Facebook CEO Mark Zuckerberg acknowledged a range of mistakes on Wednesday, 
including allowing most of its two billion users to have their public profile data scraped by outsiders. 
However, even as he took responsibility, he maintained he was the best person to fix the problems he created."""

tokens = word_tokenize(text)
print(tokens)
print()
print(pos_tagger.tag(tokens))

['Facebook', 'CEO', 'Mark', 'Zuckerberg', 'acknowledged', 'a', 'range', 'of', 'mistakes', 'on', 'Wednesday', ',', 'including', 'allowing', 'most', 'of', 'its', 'two', 'billion', 'users', 'to', 'have', 'their', 'public', 'profile', 'data', 'scraped', 'by', 'outsiders', '.', 'However', ',', 'even', 'as', 'he', 'took', 'responsibility', ',', 'he', 'maintained', 'he', 'was', 'the', 'best', 'person', 'to', 'fix', 'the', 'problems', 'he', 'created', '.']

[('Facebook', 'NNP'), ('CEO', 'NNP'), ('Mark', 'NNP'), ('Zuckerberg', 'NNP'), ('acknowledged', 'VBD'), ('a', 'DT'), ('range', 'NN'), ('of', 'IN'), ('mistakes', 'NNS'), ('on', 'IN'), ('Wednesday', 'NNP'), (',', ','), ('including', 'VBG'), ('allowing', 'VBG'), ('most', 'JJS'), ('of', 'IN'), ('its', 'PRP$'), ('two', 'CD'), ('billion', 'CD'), ('users', 'NNS'), ('to', 'TO'), ('have', 'VB'), ('their', 'PRP$'), ('public', 'JJ'), ('profile', 'NN'), ('data', 'NNS'), ('scraped', 'VBN'), ('by', 'IN'), ('outsiders', 'NNS'), ('.', '.'), ('However', 'RB'), (',', ','), ('even', 'RB'), ('as', 'IN'), ('he', 'PRP'), ('took', 'VBD'), ('responsibility', 'NN'), (',', ','), ('he', 'PRP'), ('maintained', 'VBD'), ('he', 'PRP'), ('was', 'VBD'), ('the', 'DT'), ('best', 'JJS'), ('person', 'NN'), ('to', 'TO'), ('fix', 'VB'), ('the', 'DT'), ('problems', 'NNS'), ('he', 'PRP'), ('created', 'VBD'), ('.', '.')]

noun_and_verbs = []
for token in pos_tagger.tag(tokens):
    if token[1].startswith("V") or token[1].startswith("N"):
        noun_and_verbs.append(token[0])
print(', '.join(noun_and_verbs))

Facebook, CEO, Mark, Zuckerberg, acknowledged, range, mistakes, Wednesday, including, allowing, users, have, profile, data, scraped, outsiders, took, responsibility, maintained, was, person, fix, problems, created

novdov.github.io/nlp/2018/04/05/NLP-POS-Tagging-%ED%92%88%EC%82%AC-%ED%83%9C%EA%B9%85/

 

Stanford Pos Tagger를 이용한 POS Tagging

Stanford Pos Tagger를 이용해 POS tagging 방법을 간단하게 알아봅니다.

novdov.github.io

품사 태깅 약어 정보

www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

 

Penn Treebank P.O.S. Tags

31. VBP Verb, non-3rd person singular present

www.ling.upenn.edu

Number

Tag

Description

1. CC Coordinating conjunction
2. CD Cardinal number
3. DT Determiner
4. EX Existential there
5. FW Foreign word
6. IN Preposition or subordinating conjunction
7. JJ Adjective
8. JJR Adjective, comparative
9. JJS Adjective, superlative
10. LS List item marker
11. MD Modal
12. NN Noun, singular or mass
13. NNS Noun, plural
14. NNP Proper noun, singular
15. NNPS Proper noun, plural
16. PDT Predeterminer
17. POS Possessive ending
18. PRP Personal pronoun
19. PRP$ Possessive pronoun
20. RB Adverb
21. RBR Adverb, comparative
22. RBS Adverb, superlative
23. RP Particle
24. SYM Symbol
25. TO to
26. UH Interjection
27. VB Verb, base form
28. VBD Verb, past tense
29. VBG Verb, gerund or present participle
30. VBN Verb, past participle
31. VBP Verb, non-3rd person singular present
32. VBZ Verb, 3rd person singular present
33. WDT Wh-determiner
34. WP Wh-pronoun
35. WP$ Possessive wh-pronoun
36. WRB Wh-adverb

반응형
반응형

프로젝트 관리자가 코로나19 팬데믹에서 배운 가장 큰 교훈을 꼽으라면 바로 ‘불확실성’일 것이다. 불확실성의 시대에서 프로젝트 관리자가 집중해야 할 새로운 목표는 다음과 같다. 

 

정해진 기간과 예산 내에 프로젝트를 딜리버리하는 것이 프로젝트 관리자의 역할과 책임이지만 이젠 그것만으로는 부족하다. 코로나19 여파로 전례 없는 변화를 겪었기 때문이다. 

전 세계적인 불확실성으로 인해 ‘프로젝트 관리 조직(Project Management Office; PMO)’의 일이 복잡해졌다. 이런 상황은 PMO의 목표에 어떤 영향을 미쳤을까? 팬데믹 이후의 새로운 현실에서 프로젝트 관리자가 성공을 거두려면 다음의 목표에 집중해야 한다. 
 

1. 대응, 탄력성, 회복, 그리고 새로운 현실 인식하기
코로나19 사태 기간 그리고 그 이후에도, 프로젝트 관리자에게 가장 중요할 목 표는 민첩성과 적응력을 유지하는 것이다. 이는 코로나19 사태가 발생한 이래, 전략적 파트너 겸 리더가 되려는 프로젝트 관리자에게 필수적인 목표였다. 

KPMG에 따르면 프로젝트 관리자가 가져야 할 새로운 목표는 대응, 탄력성, 회복, 그리고 새로운 현실을 인식하고 적응하는 것이다.

대응(Reaction):
프로젝트 관리자는 당면 과제를 해결해야 하고 프로젝트 관리와 이해관계자 역할 및 책임을 명확히 해야 한다.

탄력성(Resilience):
프로젝트 관리자는 중단된 이니셔티브를 복구하고 지속가능한 딜리버리 모델을 도입해야 한다.

회복(Recovery):
프로젝트 관리자는 새로운 비즈니스 모델에 맞춰 프로젝트와 포트폴리오를 조정해야 한다.

새로운 현실 인식(Recognize the new reality):
프로젝트 관리자는 장기적인 관점에서 프로젝트를 성공적으로 완료하기 위해 전략적인 옵션과 시나리오를 만들어야 한다. 

2. 가시적이고 분명한 효과가 있는 이니셔티브를 실행할 것
지난해 코로나19 사태가 발발한 이후, 프로젝트와 포트폴리오의 우선순위가 대부분 바뀌었다. ‘프라이스워터하우스쿠퍼스(PwC)’의 최근 보고서에 따르면 전 세계 CEO들은 장기적인 변화를 이끄는 트렌드로 원격근무로의 전환(78%), 자동화(76%), 공급망 안전성, 고객 경험, 기후 변화 등을 꼽았다. 

또한 설문조사에 참여한 CEO의 61%는 앞으로 소속 기업의 비즈니스 모델이 디지털화될 것이라고 답했다. 그리고 이는 팬데믹으로 인해 더욱더 가속화되고 있다. 

만약 코로나19 사태가 가속하고 있는 새로운 과제를 다루지 않은 채, 부가가치가 없고 사소한 또는 고립된 프로젝트를 실행하는 데 시간을 할애한다면 이는 회사 리소스뿐만 아니라 어쩌면 더 가치 있는 기회를 낭비하는 셈이다. 

따라서 PMO의 역할은 수동적이어서는 안 된다. 모든 프로젝트 전문가는 프로젝트에서 전략적 목표로 이어지는 방법을 명확하게 파악해야 한다. 

3. ‘원격인력’이라는 현실에 적응할 것
전체 인력 가운데 약 78%가 원격근무로 전환되면서 채용, 교육, 팀 관리가 전반적으로 더 어려워졌다. 만약 기존 체제와 비즈니스 모델만 고수하려는 프로젝트 관리자라면 이러한 일이 더욱더 어려울 수 있다. 

팬데믹 이후에는 자동화를 늘리고, 공급망 격차를 해소하며, 고객 경험을 향상할 수 있도록 전략적으로 사고하는 프로젝트 관리자를 확보하는 것이 필수적이다. 이렇게 하면 계속해서 변화할 수 있는 기업의 우선순위에 따라 가시적이고 분명한 효과가 있는 프로젝트를 실행할 가능성이 커진다. 

또한 PMO는 원격 프로젝트 관리자를 전략적 파트너로 채용하고 교육하며 멘토링해야 한다. 불확실성의 시대에서 변화를 창출하고 유지할 수 있도록 필수적인 기술과 소프트스킬을 갖춰야 하기 때문이다. 이를 통해 변화가 프로젝트와 포트폴리오에 미치는 영향뿐만 아니라 제한된 예산으로 최대의 가치를 딜리버리하는 방법을 이해하는 유능한 관리자 풀을 확보할 수 있을 것이다.  


4. 변화하는 전략적 목표에 맞춰 조정할 것
PMO의 가치는 이해관계자와 경영진이 프로젝트에서 전략적 목표로 이어지는 방법을 식별할 수 있어야만 인지할 수 있다. 즉 프로젝트가 명확한 방향성이 있어야 하고, 그리고 프로젝트 관리자가 프로젝트 진행 상황을 투명하게 전달해줘야 한다. 그런데 전략적 목표가 뜻하지 않게 갑자기 바뀌면 어떻게 될까? 

PMO는 변화 관리자(Change Manager)의 도움을 받아 변경사항을 식별 및 탐색하고, 새로운 프로세스를 개발하며, 이를 문서화해 적절한 이해관계자들에게 적시에 제공해야 한다. 

이렇게 하면 프로젝트 관리자는 문제가 발생하고 팀이 다른 길로 샐 때 변경된 사항과 이를 해결하기 위해 해야 하는 작업을 효과적으로 전달할 수 있다. 이를 통해 팀은 변화된 목표를 성공적으로 달성하는 데 집중할 수 있고, 이는 성공의 기반을 닦는 데 도움을 준다. 

5. 중요한 사항을 보고할 것
KPI(Key performance indicators)는 프로젝트팀이 전략적 목표를 파악하고 진행 상황을 측정하는 데 중요한 역할을 한다. 사용되는 KPI가 정성적이든 정략적이든 관계없이, PMO는 진행 상황을 프로젝트 스폰서와 이해관계자에게 정기적으로 보고해야 한다. 

코로나19 사태 이후 많은 기업의 KPI가 달라졌을 수 있다. 이를테면 현재는 자동화 및 실행 계획을 중심으로 하는 KPI를 가지고 있을지도 모른다. 고객 경험이 여전히 중요할 수도 있다. 

하지만 많은 것이 불확실해지는 상황에서, 이해관계자와의 신뢰를 위해 프로젝트, 프로그램, 포트폴리오 성과의 가시성을 높이는 일은 더욱더 중요해질 것이고, 앞으로도 계속될 것이다. 

6. 불확실성으로 인한 불안을 완화하기 위해 계속해서 관계를 유지할 것
예전에는 프로젝트를 시작할 때 프로젝트 관리자가 프로젝트 스폰서, 경영진, 이해관계자 그리고 팀과 함께 앉아서 기대하는 KPI 및 프로젝트 인사이트와 관련해 정보를 검토하곤 했다.

팬데믹 이후로 불확실성이 커지면서 프로젝트 관리자는 이해관계자를 더 자주 만나야 하고, 상황 변화에 따라 매개변수를 변경하지 않을 수 없게 됐다. 

만약 처음부터 정보가 모호하다면 프로젝트 관리자가 유용하고 시기적절한 비즈니스 인텔리전스를 수집하기 위해 살펴보아야 할 데이터 유형을 어떻게 결정할 수 있겠는가? 코로나19 사태 이후 중요한 의사결정을 내리는 데 필요한 비즈니스 인텔리전스를 수집하느라 여전히 고군분투하고 있는 기업들도 있다. 

따라서 상황 변화에 따라 일목요연한 정보를 표시해주는 간단한 대시보드를 각 비즈니스 영역에 제공할 수 있도록 적절한 도구를 갖추는 것이 매우 중요하다. 

프로젝트 관리자는 여러 출처에서 관련 데이터를 실시간 캡처한 후 이를 시각적으로 표시하는 도구를 찾고 활용하는 것을 목표로 삼아야 한다. 이를 통해 팀이 쉽고 빠르게 지표에 즉각 액세스할 수 있기 때문이다. 또한 이는 팀과 이해관계자가 영향을 미칠 만한 변화, 프로젝트 진행 방법, 목표 대비 현재 상태 등을 빠르게 파악하는 데도 도움을 준다.  

7. PMO의 성과를 분석할 것
성과를 분석하면 프로젝트팀과 이해관계자가 향후 프로젝트와 관련해 교훈이나 시사점을 얻을 수 있다. 또한 프로젝트 관리자는 수집된 비즈니스 인텔리전스가 PMO의 성과와 어떻게 연결되는지 설명할 수 있어야 한다. 정보 수집 및 분석은 이해관계자의 니즈와 관련해 PMO 활동으로 다시 연결되는 경우에만 실행할 가치가 있다. 

8. 비즈니스 지원을 위해 PMO를 발전시킬 것
PMO와 모든 프로젝트 전문가는 프로세스, 내부 자원, 기술, 문화 등을 지속적으로 검토하면서 이해관계자의 니즈와 전략적 목표가 충족되고 있는지 끊임없이 확인해야 하고 개선해야 한다. 

각 부서는 서로 다른 과제와 목표를 수립하게 될 것이며, 이는 기업의 상위 전략적 목표에 영향을 미칠 것이다. 많은 기업이 알게 된 것처럼, 작년에 효과가 있었던 것이 내년에도 효과가 있으리라고 생각하지 않는 게 중요하다. 프로젝트 관리자는 변화에 보조를 맞추기 위해 계속해서 발전해 나가야 한다.

 

www.ciokorea.com/news/182389

 

넥스트 노멀 시대, 프로젝트 관리자가 집중해야 할 새로운 목표 8가지

프로젝트 관리자가 코로나19 팬데믹에서 배운 가장 큰 교훈을 꼽으라면 바로 ‘불확실성’일 것이다. 불확실성의 시대에서 프로젝트 관리자가 집중해야 할 새로운 목표는 다음과 같다. 정해진

www.ciokorea.com

 

반응형
반응형

팬데믹으로 인해 긴급하게 도입한 솔루션을 3가지 항목으로 구분하는 것부터 시작하라고 권고했다.

1) 유지해도 괜찮은 솔루션

2) 수정해야 하는 솔루션

3) 없애거나 교체해야 하는 솔루션

 

 

www.ciokorea.com/news/181794

 

IT에 드리우는 그림자··· 코로나발(發) ‘기술 부채’

코로나19 사태 동안 누적된 ‘기술 부채(Technical Debt)’가 향후 몇 년간 CIO들을 그림자처럼 따라다닐 전망이다.  ⓒGetty Images가트너 애널리스트에 따르면 가장 적합한 기술 솔루션 구축보다 딜리

www.ciokorea.com

 

반응형
반응형

딥러닝 자연어처리 - RNN에서 BERT까지

 

< 딥러닝 자연어처리 - RNN에서 BERT까지 >
- RNN/LSTM
- Seq2Seq
- 어텐션
- 트랜스포머
- BERT

< 챗봇 개발자 모임 >
- https://www.facebook.com/groups/ChatbotDevKR/

.

반응형

+ Recent posts