반응형
반응형

Pandas .Series 의 item , to_CSV

pandas.Series.items

 

 

s = pd.Series(['A', 'B', 'C'])
>>> for index, value in s.items():
...     print(f"Index : {index}, Value : {value}")
Index : 0, Value : A
Index : 1, Value : B
Index : 2, Value : C

https://github.com/pandas-dev/pandas/blob/v1.4.1/pandas/core/series.py#L1662-L1689

 

GitHub - pandas-dev/pandas: Flexible and powerful data analysis / manipulation library for Python, providing labeled data struct

Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more - GitHub - pandas-dev/...

github.com

 

 

 

 

반응형
반응형

Pandas df.to_csv("file.csv" encode="utf-8") still gives trash characters for minus sign

 

Pandas df.to_csv("file.csv" encode="utf-8") still gives trash characters for minus sign

I've read something about a Python 2 limitation with respect to Pandas' to_csv( ... etc ...). Have I hit it? I'm on Python 2.7.3 This turns out trash characters for ≥ and - when they appear in st...

stackoverflow.com

https://stackoverflow.com/questions/25788037/pandas-df-to-csvfile-csv-encode-utf-8-still-gives-trash-characters-for-min
pandas dataframe을 csv 형태로,  to_csv 


utf-8 encoding으로 저장하면 
내용 중 한글이 깨지는 문제 발생
euc-kr 로 저장할 때는 문제 없음
df.to_csv('file.csv',encoding='euc-kr')


df.to_csv('file.csv',encoding='utf-8')
한글 깨짐


해결책: df.to_csv('file.csv',encoding='utf-8-sig')


windows 환경 (정확히는 win7)
Python 3.6.4 :: Anaconda custom (64-bit)
pandas==0.23.4

 

 

 

 

 

 

 

반응형
반응형

KoNLPy 한국어 처리 패키지

OSS project 한나눔(Hannanum)
한국어 형태소 분석시 + 음차표기

 

 

http://semanticweb.kaist.ac.kr/hannanum/

 

Semantic Web Research Center(Hannanum)

3. 세부 개발 목표 O 기능 개선 - 형태소 분석기의 핵심 기능 중 음운 규칙, 품사 관리 및 사전 관리의 모듈화 - 응용에 맞게 사용할 수 있는 음운 규칙, 품사, 사전을 각각 2가지 이상 제공 예정 -

semanticweb.kaist.ac.kr

 

https://datascienceschool.net/03%20machine%20learning/03.01.02%20KoNLPy%20%ED%95%9C%EA%B5%AD%EC%96%B4%20%EC%B2%98%EB%A6%AC%20%ED%8C%A8%ED%82%A4%EC%A7%80.html

 

KoNLPy 한국어 처리 패키지 — 데이터 사이언스 스쿨

.ipynb .pdf to have style consistency -->

datascienceschool.net

 

형태소 분석

KoNLPy는 다음과 같은 다양한 형태소 분석, 태깅 라이브러리를 파이썬에서 쉽게 사용할 수 있도록 모아놓았다.

반응형
반응형

정규직으로 줄바꿈 제거하기

 

1.Ctrl + H 를 누른 후 (or Find > Replace)에 입력 창에 \n 을 입력한다.
2.“regular expression”을 선택한다. (Alt + R을 누르거나 [.*] 아이콘을 클릭)
3.그리고 Replace All를 누르면 모든 줄 바꿈이 삭제 됩니다.

반응형
반응형


당신의 길에 놓인 장애물 중 하나를 오늘 직시하라.
그 장애물을 부숴도 좋고, 넘어가도 좋고, 돌아갈 방법을 찾아도 좋다.
도망치지만 말라. 그 장애물은 당신을 위해서 세워진 것이니까.
- 로버트 그린, ‘오늘의 법칙’에서


‘바람 불지 않는 인생은 없다.
바람이 불어야 나무는 쓰러지지 않으려고, 더 깊이 뿌리를 내린다.
바람이 나무를 흔드는 이유다.’ (이철환)

모든 사람들이 장애물에 부딪히지만,
성공한 사람들은 장애물을 자신이 선택한 목표를 향해
더 높이 올라가는데 사용하는 디딤돌로 바꾼 사람들입니다.

반응형
반응형

우리 삶에
가장 큰 영향을 미치는 것은
소위 절차적 기억이다. 여기에 우리가
아주 일찍이 무의식적으로 배운 모든 행동 방식이
저장되어 있다. 우리는 머릿속에 이미 저장되어 있는
수많은 기억으로 현재의 사건에 반응한다. 그러면서도
스스로 현재가 아니라 기억에 반응한다는 것을
자각하지 못한다.


- 다미 샤르프의 《당신의 어린 시절이 울고 있다》 중에서 -


* 시간의 흐름에 따라 쌓이는
기억들이 모여 연대기를 이룹니다.
어린 시절, 청년 시절, 어떤 경험을 하느냐.
그 기억들이 무의식의 우물에 그대로 저장되어 있다가
어느 순간 불쑥불쑥 의식의 표면으로 튕겨 나와 오늘의
삶을 지배합니다. 이제는 다 지나간 일, 후회해도
소용없고 깨끗이 잊어도 좋은 절차적 기억들이
오늘의 나를 지배하지 않도록 부지런히
내면의 힘을 키워야 합니다.

반응형

'아침편지' 카테고리의 다른 글

낙관주의자, 비관주의자  (0) 2022.02.16
누군가에 화가 났다면  (0) 2022.02.15
한마디 더 해 볼 걸 그랬다  (0) 2022.02.14
명예로운 이름  (0) 2022.02.11
쿠바의 '영웅', 헤로니모 임  (0) 2022.02.10

+ Recent posts