반응형

[python] 생성된 엑셀을  Frequency 순으로,  동일 Frequency 이면 단어순으로 정렬

import pandas as pd
from collections import Counter
import re

def read_text_file(file_path):
    """텍스트 파일을 읽고 내용을 반환"""
    with open(file_path, 'r', encoding='utf-8') as file:
        return file.read()

def count_word_frequencies(text):
    """주어진 텍스트에서 단어 빈도수 계산"""
    words = re.findall(r'\b\w+\b', text.lower())
    return Counter(words)

def save_frequencies_to_excel(frequencies, output_file):
    """단어 빈도수를 엑셀 파일로 저장"""
    # 판다스 DataFrame으로 변환
    df = pd.DataFrame(list(frequencies.items()), columns=['Word', 'Frequency'])
    # 빈도수 내림차순, 단어 알파벳순 오름차순으로 정렬
    df = df.sort_values(by=['Frequency', 'Word'], ascending=[False, True])
    # 데이터를 엑셀 파일로 저장
    df.to_excel(output_file, index=False)

# 파일 경로
file_path = 'example.txt'
output_excel = 'word_frequencies.xlsx'

# 파일 읽기
text = read_text_file(file_path)

# 빈도수 분석
frequencies = count_word_frequencies(text)

# 엑셀로 저장
save_frequencies_to_excel(frequencies, output_excel)

print("단어 빈도수가 정렬되어 엑셀 파일로 저장되었습니다.")
  1. DataFrame 변환 및 정렬: pandas.DataFrame을 사용하여 빈도수 데이터를 DataFrame으로 변환한 후, sort_values 메소드를 사용하여 먼저 Frequency 열에 대해 내림차순으로, 동일한 빈도를 가진 항목에 대해서는 Word 열을 기준으로 오름차순 정렬합니다. ascending=[False, True] 파라미터는 각각 Frequency와 Word 열에 적용됩니다.
  2. 엑셀 파일 저장: 정렬된 데이터를 .xlsx 형식의 파일로 저장합니다.
반응형
반응형

나만이 아니다.
시골 아낙들은 하나같이
산과 들에 자기만의 밭을 가지고 있다.
2월 말이나 3월 초에 뜯는 씀바귀와 냉이,
고들빼기를 시작으로 여러 가지 밭을 가지고 있다.
그들은 어디에 어떤 밭이 있는지 잘 알고 있다. 불문율일까?
시골 사내들은 좀처럼 가까운 산이나 들의 나물 밭에는
가지 않는다. 그쪽은 아낙네들에게 주고 그들은 더 멀고,
깊고, 높은 산으로 간다. 그들은 버섯에도 밝다. 어디에
송이밭이 있고, 능이밭이 있는지 안다. 노루궁둥이버섯이
어느 나무에 나는지 안다. 언제 가야 싸리버섯을
만날 수 있는지 안다.


- 최성현의 《무정설법, 자연이 쓴 경전을 읽다》 중에서 -


* 자기 텃밭이 없어도 됩니다.
산과 들이 모두 자기만의 텃밭입니다.
정원을 가꾸지 않아도 됩니다. 산과 들이 정원입니다.
이 원리를 깨친 시골 아낙들은 언제나 넉넉하고 풍요롭습니다.
나물과 버섯을 뜯으면서 시간 가는 줄 모르고 몰입합니다.
몰입하는 그 시간이 다시없는 보람이고 기쁨입니다.
그들에게는 굳이 사원이나 아쉬람에 가서 기도나
명상할 일이 없습니다. 온 자연이 '자기 밭'이고
자기만의 명상터이기 때문입니다.

반응형

'생활의 발견 > 아침편지' 카테고리의 다른 글

영혼이 우리를 설레게 한다  (0) 2024.05.02
역경  (0) 2024.04.30
자기애(自己愛)  (0) 2024.04.29
침묵  (0) 2024.04.29
선물을 주는 기쁨  (0) 2024.04.26
반응형

우리를 설레게
하는 것은 영혼이다.
영혼 없이는 인생의 시험과
고난에 바스러질 가능성이 크다.
우리는 초월적이지 못한 채로 물질주의자들의
가치관에 억눌려 있다. 우리가 우리 스스로를
현실주의를 가장한 비관적 세계관에
고통받도록 내버려두는 것이다.


- 마크 마토우세크의 《인생의 12가지 원칙》 중에서 -


* 영혼은 눈에 보이지 않습니다.
인지조차 하지 못하고 살기가 쉽습니다.
그러나 영혼은 있습니다. 해가 없이 어찌 햇살이 비칠 수
있으며, 바다 없이 어찌 파도가 출렁일 수 있겠습니까.
외부로만 향하던 시선을 내면으로 돌리면, 우리 안에
고귀한 영혼이 있음을 알게 됩니다. 비로소 자아는
육체적 물질적 한계에서 벗어나게 됩니다.
영혼이 우리를 설레게 합니다.

반응형

'생활의 발견 > 아침편지' 카테고리의 다른 글

시골 아낙들의 '자기 밭'  (0) 2024.05.02
역경  (0) 2024.04.30
자기애(自己愛)  (0) 2024.04.29
침묵  (0) 2024.04.29
선물을 주는 기쁨  (0) 2024.04.26

+ Recent posts