반응형

[python] 생성된 엑셀을  Frequency 순으로,  동일 Frequency 이면 단어순으로 정렬

import pandas as pd
from collections import Counter
import re

def read_text_file(file_path):
    """텍스트 파일을 읽고 내용을 반환"""
    with open(file_path, 'r', encoding='utf-8') as file:
        return file.read()

def count_word_frequencies(text):
    """주어진 텍스트에서 단어 빈도수 계산"""
    words = re.findall(r'\b\w+\b', text.lower())
    return Counter(words)

def save_frequencies_to_excel(frequencies, output_file):
    """단어 빈도수를 엑셀 파일로 저장"""
    # 판다스 DataFrame으로 변환
    df = pd.DataFrame(list(frequencies.items()), columns=['Word', 'Frequency'])
    # 빈도수 내림차순, 단어 알파벳순 오름차순으로 정렬
    df = df.sort_values(by=['Frequency', 'Word'], ascending=[False, True])
    # 데이터를 엑셀 파일로 저장
    df.to_excel(output_file, index=False)

# 파일 경로
file_path = 'example.txt'
output_excel = 'word_frequencies.xlsx'

# 파일 읽기
text = read_text_file(file_path)

# 빈도수 분석
frequencies = count_word_frequencies(text)

# 엑셀로 저장
save_frequencies_to_excel(frequencies, output_excel)

print("단어 빈도수가 정렬되어 엑셀 파일로 저장되었습니다.")
  1. DataFrame 변환 및 정렬: pandas.DataFrame을 사용하여 빈도수 데이터를 DataFrame으로 변환한 후, sort_values 메소드를 사용하여 먼저 Frequency 열에 대해 내림차순으로, 동일한 빈도를 가진 항목에 대해서는 Word 열을 기준으로 오름차순 정렬합니다. ascending=[False, True] 파라미터는 각각 Frequency와 Word 열에 적용됩니다.
  2. 엑셀 파일 저장: 정렬된 데이터를 .xlsx 형식의 파일로 저장합니다.
반응형
반응형

[python] 엑셀 읽고 쓰기 

 

https://pypi.org/project/openpyxl/

 

openpyxl

A Python library to read/write Excel 2010 xlsx/xlsm files

pypi.org

 

pip install openpyxl

 

반응형
반응형

[엑셀] 틀고정 2개 하기. 

 

[보기] - [틀고정]  

 - 첫 행 고정

 - 첫 열 고정

  : 첫 열이나 첫 행을 고정해서 첫 열이나 행에 내용을 추가해도 된다. 

 

-  틀고정

  : D,E열과 E열 4번과 5번열을 틀고정으로 구분하고 싶으면 바로 밑인 E열5번 셀을 선택하고 틀고정을 눌러주면 된다.  

반응형
반응형

[EXCEL] 지정한 수만큼 지정한 문자를 반복해 주는 REPT 함수

 

* REPT 함수

수치만큼 지정한 문자를 반복 표시해 준다.

형식 : =REPT("반복할문자", "반복할 숫자 또는 셀주소)


 

 

반응형
반응형

엑셀에서 긴 숫자가 지수형태로 나타날때, 숫자만 표시되게 하는 방법

 

11231412E+10 이렇게 나올때. 

 

엑셀에서 해당 셀 선택 후 

1.데이터 - 텍스트 나누기 를 선택함.

2.'너비 일정함'을 선택하고 다음 - 다음

3.'텍스트'를 선택하고 마침. 

반응형
반응형

Alt + 엔터 줄바꿈 제거하기 | 엑셀 함수 공식 

 

 

= SUBSTITUTE (셀, CHAR(10), ",")
'// "," 는 다른 문자로 대체가능. (예: "/", "&", 등)

반응형
반응형

엑셀 한글자동변환 끄기, 한방에 ok!

1.왼쪽 상단 [오피스단추]를 클릭 - 하단의 [Excel 옵션]을 클릭

2. [ 언어 교정]을 클릭 - [자동 고침 옵셥]을 클릭

3.[자동고침]탭에서 [한/영 자동 고침]을 해제하고, [확인]을 클릭하면 끝! 이렇게 하면 엑셀 한글자동변환 끄기 완성!

반응형
반응형

엑셀 하이퍼링크 함수

 

구문

 

HYPERLINK(link_location,friendly_name)

 

HYPERLINK 함수 구문에는 다음과 같은 인수가 사용됩니다.

 

link_location   

 필수 요소입니다. 열려는 문서의 경로 및 파일 이름입니다. link_location은 Excel 워크시트나 통합 문서의 특정 셀이나 이름이 지정된 범위와 같은 문서의 특정 위치 또는 Microsoft Word 문서의 책갈피 등 문서 내의 위치를 참조할 수 있습니다. 경로는 하드 디스크 드라이브에 저장되어 있는 파일에 대한 경로일 수도 있고, 서버상의 UNC(Universal Naming Convention) 경로일 수도 있으며, 인터넷 또는 인트라넷상의 URL(Uniform Resource Locator) 경로일 수도 있습니다.

참고   Excel Online에서는 HYPERLINK 함수를 웹 주소(URL)에만 사용할 수 있습니다. link_location은 따옴표로 묶은 텍스트 문자열 또는 텍스트 문자열 형식의 링크를 포함하는 셀에 대한 참조가 될 수 있습니다.

link_location에 지정된 이동 대상이 존재하지 않거나 제대로 작동하지 않는 경우 해당 셀을 클릭하면 오류가 발생합니다.

 

friendly_name   

 선택 요소입니다. 셀에 표시되는 이동 텍스트 또는 숫자 값입니다. friendly_name은 밑줄이 그어진 파란색으로 표시됩니다. friendly_name을 생략하면 link_location이 이동 텍스트로 셀에 표시됩니다.

friendly_name은 값, 텍스트 문자열, 이름, 이동 텍스트나 값을 포함하는 셀 등이 될 수 있습니다.

friendly_name이 오류값(예: #VALUE!)을 반환하면 셀에 이동 텍스트 대신 오류값이 표시됩니다.

반응형

+ Recent posts