반응형
반응형

PyMuPDF is a high performance Python library for data extraction, analysis, conversion & manipulation of PDF (and other) documents.

https://pypi.org/project/PyMuPDF/

>> pip install PyMuPDF

 

https://mupdf.com/

 

1.디렉토리 안의 pdf 파일을 읽어들여서 리스트 목록을 출력

2.파일명을 넘기면 파일명_이미지순서.png 파일을 생성. 

import fitz  # PyMuPDF

 
# 파이썬 컴파일 경로가 달라서 현재 폴더의 이미지를 호출하지 못할때 작업디렉토리를 변경한다. 
import os
from pathlib import Path
# src 상위 폴더를 실행폴더로 지정하려고 한다.
###real_path = Path(__file__).parent.parent
real_path = Path(__file__).parent
print(real_path)
#작업 디렉토리 변경
os.chdir(real_path) 

directory_base = str(real_path)+"./ONE/"  # 경로object를 문자열로 변경해서 합친다. 
 


def pdf_to_png(pdf_file, input_pdf_name, output_folder):
    # Open the PDF file
    pdf_document = fitz.open(pdf_file)
    
    for page_number in range(pdf_document.page_count):
        # Get the page
        page = pdf_document[page_number]
        
        # Convert the page to an image
        image = page.get_pixmap()
        
        # Save the image as a PNG file
        image.save(f"{output_folder}/{input_pdf_name}_{page_number + 1}.png", "png")

    # Close the PDF file
    pdf_document.close()

if __name__ == "__main__":
     
    # List all files in the directory
    file_list = [f for f in os.listdir(directory_base) if os.path.isfile(os.path.join(directory_base, f))]

    # Print the list of files
    for file in file_list:
        print(file)
        
        #input_pdf = "./TWO/"+ file_name +".pdf"  # Replace with your PDF file path
        input_pdf      = "./ONE/"+ file  # Replace with your PDF file path
        input_pdf_name = os.path.splitext(file)[0]
        print(input_pdf_name)
        output_folder  = "./ONE/data"  # Replace with your output folder
        
        pdf_to_png(input_pdf, input_pdf_name, output_folder)

 

반응형

'프로그래밍 > Python' 카테고리의 다른 글

[python] pyperclip  (0) 2023.09.18
[Python] kivy  (0) 2023.09.15
[python] PyMuPDF로 코딩 없이 PDF에서 이미지 추출  (0) 2023.09.14
[python] cowsay  (0) 2023.09.14
[PYTHON] Python tkinter 강좌  (0) 2023.08.25
반응형

다리를 움직이지 않고는 좁은 도랑도 건널 수 없다.
소원과 목적이 있으되 노력이 따르지 않으면,
아무리 환경이 좋아도 소용이 없다.
비록 재주가 뛰어나지 못하더라도
꾸준히 노력하는 사람은 반드시 성공을 거두게 된다.
-알랭, 철학자

땀은 배신하지 않습니다. 노력을 이기는 천재는 없습니다.
평범하지만 꾸준히 실행하는 사람이 언젠가는 게으른 천재를 이깁니다.
실력이란 꾸준한 노력의 다른 이름입니다.

 

https://www.youtube.com/watch?v=YhqLfEHERrw 

 

반응형
반응형

당신이 있기에 내가 있다

맘껏 누릴 수 있는
경이로움과 숭고함, 기쁨과
환희는 물론 두려움, 불안, 고통까지
모두가 제주에서의 삶이다. 탄생과 죽음,
빛과 그림자, 이 모든 것들이 분리되어
있지 않고 하나라는 걸 몸과
마음으로 배워 나간다.


- 홍시야의 《나무 마음 나무》 중에서 -


* 바다 안에 파도가 있고
파도 속에 바다가 있습니다.
바다가 곧 파도이고, 파도가 곧 바다입니다.
섬은 섬만이 아니고 바다는 바다만이 아닙니다.
바다가 있음으로 섬이 있고 섬이 있기에
바다라 일컫습니다. 당신이 있기에
내가 있고 내가 있기에 당신이
있습니다.

 

"이것이 삶이던가? 그렇다면 다시 한 번." 
― 프리드리히 니체

반응형

'아침편지' 카테고리의 다른 글

'건강한 감정' 표현  (1) 2023.09.18
가을 바람  (0) 2023.09.16
얼어붙은 바다를 쪼개는 도끼처럼  (0) 2023.09.14
키부츠의 이스라엘 아이들  (0) 2023.09.13
사람 보는 눈이 좋아서  (0) 2023.09.12
반응형

테크늄

[technium]

실체적으로 느낄 수 있는 하드웨어를 넘어서 문화, 예술, 사회 제도, 법과 철학 및 모든 유형의 지적 산물들을 포함하는 세계적이며 대규모로 상호 연결된 기술계를 가리키는 용어. 세계적인 IT 전문지 ''와이어드''의 공동 창간자이자 초대 편집장이었던 케빈 켈리가 기술의 진화론을 부각시킨 책 《기술의 충격》에서 제시한 개념이다. 그는 기술 스스로 원하는 것에 귀를 기울이고 기술의 목소리를 들어야 한다고 주장하며 테크늄은 독립적이고 자율적인 존재로 생물처럼 스스로 진화하고 성장한다고 주장한다.

 

테크늄(technium)이라는 단어를 들어보셨나요? 개인적으로 존경하는 실리콘밸리의 사상가 케빈 켈리는 그의 저서 기술의 충격에서 테크늄이라는 단어를 처음으로 사용했는데요. 케빈 켈리는 시원세균, 세균, 원생생물, 곰팡이, 식물, 동물 등 여섯가지 생물계에 이은 일곱번째 생물계로 테크늄을 꼽았습니다.

 

기술의 충격 - 예스24

테크놀로지를 이해하는 자가 미래를 지배한다!출간 즉시 전 세계 독자들을 들끓게 한 화제의 책이 시대 최고의 기술 칼럼니스트 케빈 켈리가 7년여 만에 발표한 책으로, 기술의 역사, 기원, 욕망

www.yes24.com

 

 

반응형
반응형

[텃밭가꾸기] 2023-08-27일 파종 후 9월 15일 현재 상황

2023-08-27  파종
67번 밭
알타리 무
시금치
치마아욱

2번 밭

백경근대
두메부추 순서


 

반응형
반응형

PyMuPDF로 코딩 없이 PDF에서 이미지 추출

 

https://wikidocs.net/181972

 

PyMuPDF로 코딩 없이 PDF에서 이미지 추출

[PyMuPDF](https://github.com/pymupdf/PyMuPDF)의 fitz를 이용해 PDF 파일에서 이미지를 추출할 수 있다. [명령행 모듈](https://p…

wikidocs.net

# PyMuPDF로 코딩 없이 PDF에서 이미지 추출


# PyMuPDF


# pip install PyMuPDF



import fitz
doc = fitz.open(PDF_FILE_PATH)
for i, page in enumerate(doc):
    img = page.get_pixmap()
    img.save(f"./data/{i}.png")



# Command 로 바로 실행하기 
# python -m fitz extract -images input.pdf
반응형

'프로그래밍 > Python' 카테고리의 다른 글

[Python] kivy  (0) 2023.09.15
[python] PDF to png, import fitz , PyMuPDF  (0) 2023.09.15
[python] cowsay  (0) 2023.09.14
[PYTHON] Python tkinter 강좌  (0) 2023.08.25
[python] chatGPT에게 TicTacToe 만들어달라고 했다.  (0) 2023.08.21

+ Recent posts