반응형

pyttsx3

*** https://medium.com/analytics-vidhya/easy-way-to-build-an-audiobook-using-python-20fc7d6fb1af

 

Easy Way To Build An Audiobook Using Python

An audiobook is nothing but a book that was recorded in an audio format. It can also be stated as a book that is being read aloud…

medium.com

 

pip install gTTS  https://pypi.org/project/gTTS/

 

https://pypi.org/project/pyttsx3/

 

pyttsx3

Text to Speech (TTS) library for Python 2 and 3. Works without internet connection or delay. Supports multiple TTS engines, including Sapi5, nsss, and espeak.

pypi.org

Text to Speech (TTS) library for Python 2 and 3. Works without internet connection or delay. Supports multiple TTS engines, including Sapi5, nsss, and espeak.

 

pip install pyttsx3

Project description

pyttsx3 is a text-to-speech conversion library in Python. Unlike alternative libraries, it works offline, and is compatible with both Python 2 and 3.

Installation

pip install pyttsx3

If you recieve errors such as No module named win32com.client, No module named win32, or No module named win32api, you will need to additionally install pypiwin32.

Usage :

import pyttsx3
engine = pyttsx3.init()
engine.say("I will speak this text")
engine.runAndWait()

Changing Voice , Rate and Volume :

import pyttsx3
engine = pyttsx3.init() # object creation

""" RATE"""
rate = engine.getProperty('rate')   # getting details of current speaking rate
print (rate)                        #printing current voice rate
engine.setProperty('rate', 125)     # setting up new voice rate


"""VOLUME"""
volume = engine.getProperty('volume')   #getting to know current volume level (min=0 and max=1)
print (volume)                          #printing current volume level
engine.setProperty('volume',1.0)    # setting up volume level  between 0 and 1

"""VOICE"""
voices = engine.getProperty('voices')       #getting details of current voice
#engine.setProperty('voice', voices[0].id)  #changing index, changes voices. o for male
engine.setProperty('voice', voices[1].id)   #changing index, changes voices. 1 for female

engine.say("Hello World!")
engine.say('My current speaking rate is ' + str(rate))
engine.runAndWait()
engine.stop()

"""Saving Voice to a file"""
# On linux make sure that 'espeak' and 'ffmpeg' are installed
engine.save_to_file('Hello World', 'test.mp3')
engine.runAndWait()

Full documentation of the Library

https://pyttsx3.readthedocs.io/en/latest/

Included TTS engines:

  • sapi5
  • nsss
  • espeak

Feel free to wrap another text-to-speech engine for use with pyttsx3.

반응형
반응형

‘굶주린 짐승’처럼 물·전기 퍼먹는 이것, 전세계 골머리

https://www.chosun.com/economy/tech_it/2024/03/07/Z7WTVPHCAVAMPA5NHMROJG2QPU/

 

‘굶주린 짐승’처럼 물·전기 퍼먹는 이것, 전세계 골머리

굶주린 짐승처럼 물·전기 퍼먹는 이것, 전세계 골머리 비즈 톡

www.chosun.com

인공지능(AI) 시대 필수 인프라로 꼽히는 데이터센터가 ‘굶주린 짐승’처럼 전기와 물을 먹어치우면서 각국 정부와 기업들이 골머리를 앓고 있습니다. 데이터센터에서 물과 전기 사용량을 줄이기 위해 당국이 규제 강도를 높이자 기업들은 기술 개발에 나서는 등 대책 마련에 분주합니다.

네이버 데이터센터 내 '서버룸'. 수많은 서버를 보관하는 공간 (네이버 제공) /뉴스1

최근 생성형 AI 열풍이 불면서 AI 학습과 서비스에 필요한 데이터센터가 세계 곳곳에서 건설되고 있습니다. 현재 8000개에 달하는 데이터센터가 운영 중입니다. 문제는 데이터센터에서 발생하는 열을 식히기 위해 엄청난 양의 물이 필요하다는 겁니다. 2022년 데이터센터 유지를 위해 마이크로소프트(MS)는 물 사용량을 전년보다 34%, 구글은 22% 늘렸습니다. 2027년에는 세계 데이터센터 물 소비량이 영국의 한 해 물 소비량의 절반에 해당할 것이란 전망도 나왔습니다. 특히 AI 데이터센터는 일반 데이터센터보다 배 이상 전력을 소모하기 때문에 국가 전력망에도 큰 부담을 줍니다.

칠레 환경 법원은 구글의 데이터센터 건설 허가를 일부 취소하며, 구글에 서버 냉각 시스템 변경을 요청했습니다. 아일랜드 더블린 시 당국은 지난해 신규 데이터센터 건설 프로젝트를 거부했고, 미국 버지니아주와 독일은 최근 주거 지역 인근에 데이터센터 허가를 제한하고 재생 에너지 사용과 폐열 재사용을 요구하고 있습니다. 극심한 가뭄을 겪고 있는 우루과이에서는 구글의 신규 데이터센터 건설을 두고 주민들이 거세게 반발하고 있습니다. 기업들은 전력 효율을 높일 시스템을 도입하고 물을 재사용하는 방식으로 대처하고 있습니다. 24시간 운영 가능한 소형 모듈 원자로(SMR)까지 대안으로 거론되고 있습니다.

산업통상자원부에 따르면 국내 데이터센터 전력 수요는 2022년 1762MW(메가와트)에서 2029년 4만9397MW로 폭증할 전망입니다. 한국도 몇 년 내에 데이터센터발 물 부족과 전력망 문제를 겪게 될 수도 있다는 뜻입니다. 각국의 사례를 반면교사 삼아 미리 대비해야 데이터센터가 한국의 AI 경쟁력을 발목 잡는 일을 막을 수 있을 것 같습니다.

반응형
반응형

https://pandas.pydata.org/pandas-docs/stable/index.html

 

pandas documentation — pandas 2.2.1 documentation

API reference The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key concepts.

pandas.pydata.org

 

Community tutorials — pandas 2.2.1 documentation

 

pandas.pydata.org

 

반응형
반응형

[python] PyMuPDF 에서 해상도 올리기. PDF to IMG

How to Increase Image Resolution

 

https://pymupdf.readthedocs.io/en/latest/recipes-images.html

 

Images - PyMuPDF 1.23.25 documentation

Previous Text

pymupdf.readthedocs.io

The image of a document page is represented by a Pixmap, and the simplest way to create a pixmap is via method Page.get_pixmap().

This method has many options to influence the result. The most important among them is the Matrix, which lets you zoom, rotate, distort or mirror the outcome.

Page.get_pixmap() by default will use the Identity matrix, which does nothing.

In the following, we apply a zoom factor of 2 to each dimension, which will generate an image with a four times better resolution for us (and also about 4 times the size):

zoom_x = 2.0  # horizontal zoom
zoom_y = 2.0  # vertical zoom
mat = fitz.Matrix(zoom_x, zoom_y)  # zoom factor 2 in each dimension
pix = page.get_pixmap(matrix=mat)  # use 'mat' instead of the identity matrix

dpi = 600
pix = page.get_pixmap(dpi)

Since version 1.19.2 there is a more direct way to set the resolution: Parameter "dpi" (dots per inch) can be used in place of "matrix". To create a 300 dpi image of a page specify pix = page.get_pixmap(dpi=300). Apart from notation brevity, this approach has the additional advantage that the dpi value is saved with the image file – which does not happen automatically when using the Matrix notation.

 
반응형
반응형

vscode-pdf

 

Display pdf file in VSCode.

 
반응형
반응형

모바일 웹에서 뒤로가기 버튼 선택시 history.pushstate 사용해서 뒤로가기 이벤트 확인하기

 

모바일 웹에서 뒤로가기 버튼을 처리하려면 JavaScript를 사용하여 history.pushState를 활용할 수 있습니다. popstate 이벤트를 사용하여 뒤로가기 버튼의 클릭을 감지할 수 있습니다. 아래는 간단한 예제 코드입니다.

 

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>뒤로가기 이벤트 확인</title>
</head>
<body>
    <h1>뒤로가기 이벤트 확인</h1>

    <script>
        // 현재 상태 저장
        history.pushState({ page: 1 }, "Title 1", "?page=1");

        // 뒤로가기 이벤트 처리
        window.addEventListener('popstate', function(event) {
            // event.state에는 현재 상태의 데이터가 들어있습니다.
            if (event.state) {
                alert('뒤로가기 버튼이 눌렸습니다. 페이지 상태: ' + JSON.stringify(event.state));
            } else {
                // 더 이상 뒤로 갈 수 없을 때, 예를 들어 초기 페이지에서 뒤로가기 버튼을 눌렀을 때 처리할 내용을 여기에 추가할 수 있습니다.
                alert('뒤로 갈 수 없습니다.');
            }
        });

        // 새로운 상태 추가 및 주소 변경
        function changeState() {
            const newState = { page: 2 };
            history.pushState(newState, "Title 2", "?page=2");
        }
    </script>

    <!-- 버튼을 클릭하여 상태를 변경하고 뒤로가기 이벤트를 확인할 수 있습니다. -->
    <button onclick="changeState()">새로운 상태로 이동</button>
</body>
</html>
반응형
반응형

 

네이버 하이퍼클로바X 멀티모달로 진화…“AI 경쟁 핵 경쟁 닮아”

https://www.mk.co.kr/news/it/10955226

AI 프런티어 (3회)
클로바X 이끄는 네이버 클라우드
성낙호 하이퍼스케일AI 기술 총괄
사진 확대
성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄 [이승환기자]

한국의 대표 인공지능(AI) 에이전트인 네이버 ‘클로바X’가 텍스트뿐 아니라 음성 이미지 코딩까지 생성하는 멀티모달로 본격 진화한다. 멀티모달은 텍스트, 이미지, 영상, 음성 등 다양한 시청각 요소를 종합적으로 판단해, 의사결정을 내리는 AI 비서다. 말을 하면 그림을 그려주고, 질문을 텍스트로 입력하면 음성으로 설명한다.

성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄은 경기도 분당에 있는 ‘네이버 1784’에서 기자와 만나 “조만간 클로바X에 눈이 생기고 귀가 생길 것”이라고 강조했다. 그러면서 그는 “현재 심혈을 기울이고 있는 것은 멀티모달로 확장”이라며 “이와 함께 클로바X의 토대인 초거대AI 하이퍼클로바X를 업데이트하고 있다”고 설명했다. (이하 일문일답)

고교 시절 양안 매핑 로봇 개발...코딩 천재 별명
사진 확대
2023년8월23일 서울 강남구의 그랜드 인터컨티넨탈 서울 파르나스 호텔에서 열린 ‘팀 네이버 콘퍼런스 단 2023’ . 최수연 네이버 대표이사가 초거대언어모델 ‘하이퍼클로바X’ 를 발표하고 있다. [이승환 기자]

▶ AI를 배운 계기가 궁금하다.

- 고등학교(서울과학고) 재학 중에 OCR(아르미 등장할 무렵) 만들다 실패한 적이 있다. 당시 자율주행 로봇을 만들기도 했는데, 비디오 카메라 두 개 꽂아 놓고 양안 매핑하는 원시적 로봇이었다. (고교 동창인 서성훈 KDB 실리콘밸리 대표는 성 총괄을 코딩 천재로 기억했다.)

▶ 대학때 AI를 배우지는 않았나.

-학부때 창업했고 졸업을 10년만에 했다. 당시 제프리 힌턴과 같은 교수도 몰랐다. 아마 영향을 준 사람이라면 존 카맥정도 아닐까한다. (주: 존 카맥은 GPU가 물리 연산 가속 카드에 더 적합하다고 주장한 인물로 가상현실(VR) 개척자로 꼽히는 인물)

▶ 어떤 창업을 했나.

-1999년 헥스플렉스라는 패키지 게임 엔진 스타트업을 창업했다. 2004년 네오위즈에 매각을 했다. (큰 돈을 만졌겠겠다.) 그렇진 않다. 이후 네오위즈에서 스핀오프된 자회사에서 일했다. 모바일로 전환을 하지 못했고, 사세가 많이 꺾였다.

▶ 이후 엔씨소프트에 입사했다.

-엔씨소프트에서 아이온2팀에서 개발을 담당했다. 당시 주 업무는 게임 개발도구가 무거워 이를 경량화하는 일을 했다. 게임 수정하는데 5시간 걸리더라. 이를 5초만에 해결할 수 있도록 했다. 이후 강화학습 기반 게임 에이전트를 개발했다. 딥마인드가 막 아타리를 상대로 AI가 대결을 할 때였다. 우리가 오픈AI 보다 3년 빨랐다.

네이버 합류후 퀀트 트레이딩, AI 콜센터 등 잇따라 개발
사진 확대
성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄 [이승환기자]

▶ 네이버는 어떤 계기로 합류했나

-판교 AI 모임에 갔더니 대학 동기 동창인 하정우 네이버클라우드 AI이노베이션센터장이 있더라. 하 센터장은 학창시절 군대에 갔고, 난 창업을 해서 겹치는 시간이 많지는 않았다. 하 센터장 뿐 아니라 다른 분 역시 권유를 해서 네이버에 합류했다.

▶ 어떤 일을 했나.

-2017년에는 네이버에도 상당히 많은 AI팀이 있었다. 우리 팀도 무엇인가를 해야 했는데, 이미 전부 프로젝트가 있더라. 그래서 한 것이 퀀트 트레이딩이었다. 1년 정도 했는데, 수익이 맞지 않았다. 르네상스 테크놀로지 수익률이 20%인데, IT는 20%가 훨씬 넘는다. 효율이 높지 않았다. 이후 AI 콜센터를 개발했다. 전화 받는 AI 상담원은 아마 우리가 전 세계 최초일 것이다. 현재도 독거노인 안부를 묻는데 잘쓰고 있어서 뿌듯하다.

▶ 초거대AI는 어떤 계기로 개발했나

-2019년엔 논문을 하루에 수십편씩 봤다. 트랜스포머모델이 등장했고, 2020년 GPT-3.0이 등장했다. 이 방향이 아니면 승산이 없다고 판단했다. 이후 나온 것이 하이퍼클로바다. 네이버 데이터를 트랜스포머모델로 학습한 것이다. 당시 구글 아마존은 트랜스포머 기반의 LLM을 서비스에 적용하지 않았다.

▶ 이후 챗GPT가 등장해 ‘와우 포인트’를 넘었다

-챗GPT가 등장한 뒤 로보틱스 자율주행도 LLM 기반이라는 사실을 회사 내외부에서 인지하기 시작했다. 작년에는 하이퍼클로바X를 기반으로 한 AI 에이전트인 클로바X를 내놓았다.

“모델 크면 성능은 당연히 좋아”…상호 가치관 배려하는 AI 필요
사진 확대
네이버는 카셰어링 ‘쏘카’, 리테일 테크 서비스 ‘컬리’, AI 매칭 채용 플랫폼 ‘원티드’, 초개인화 여행 플랫폼 ‘트리플’과 스킬(Skill)을 연동했다고 발표했다.

▶ 오픈AI, 구글이 개발한 AI 발전 속도가 매섭다

-GPT-5가 나오면 기술격차가 더 있을 텐데, 현재 관건은 추론 비용이다. 아마 시장에서 수용할 수 있는 지점이 제미나이 프로 정도가 아닐까 한다. 추론 비용이 많이 들면 수익이 나지 않는다.

▶ 클로바X만의 장점이 있나

-LLM은 사이즈가 크면 당연히 성능이 좋다. 모델이 크면 추론 비용이 많이 든다. 만능 소스보다는 간장이면 간장, 고추장이면 고추장이 비즈니스모델상 좋다. 한국은 작은 시장이라 글로벌 빅테크기업이 정조준하기 어렵다. 우리는 한국어 비중이 높다. 한국 일본 시장 전용 AI가 경제적으로도 유리하다.

▶ 네이버는 AI 주권을 늘 강조한다

-AI에는 가치관이 투영된다. 나라나 종교에 따라 합의할 수 없는 가치관이 있다. 미국 모델대로 가면 미국 가치관이 주입된다. 다른 AI에 독도 영유권을 물어보면, 분쟁지역이라고 답할 것이다.

▶올트먼은 향후 AI는 맞춤화될 것이라고 봤다

-맞는 말이다. 국가마다 AI 따로 만드는 이유가 그것이다.

▶향후 네이버의 전략은 무엇인가.

-하나로 가야 한다. 멀티모달 확장이다. 글로벌 생성AI 번역기인 L사 모델보다 하이퍼클로바X 번역 성능이 우수하다. 기술 방향이 그렇다. 멀티모달이 되고 오토메이션이 되고 로봇 컨트롤러가 붙을 것이다.

▶멀티모달은 어떤 방향인가

-눈이 생기고 귀가 생길 것이다. 오디오에 해당하는 것을 내놓을 것이다. 코딩 강화 버전 역시 상반기 중에 나올 것이다.

AGI 도래하면 어떤 일 벌어질지 알 수 없어…클라우드 기업에 칩 개발은 필수
사진 확대
성낙호 네이버 클라우드 하이퍼스케일(Hyperscale) AI 기술총괄 [이승환기자]

▶다른 질문을 하겠다. 인공일반지능(AGI)에 대해선 어떻게 생각하나

-AI가 어느 정도 단계를 넘어서면 알파제로처럼 학습 없이도 스스로 터득하는 단계가 될 수 있다. 1만 IQ를 넘는 AI가 나올 수 있다. AI 능력이 ‘만랩’이 되면 어떤 일이 일어날지 모른다.

▶AI에 자의식이 있다고 생각하나

-자의식에 대한 명쾌한 정의가 없어서 어떻게 정의해야할지 모르겠다. 하지만 현재 수준에서는 코딩해서 넣지 않으면 발생하기 어렵다. AI가 현재 방향대로만 간다면, 우리가 생각하는 자의식은 없을 것이다.

▶오픈AI 수석과학자 일리야 슈츠케버는 윤리를 강조한다

-얼라이언먼트(정렬)로 선한 AI를 만들겠다는 것은 독선적이다. 너는 나쁘고 나는 옳고 해서는 안 되지 않나. 우리만 옳으니 우리만 AI를 만들어야한다는 논리는 동의하기 어렵다.

▶AI 경쟁은 어떻게 될 것 같나

-AI는 핵경쟁이다. 핵을 우리도 기술적으로는 만들 수 있는데, 못 만들지 않나. 한국은 몇 안 되는 LLM 개발 국가다. 최대한 레버리지를 일으킬 수 있도록 도와줘야한다. 규제보다는 지원을 해야한다.

▶미·중 갈등은 AI에 어떤 영향을 줄까

-미국이 중국에 GPU 수출을 금지해 타격이 있을 것으로 본다. 중국이 자체 기술보단 미국에서 GPU를 수입하고 있어 힘들 것으로 보인다.

▶비용 탓에 반도체 개발이 열기가 후끈하다

- 우리도 이동수 디렉터님이 열심히 하고 있다. 특정 기업에 붙어 있으면 가격 협상력이 없다. 그래픽처리장치(GPU)는 학습에 필요하고, 인공신경망(NPU)은 추론에 필요하다. 현재 NPU 부문에서는 삼성전자 인텔과 협업하고 있다. 인퍼런스 시장을 놓치면 클라우드 기업으로서는 힘들 것이다.

He is…
△1979년 서울출생 △서울과학고등학교 △서울대학교 컴퓨터공학 학사 △헥스플렉스 창립 1999~2004년 △레드덕 디렉터 2004~2014년 △ 엔씨소프트 2014~2017년 △ 네이버 책임리더 △ 네이버 클라우드 하이퍼스케일AI 기술총괄
반응형
반응형

djangorestframework 3.14.0

 

 

https://www.django-rest-framework.org/

 


*** 참고 : https://towardsdatascience.com/designing-and-deploying-a-machine-learning-python-application-part-2-99eb37787b2b

https://pypi.org/project/djangorestframework/

pip install djangorestframework

Requirements Python 3.6+ Django 4.1, 4.0, 3.2, 3.1, 3.0 We highly recommend and only officially support the latest patch release of each Python and Django series.

Installation Install using pip...

pip install djangorestframework
Add 'rest_framework' to your INSTALLED_APPS setting.

INSTALLED_APPS = [
    ...
    'rest_framework',
]

 

Designing and Deploying a Machine Learning Python Application (Part 2)

You don’t have to be Atlas to get your model into the cloud

towardsdatascience.com

 

 

 

 

 

반응형

+ Recent posts