반응형

여러 채널로 오디오 스크립트 작성

transcribe_multichannel.py 

이 페이지에서는 Speech-to-Text를 사용하여 둘 이상의 채널이 포함된 오디오 파일을 텍스트로 변환하는 방법을 설명합니다.

오디오 데이터에는 녹음된 화자에 대한 각각의 채널이 포함되어 있는 경우가 많습니다. 예를 들어 두 사람의 전화 통화를 녹음한 오디오라면 각 회선이 별도로 녹음된 채널 두 개가 포함될 수 있습니다.

여러 채널이 포함된 오디오 데이터를 텍스트로 변환하려면 Speech-to-Text API에 대한 요청에 채널 수를 제공해야 합니다. 요청의 audioChannelCount 필드를 오디오에 있는 채널 수로 설정합니다.

여러 채널이 포함된 요청을 보내면 Speech-to-Text가 오디오에 있는 서로 다른 채널을 식별하는 결과를 반환하며 channelTag 필드를 사용하여 각 결과를 대신하는 항목에 라벨을 지정합니다.

 

오디오 채널 설명 : https://cloud.google.com/speech-to-text/docs/multi-channel

 

여러 채널로 오디오 스크립트 작성  |  Cloud Speech-to-Text 문서  |  Google Cloud

이 페이지에서는 Speech-to-Text를 사용하여 둘 이상의 채널이 포함된 오디오 파일을 텍스트로 변환하는 방법을 설명합니다. 오디오 데이터에는 녹음된 화자에 대한 각각의 채널이 포함되어 있는

cloud.google.com

 

from google.cloud import speech

client = speech.SpeechClient()

with open(speech_file, "rb") as audio_file:
    content = audio_file.read()

audio = speech.RecognitionAudio(content=content)

config = speech.RecognitionConfig(
    encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=44100,
    language_code="en-US",
    audio_channel_count=2,
    enable_separate_recognition_per_channel=True,
)

response = client.recognize(config=config, audio=audio)

for i, result in enumerate(response.results):
    alternative = result.alternatives[0]
    print("-" * 20)
    print("First alternative of result {}".format(i))
    print(u"Transcript: {}".format(alternative.transcript))
    print(u"Channel Tag: {}".format(result.channel_tag))

 

github.com/googleapis/python-speech/blob/master/samples/snippets/transcribe_multichannel.py

 

googleapis/python-speech

Contribute to googleapis/python-speech development by creating an account on GitHub.

github.com

 

반응형
반응형

google.api_core.exceptions.InvalidArgument: 400 Request payload size exceeds the limit: 10485760 bytes.

 

 

일련의 오디오 파일을 텍스트로 변환하는 프로젝트에 처음으로 GCS Speech API를 사용하고 있습니다. 각 파일은 약 60 분이 소요되며 전체 시간 동안 지속적으로 말하는 사람입니다. GC SDK를 설치했으며 다음과 같이 요청을 수행하는 데 사용하고 있습니다.gcloud ml speech recognize-long-running \ "/path/to/file/audio.flac" \ --language-code="pt-PT" --async

내 기록 중 하나에서 이것을 실행할 때마다 다음 오류 메시지가 표시됩니다.

ERROR: (gcloud.ml.speech.recognize-long-running) INVALID_ARGUMENT: Request payload size exceeds the limit: 10485760 bytes.

API가 최대 180 분까지 파일을 처리 할 수있는 경우 최대 10,000 자의 음성을 출력 할 방법이 없기 때문에 매우 어려운 제한 인 것 같습니다 .
오디오 파일을 더 작은 조각으로 나누려고했고 최대 4 개의 15 분 샘플에 도달했지만 동일한 오류가 발생했습니다. 게다가, 그것이 효과가 있더라도 여기에서 내가 만드는 모든 새로운 녹음을 앞으로 나누는 것은 매우 지루하고 비실용적 일 것입니다.

 

(env) C:\__STT>
(env) C:\__STT>
(env) C:\__STT>python transcribe_async.py test_Linda_audio_converter.flac
Traceback (most recent call last):
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 57, in error_remapped_callable
    return callable_(*args, **kwargs)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 923, in __call__
    return _end_unary_response_blocking(state, call, False, None)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 826, in _end_unary_response_blocking
    raise _InactiveRpcError(state)
grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with:
        status = StatusCode.INVALID_ARGUMENT
        details = "Request payload size exceeds the limit: 10485760 bytes."
        debug_error_string = "{"created":"@1605235850.871000000","description":"Error received from peer ipv4:216.58.220.138:443","file":"src/core/lib/surface/call.cc","file_line":1062,"grpc_message":"Request payload size exceeds the limit: 10485760 bytes.","grpc_status":3}"
>

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "transcribe_async.py", line 117, in <module>
    transcribe_file(args.path)
  File "transcribe_async.py", line 54, in transcribe_file
    request={"config": config, "audio": audio}
  File "C:\__STT\env\lib\site-packages\google\cloud\speech_v1\services\speech\client.py", line 425, in long_running_recognize
    response = rpc(request, retry=retry, timeout=timeout, metadata=metadata,)
  File "C:\__STT\env\lib\site-packages\google\api_core\gapic_v1\method.py", line 145, in __call__
    return wrapped_func(*args, **kwargs)
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 59, in error_remapped_callable
    six.raise_from(exceptions.from_grpc_error(exc), exc)
  File "<string>", line 3, in raise_from
google.api_core.exceptions.InvalidArgument: 400 Request payload size exceeds the limit: 10485760 bytes.

(env) C:\__STT>

(env) C:\__STT>

Google Cloud 지원팀과 이야기를 나눈 후 무료 평가판 구독 제한과 파일 크기 (~ 60 분) 때문이라는 결론에 도달했습니다.

유료 구독으로 업그레이드하고 내 파일을 Google Cloud Storage에 업로드 한 후 트랜스 크립 션에서 페이로드를받을 수있었습니다.

 

stackoverflow.com/questions/51601697/invalid-argument-request-payload-size-exceeds-the-limit-10485760-bytes

 

INVALID_ARGUMENT: Request payload size exceeds the limit: 10485760 bytes

I'm using for the first time the GCS Speech API for a project to convert a series of audio files to text. Each file has around 60 minutes and is a person talking continuously during the whole time....

stackoverflow.com

 

반응형
반응형

google.api_core.exceptions.OutOfRange: 400 Exceeded maximum allowed stream duration of 305 seconds.

"최대 허용 스트림 길이 인 65 초를 초과했습니다."
더 많은 시간 동안 "DEADLINE_SECS"를 수정하려고했지만 작동하지 않았습니다.

 

5 분마다 예외를 포착하는 것은 최적이 아니지만 작동합니다.

 

o think about and already seen in your mom about this is more like a summarizing and reflecting you know back and and the ones were doing studi study the first part was a mobile diary and now a lot of the things we're going to talk about during this interview you have already started to think about and already seen in your mom about this is more like a summarizing and reflecting you know back and and the ones were doing studiTraceback (most recent call last): like how was it for the sweetest person consume that you know and
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 97, in next
    return six.next(self._wrapped)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 416, in __next__
    return self._next()
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 803, in _next
    raise self
grpc._channel._MultiThreadedRendezvous: <_MultiThreadedRendezvous of RPC that terminated with:
        status = StatusCode.OUT_OF_RANGE
        details = "Exceeded maximum allowed stream duration of 305 seconds."
        debug_error_string = "{"created":"@1605234860.496000000","description":"Error received from peer ipv4:216.58.197.234:443","file":"src/core/lib/surface/call.cc","file_line":1062,"grpc_message":"Exceeded maximum allowed stream duration of 305 seconds.","grpc_status":11}"
>

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "test.py", line 189, in <module>
    main()
  File "test.py", line 185, in main
    listen_print_loop(responses)
  File "test.py", line 124, in listen_print_loop
    for response in responses:
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 100, in next
    six.raise_from(exceptions.from_grpc_error(exc), exc)
  File "<string>", line 3, in raise_from
google.api_core.exceptions.OutOfRange: 400 Exceeded maximum allowed stream duration of 305 seconds.

(env) C:\__STT>
반응형
반응형

코웨이는 넷플릭스의 추격을 따돌릴까

 

 

www.bloter.net/archives/474628

 

[넘버스]코웨이는 넷플릭스의 추격을 따돌릴까

숫자들(Numbers)로 기업과 경제, 기술을 해석해 보겠습니다. 숫자는 정보의 원천입니다. 정보는 누구에게나 공개되어 있고 숫자도 누구나 볼 수 있지만, 그 뒤에 숨어 있는 진실을 보는 눈은 누구

www.bloter.net

 

반응형
반응형

카톡 오픈채팅 ‘방장봇’ 생긴다

카카오가 카카오톡 오픈채팅에 자동응답 기능인 ‘방장봇’을 새롭게 도입한다고 12일 밝혔다.

오픈채팅방 내에서 방 관리자(방장)이 설정한 항목에 따라 메시지를 자동으로 응답해주는 ‘방장봇’은 다수가 참여하는 그룹 오픈채팅방에서 제공된다. 방장이 채팅방 운영을 위해 참여자들을 대상으로 반복 전송하던 메시지나 질문 등을 사전에 등록해, 채팅방 관리를 효율화할 수 있다. 카카오는 일부 오픈채팅방을 대상으로 해당 기능을 베타로 도입, 사용성과 편의를 사전 검증해왔다.

방장봇은 오픈채팅방 내에서 다양한 형태로 활용 가능하다. 새롭게 입장한 채팅 참여자를 대상으로 인사말과 같은 환영 메시지나 공지사항 등을 자동으로 전송할 수 있으며, 해당 방의 성격에 맞는 규칙이나 정보 등을 담은 알림 메시지를 지정된 시간에 맞춰 보내도록 등록 가능하다.

이 밖에 특정 키워드에 대한 질문과 답변을 최대 10개까지 사전 작성할 수 있으며, 채팅 참여자가 입력창에 ‘/(슬래시)’기호와 함께 상단으로 보여지는 질문 리스트 중 하나를 선택했을 때 작성해둔 답변이 채팅창 내에 바로 노출된다. 채팅방 내 방장이 변동될 경우, 이에 대한 알림도 전송된다.

방장봇 기능은 오픈채팅방의 방장만 설정 가능하며, 채팅방 내 우측 상단의 사이드 메뉴를 통해 오픈채팅 봇 ‘방장봇 활성화’를 클릭해 사용할 수 있다. 이후 설정 버튼을 눌러 환영 메시지와 알림 메시지, 질문 및 답변 등을 생성할 수 있으며, 수정과 삭제도 손쉽게 가능하다.

카카오 관계자는 “’방장봇’은 방장의 채팅방 관리 역할을 대신해주는 편의와 함께, 참여자들에게 채팅 중 재미요소를 제공해 오픈채팅의 활성화에도 도움을 줄 것으로 예상하고 있다”며 “앞으로도 이용자들이 채팅 속에서 경험할 수 있는 이색적이고 흥미로운 기능들을 꾸준히 선보일 계획”이라고 전했다.

새롭게 도입한 방장봇 기능은 iOS와 안드로이드 카카오톡 v.9.1.0이상으로 업데이트 후 이용 가능하다.

 

www.bloter.net/archives/474548

 

카톡 오픈채팅 ‘방장봇’ 생긴다

카카오가 카카오톡 오픈채팅에 자동응답 기능인 ‘방장봇’을 새롭게 도입한다고 12일 밝혔다. 오픈채팅방 내에서 방 관리자(방장)이 설정한 항목에 따라 메시지를 자동으로 응답해주는 ‘방장

www.bloter.net

 

반응형
반응형

배워서 바로 쓰는 온라인강의 사이트 정리 모음

 

마케팅, 프로그래밍 등 자기개발을 위해 알아두면 좋은 온라인 강의 사이트 리스트를 공유합니다.


[국내]

 

아이보스 교육 

실무진이 강의하는 마케팅 교육, 3천여 후기 인증, 온라인 교육 30% 할인 프로모션 진행 중

 

edwith

네이버와 네이버 커넥트재단이 제공하는 온라인 강좌 교육 플랫폼 (SW, UX, 비즈니스 등)

 

구름EDU

맞춤형 IT교육 플랫폼 (프로그래밍, 그래픽, 비지니스, 마케팅 등)

 

KOCW 

고등교육 교수학습자료 공동활용 서비스, 주제별, 대학별, 강의자료 검색 등 제공.


엔트리

소프트웨어 교육의 첫걸음, 엔트리



[국외]

 

린다닷컴

링크드인이 운영하는 실무 중심 과정 (영상 디자인, IT 분야 등)

 

코세라

머신러닝, 학습방법, 컴퓨터과학분야, 알고리즘 등

 

칸아카데미

컴퓨터 프로그래밍, 경제, 예술, 금융 등

 

MIT 오픈코스웨어

MIT 과목의 강의에 사용되는 자료를 웹에서 무료로 제공

 

SCRATCH

대화형 스토리, 게임 및 애니메이션을 직접 만들 수 있는 무료 프로그래밍 언어 및 온라인 커뮤니티

 

W3Schools

세계에서 가장 큰 중국 웹 기술 튜토리얼

 

www.i-boss.co.kr/ab-6141-53149

 

배워서 바로 쓰는 온라인강의 사이트 정리 모음

마케팅, 프로그래밍 등 자기개발을 위해 알아두면 좋은 온라인 강의 사이트 리스트를 공유합니다.[국내]아이보스 교육 실무진이 강의하는 마케팅 교육, 3천여 후기 인증, 온라인 교육 30% 할...

www.i-boss.co.kr

 

반응형
반응형

최고경영자는 다른 누구에게도 맡겨서는 안되는
다음 두 가지 과제에 몰두할 시간을 반드시 가지도록
직무 계획을 짜야한다.
하나는 외부를 향한 시간,
즉 고객, 시장, 기술을 위한 시간이며,
다른 하나는 사내의 핵심 요원과 만나서
차분히 이야기 하기 위한 시간이다.
- 피터 드러커


경영자의 최고 자산은 시간입니다.
드러커는 가장 귀중한 자산인 시간을 잘 활용하기 위해서는
집중이 필요하다고 말하고 있으며,
한편으론 최고경영자에게는 자유로운 시간,
용무가 전혀 없는 시간,
문제 처리로 고민하지 않아도 되는 시간이
필요하다고 지적합니다.

반응형
반응형

공중도덕을 잘 지켜라.
줄을 서지 않고 새치기를 하면
나 하나는 빠르고 편하겠지만, 수많은
사람들이 늦어지고 불편하단다. 살아가면서
사람들이 절대로 가져서는 안 될 생각 중의
하나가 '나 하나쯤이야'라는
생각이란다.


- 박성철《아주 특별한 너에게》중에서 -


* 공동체 생활에서
가장 경계해야 할 것이 '나 하나쯤이야!'하는
생각입니다. 볼트 하나, 톱니바퀴 한 쪽이 별게
아닌 듯 보여도 그 하나 때문에 기계가 망가지고
큰 사고를 냅니다. 우리가 사는 사회의 질서나
공중도덕도 한 사람으로부터 비롯됩니다.
'나 하나만이라도!'라는 사람들이 모여
더 좋은 세상을 만듭니다.

반응형

'생활의 발견 > 아침편지' 카테고리의 다른 글

세포 재생, 세포 파괴  (0) 2020.11.16
마음 따라 얼굴도 바뀐다  (0) 2020.11.16
'그냥, 웃는 얼굴'이 좋다  (0) 2020.11.12
사랑을 잃고 나서...  (0) 2020.11.12
'쓴 것을 가져오라'  (0) 2020.11.10

+ Recent posts