반응형
반응형

여러 채널로 오디오 스크립트 작성

transcribe_multichannel.py 

이 페이지에서는 Speech-to-Text를 사용하여 둘 이상의 채널이 포함된 오디오 파일을 텍스트로 변환하는 방법을 설명합니다.

오디오 데이터에는 녹음된 화자에 대한 각각의 채널이 포함되어 있는 경우가 많습니다. 예를 들어 두 사람의 전화 통화를 녹음한 오디오라면 각 회선이 별도로 녹음된 채널 두 개가 포함될 수 있습니다.

여러 채널이 포함된 오디오 데이터를 텍스트로 변환하려면 Speech-to-Text API에 대한 요청에 채널 수를 제공해야 합니다. 요청의 audioChannelCount 필드를 오디오에 있는 채널 수로 설정합니다.

여러 채널이 포함된 요청을 보내면 Speech-to-Text가 오디오에 있는 서로 다른 채널을 식별하는 결과를 반환하며 channelTag 필드를 사용하여 각 결과를 대신하는 항목에 라벨을 지정합니다.

 

오디오 채널 설명 : https://cloud.google.com/speech-to-text/docs/multi-channel

 

여러 채널로 오디오 스크립트 작성  |  Cloud Speech-to-Text 문서  |  Google Cloud

이 페이지에서는 Speech-to-Text를 사용하여 둘 이상의 채널이 포함된 오디오 파일을 텍스트로 변환하는 방법을 설명합니다. 오디오 데이터에는 녹음된 화자에 대한 각각의 채널이 포함되어 있는

cloud.google.com

 

from google.cloud import speech

client = speech.SpeechClient()

with open(speech_file, "rb") as audio_file:
    content = audio_file.read()

audio = speech.RecognitionAudio(content=content)

config = speech.RecognitionConfig(
    encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=44100,
    language_code="en-US",
    audio_channel_count=2,
    enable_separate_recognition_per_channel=True,
)

response = client.recognize(config=config, audio=audio)

for i, result in enumerate(response.results):
    alternative = result.alternatives[0]
    print("-" * 20)
    print("First alternative of result {}".format(i))
    print(u"Transcript: {}".format(alternative.transcript))
    print(u"Channel Tag: {}".format(result.channel_tag))

 

github.com/googleapis/python-speech/blob/master/samples/snippets/transcribe_multichannel.py

 

googleapis/python-speech

Contribute to googleapis/python-speech development by creating an account on GitHub.

github.com

 

반응형
반응형

google.api_core.exceptions.InvalidArgument: 400 Request payload size exceeds the limit: 10485760 bytes.

 

 

일련의 오디오 파일을 텍스트로 변환하는 프로젝트에 처음으로 GCS Speech API를 사용하고 있습니다. 각 파일은 약 60 분이 소요되며 전체 시간 동안 지속적으로 말하는 사람입니다. GC SDK를 설치했으며 다음과 같이 요청을 수행하는 데 사용하고 있습니다.gcloud ml speech recognize-long-running \ "/path/to/file/audio.flac" \ --language-code="pt-PT" --async

내 기록 중 하나에서 이것을 실행할 때마다 다음 오류 메시지가 표시됩니다.

ERROR: (gcloud.ml.speech.recognize-long-running) INVALID_ARGUMENT: Request payload size exceeds the limit: 10485760 bytes.

API가 최대 180 분까지 파일을 처리 할 수있는 경우 최대 10,000 자의 음성을 출력 할 방법이 없기 때문에 매우 어려운 제한 인 것 같습니다 .
오디오 파일을 더 작은 조각으로 나누려고했고 최대 4 개의 15 분 샘플에 도달했지만 동일한 오류가 발생했습니다. 게다가, 그것이 효과가 있더라도 여기에서 내가 만드는 모든 새로운 녹음을 앞으로 나누는 것은 매우 지루하고 비실용적 일 것입니다.

 

(env) C:\__STT>
(env) C:\__STT>
(env) C:\__STT>python transcribe_async.py test_Linda_audio_converter.flac
Traceback (most recent call last):
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 57, in error_remapped_callable
    return callable_(*args, **kwargs)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 923, in __call__
    return _end_unary_response_blocking(state, call, False, None)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 826, in _end_unary_response_blocking
    raise _InactiveRpcError(state)
grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with:
        status = StatusCode.INVALID_ARGUMENT
        details = "Request payload size exceeds the limit: 10485760 bytes."
        debug_error_string = "{"created":"@1605235850.871000000","description":"Error received from peer ipv4:216.58.220.138:443","file":"src/core/lib/surface/call.cc","file_line":1062,"grpc_message":"Request payload size exceeds the limit: 10485760 bytes.","grpc_status":3}"
>

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "transcribe_async.py", line 117, in <module>
    transcribe_file(args.path)
  File "transcribe_async.py", line 54, in transcribe_file
    request={"config": config, "audio": audio}
  File "C:\__STT\env\lib\site-packages\google\cloud\speech_v1\services\speech\client.py", line 425, in long_running_recognize
    response = rpc(request, retry=retry, timeout=timeout, metadata=metadata,)
  File "C:\__STT\env\lib\site-packages\google\api_core\gapic_v1\method.py", line 145, in __call__
    return wrapped_func(*args, **kwargs)
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 59, in error_remapped_callable
    six.raise_from(exceptions.from_grpc_error(exc), exc)
  File "<string>", line 3, in raise_from
google.api_core.exceptions.InvalidArgument: 400 Request payload size exceeds the limit: 10485760 bytes.

(env) C:\__STT>

(env) C:\__STT>

Google Cloud 지원팀과 이야기를 나눈 후 무료 평가판 구독 제한과 파일 크기 (~ 60 분) 때문이라는 결론에 도달했습니다.

유료 구독으로 업그레이드하고 내 파일을 Google Cloud Storage에 업로드 한 후 트랜스 크립 션에서 페이로드를받을 수있었습니다.

 

stackoverflow.com/questions/51601697/invalid-argument-request-payload-size-exceeds-the-limit-10485760-bytes

 

INVALID_ARGUMENT: Request payload size exceeds the limit: 10485760 bytes

I'm using for the first time the GCS Speech API for a project to convert a series of audio files to text. Each file has around 60 minutes and is a person talking continuously during the whole time....

stackoverflow.com

 

반응형
반응형

google.api_core.exceptions.OutOfRange: 400 Exceeded maximum allowed stream duration of 305 seconds.

"최대 허용 스트림 길이 인 65 초를 초과했습니다."
더 많은 시간 동안 "DEADLINE_SECS"를 수정하려고했지만 작동하지 않았습니다.

 

5 분마다 예외를 포착하는 것은 최적이 아니지만 작동합니다.

 

o think about and already seen in your mom about this is more like a summarizing and reflecting you know back and and the ones were doing studi study the first part was a mobile diary and now a lot of the things we're going to talk about during this interview you have already started to think about and already seen in your mom about this is more like a summarizing and reflecting you know back and and the ones were doing studiTraceback (most recent call last): like how was it for the sweetest person consume that you know and
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 97, in next
    return six.next(self._wrapped)
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 416, in __next__
    return self._next()
  File "C:\__STT\env\lib\site-packages\grpc\_channel.py", line 803, in _next
    raise self
grpc._channel._MultiThreadedRendezvous: <_MultiThreadedRendezvous of RPC that terminated with:
        status = StatusCode.OUT_OF_RANGE
        details = "Exceeded maximum allowed stream duration of 305 seconds."
        debug_error_string = "{"created":"@1605234860.496000000","description":"Error received from peer ipv4:216.58.197.234:443","file":"src/core/lib/surface/call.cc","file_line":1062,"grpc_message":"Exceeded maximum allowed stream duration of 305 seconds.","grpc_status":11}"
>

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "test.py", line 189, in <module>
    main()
  File "test.py", line 185, in main
    listen_print_loop(responses)
  File "test.py", line 124, in listen_print_loop
    for response in responses:
  File "C:\__STT\env\lib\site-packages\google\api_core\grpc_helpers.py", line 100, in next
    six.raise_from(exceptions.from_grpc_error(exc), exc)
  File "<string>", line 3, in raise_from
google.api_core.exceptions.OutOfRange: 400 Exceeded maximum allowed stream duration of 305 seconds.

(env) C:\__STT>
반응형
반응형

코웨이는 넷플릭스의 추격을 따돌릴까

 

 

www.bloter.net/archives/474628

 

[넘버스]코웨이는 넷플릭스의 추격을 따돌릴까

숫자들(Numbers)로 기업과 경제, 기술을 해석해 보겠습니다. 숫자는 정보의 원천입니다. 정보는 누구에게나 공개되어 있고 숫자도 누구나 볼 수 있지만, 그 뒤에 숨어 있는 진실을 보는 눈은 누구

www.bloter.net

 

반응형
반응형

카톡 오픈채팅 ‘방장봇’ 생긴다

카카오가 카카오톡 오픈채팅에 자동응답 기능인 ‘방장봇’을 새롭게 도입한다고 12일 밝혔다.

오픈채팅방 내에서 방 관리자(방장)이 설정한 항목에 따라 메시지를 자동으로 응답해주는 ‘방장봇’은 다수가 참여하는 그룹 오픈채팅방에서 제공된다. 방장이 채팅방 운영을 위해 참여자들을 대상으로 반복 전송하던 메시지나 질문 등을 사전에 등록해, 채팅방 관리를 효율화할 수 있다. 카카오는 일부 오픈채팅방을 대상으로 해당 기능을 베타로 도입, 사용성과 편의를 사전 검증해왔다.

방장봇은 오픈채팅방 내에서 다양한 형태로 활용 가능하다. 새롭게 입장한 채팅 참여자를 대상으로 인사말과 같은 환영 메시지나 공지사항 등을 자동으로 전송할 수 있으며, 해당 방의 성격에 맞는 규칙이나 정보 등을 담은 알림 메시지를 지정된 시간에 맞춰 보내도록 등록 가능하다.

이 밖에 특정 키워드에 대한 질문과 답변을 최대 10개까지 사전 작성할 수 있으며, 채팅 참여자가 입력창에 ‘/(슬래시)’기호와 함께 상단으로 보여지는 질문 리스트 중 하나를 선택했을 때 작성해둔 답변이 채팅창 내에 바로 노출된다. 채팅방 내 방장이 변동될 경우, 이에 대한 알림도 전송된다.

방장봇 기능은 오픈채팅방의 방장만 설정 가능하며, 채팅방 내 우측 상단의 사이드 메뉴를 통해 오픈채팅 봇 ‘방장봇 활성화’를 클릭해 사용할 수 있다. 이후 설정 버튼을 눌러 환영 메시지와 알림 메시지, 질문 및 답변 등을 생성할 수 있으며, 수정과 삭제도 손쉽게 가능하다.

카카오 관계자는 “’방장봇’은 방장의 채팅방 관리 역할을 대신해주는 편의와 함께, 참여자들에게 채팅 중 재미요소를 제공해 오픈채팅의 활성화에도 도움을 줄 것으로 예상하고 있다”며 “앞으로도 이용자들이 채팅 속에서 경험할 수 있는 이색적이고 흥미로운 기능들을 꾸준히 선보일 계획”이라고 전했다.

새롭게 도입한 방장봇 기능은 iOS와 안드로이드 카카오톡 v.9.1.0이상으로 업데이트 후 이용 가능하다.

 

www.bloter.net/archives/474548

 

카톡 오픈채팅 ‘방장봇’ 생긴다

카카오가 카카오톡 오픈채팅에 자동응답 기능인 ‘방장봇’을 새롭게 도입한다고 12일 밝혔다. 오픈채팅방 내에서 방 관리자(방장)이 설정한 항목에 따라 메시지를 자동으로 응답해주는 ‘방장

www.bloter.net

 

반응형
반응형

1. 이탈을 막기 위해 영상이 짧아야 하는 것은 사실이다.
2. 영상이 짧다고 사람들이 무조건 좋아하는 것은 아니다.
3. 힘이 있는 콘텐츠는 10분 이상 고객을 붙들어 놓을 수 있다.
 


출처: https://21ctheageofdiscovery.com/100 [위즈앤비즈 - Wis&Biz]

https://21ctheageofdiscovery.com/100

영상 콘텐츠의 적절한 길이는 어느 정도일까?

최적의 영상 길이가 3분이라고? 유튜브가 새로운 마케팅 공간으로 크게 주목받으면서 영상 제작자들뿐 아니라 마케터에게도 적절한 영상 길이에 대한 논의가 화두가 되고 있다. 영상은 배너와

21ctheageofdiscovery.com

반응형

+ Recent posts