본문 바로가기

반응형

speech

[python] Google Cloud Speech - StreamingRecognitionResult StreamingRecognitionResult A streaming speech recognition result corresponding to a portion of the audio that is currently being processed. Fields #alternatives #channel_tag alternatives[] SpeechRecognitionAlternative May contain one or more recognition hypotheses (up to the maximum specified in max_alternatives). These alternatives are ordered in terms of accuracy, with the top (first) alternat.. 더보기
[python] Package google.cloud.speech.v1 Package google.cloud.speech.v1 RecognitionConfig Provides information to the recognizer that specifies how to process the request. Fields encoding AudioEncoding Encoding of audio data sent in all RecognitionAudio messages. This field is optional for FLAC and WAV audio files and required for all other audio formats. For details, see AudioEncoding. sample_rate_hertz int32 Sample rate in Hertz of t.. 더보기
[google cloud] 여러 채널로 오디오 스크립트 작성 - transcribe_multichannel.py 여러 채널로 오디오 스크립트 작성 transcribe_multichannel.py 이 페이지에서는 Speech-to-Text를 사용하여 둘 이상의 채널이 포함된 오디오 파일을 텍스트로 변환하는 방법을 설명합니다. 오디오 데이터에는 녹음된 화자에 대한 각각의 채널이 포함되어 있는 경우가 많습니다. 예를 들어 두 사람의 전화 통화를 녹음한 오디오라면 각 회선이 별도로 녹음된 채널 두 개가 포함될 수 있습니다. 여러 채널이 포함된 오디오 데이터를 텍스트로 변환하려면 Speech-to-Text API에 대한 요청에 채널 수를 제공해야 합니다. 요청의 audioChannelCount 필드를 오디오에 있는 채널 수로 설정합니다. 여러 채널이 포함된 요청을 보내면 Speech-to-Text가 오디오에 있는 서로 다른.. 더보기
googleapis/python-speech github.com/googleapis/python-speech#windows googleapis/python-speech Contribute to googleapis/python-speech development by creating an account on GitHub. github.com Windows pip install virtualenv virtualenv \Scripts\activate \Scripts\pip.exe install google-cloud-speech 더보기

반응형