INVALID_ARGUMENT: размер полезной нагрузки запроса превышает ограничение: 10485760 байт
Я впервые использую GCS Speech API для проекта, чтобы преобразовать серию аудиофайлов в текст. Каждый файл длится около 60 минут и представляет собой человека, разговаривающего непрерывно в течение всего времени. Я установил GC SDK и использую его для выполнения запросов, как показано ниже:
gcloud ml speech recognize-long-running \
"/path/to/file/audio.flac" \
--language-code="pt-PT" --async
Каждый раз, когда я запускаю это на одной из моих записей, выдается следующее сообщение об ошибке:
ERROR: (gcloud.ml.speech.recognize-long-running) INVALID_ARGUMENT:
Request payload size exceeds the limit: 10485760 bytes.
Кажется, это очень жесткое ограничение, потому что если API способен обрабатывать файлы до 180 минут, он никак не сможет вывести речь максимум на 10000 символов.
Я попытался разделить аудиофайлы на более мелкие фрагменты и получил до четырех 15-минутных сэмплов, и даже при этом я получил ту же ошибку Кроме того, даже если бы это сработало, было бы очень утомительным и непрактичным делом разбивать каждую новую запись, которую я делаю, начиная с этого момента.
Я искал и до сих пор не пришел ни к какому заключению о том, как увеличить или обойти это ограничение. У меня бесплатная пробная версия, но я рад перейти на платную подписку, чтобы увеличить этот лимит. Насколько я понял, это ограничение сохранится, даже если я нахожусь на платной подписке.
Кто-нибудь нашел решение этой проблемы?
1 ответ
Поговорив со службой поддержки Google Cloud, я пришел к выводу, что это связано с ограничением моей бесплатной пробной подписки и размером файла (~60 минут).
После перехода на платную подписку и загрузки моего файла в облачное хранилище Google я смог получить полезную нагрузку из транскрипции.
$ gcloud ml speech recognize-long-running "gs://test-bucket/my_audio_file.flac" --language-code="pt-PT" --async
Check operation [7456984365978465938] for status.
{
"name": "7456984365978465938"
}
$ gcloud ml speech operations describe 7456984365978465938
{
... payload ...
}