Описание тега transcription

1 ответ

MTURK: скрыть объект в предварительном просмотре, показать, когда вы принимаете HIT (URL изменяется в предварительном просмотре, скрывать в зависимости от URL)

Я использую механический турок Amazon, платформу для выполнения простых задач. Я использую его для расшифровки аудио файлов. Вот мои настройки: я использую базовую веб-форму для создания HIT, вставив аудио-плеер с помощью JWplayer Механический турок…
0 ответов

Amazon Транскрибируют конвертирование.json транскрипта

Я пытаюсь преобразовать транскрипт Amazon Transcribe .json в более читабельный транскрипт (т. Е. Тот, который разделяет текст по динамикам). У кого-нибудь есть идеи, как это сделать?
03 окт '18 в 22:21
0 ответов

Настройка Google Cloud Speech API для записи интервью

У меня есть более 100 часов аудио, связанных с видео-интервью для документального фильма, который необходимо транскрибировать в текст - надеюсь, с какими-то маркерами временного кода каждые 30 секунд или около того, чтобы видео можно было легко сопо…
1 ответ

Метка времени аудио с любого языка, учитывая источник звука и точную транскрипцию

Я ищу, чтобы получить примерно точные метки времени для каждого слова в аудиофайле. У меня также есть оригинальный текст для аудио файла, который можно использовать в качестве источника перекрестных ссылок. Это похоже на "извлечение звука", которое,…
11 май '12 в 01:00
1 ответ

Автоматически генерировать стенограмму видео, т.е. субтитры и подписи

Есть ли способ или любой плагин, который может генерировать стенограмму видео для воспроизведения на странице сайта. например, подписи и субтитры к видео на английском языке
15 авг '17 в 14:13
1 ответ

Использование транскрипции Apple

Мне было интересно, можно ли использовать то, что Apple использует для Siri и Dictation, в моем собственном приложении для IOS. Если это возможно, то как бы я это сделал? Если Apple использует третьи лица для расшифровки аудиофайлов, то что это? Ест…
20 окт '15 в 22:09
1 ответ

Как получить чат-чат

Я работаю на службе лазурного бота, бот работает нормально. Как только чат завершен, мне нужно отправить весь разговор по электронной почте в виде расшифровки или. Как этого добиться?
0 ответов

Почему командлет `Start-Transcript` вставляет новые строки, даже когда я использую Write-Host -NoNewline?

Из Start-Transcript: Командлет Start-Transcript создает запись всего сеанса PowerShell или его части в текстовый файл. Стенограмма включает в себя все команды, которые вводит пользователь, и все выходные данные, которые отображаются на консоли. Код …
06 фев '19 в 12:28
0 ответов

Распознавание речи: альтернативные подстроки всегда пустые, достоверность 0 большую часть времени

Я пытаюсь работать с распознаванием речи в iOS, но я думаю, мы не заводим друзей... Я создал SFSpeechRegonizer и установите его делегата соответственно. Теперь я реализую метод делегата следующим образом: func speechRecognitionTask(_ task: SFSpeechR…
0 ответов

Сканирование Scrapy прекращается слишком рано и получение URL-адресов вне выражения регулярного выражения

Цель: Очистить сайт стенограммы мыльной оперы, чтобы получить корпус стенограмм. Стенограммы находятся на страницах в форме http://tvmegasite.net/transcripts/amc/main/2001transcripts.shtml и имеют регулярное выражение: (https?:\/\/?tvmegasite\.net\/…
13 июл '15 в 21:21
1 ответ

Какая строка подходит для представления неразборчивых данных в цифровой гуманитарной транскрипции?

У меня есть цифровое гуманитарное приложение, которое я создаю, где у нас есть куча оцифрованных исторических документов, и студенты будут транскрибировать текст. Вот схема... create_table "documents", force: true do |t| t.string "document_name" t.d…
3 ответа

Аудио-текстовый API?

Существуют ли (бесплатные) API преобразования речи в текст, которые я мог бы использовать с PHP? (Я знаю только PHP и HTML / CSS.) Я хотел бы отправить ему аудиофайл, а затем вернуть транскрипцию.
02 янв '11 в 23:42
0 ответов

Как интегрировать речь Microsoft Azure в текст в клавиатуре iOS?

Работаю над проектом. Наилучшим подходом, кажется, является создание пользовательской клавиатуры, которая выглядит так же, как и существующая клавиатура iOS, только я хотел бы изменить функцию преобразования голоса в текст с использования яблочных р…
1 ответ

Почему я не могу скопировать символы IPA из PDF в Linux?

У меня есть файл PDF с некоторыми фонетическими символами (IPA), такими как: ʤ, ə и т. Д. Если я копирую текст с этими символами, я вставляю текст без них. Linux Mint 17.
27 сен '16 в 20:49
1 ответ

Диалог экспорта / создания диалога? Уотсон Беседа (Помощник)

После завершения разговора в Assistant (Formerly Conversation) - я собираюсь опубликовать стенограмму разговора, опубликовать текстовый или TXT-файл и т. Д. Я не смог выяснить какие-либо методы для этого, надеялся на какие-либо идеи?
1 ответ

Sphinx4 распознавание речи trasncribe демо не работает точно для короткого файла WAV

Я только что реализовал демоверсию транскрибера для транскрибирования аудио файла. Мой аудио файл - это файл.wav, который состоит только из таких имен, как "BHAVIK", ANKIT" "SAGAR" Мой файл грамматики состоит из этого грамматика следующим образом: p…
2 ответа

Используйте CMU sphinx4 для расшифровки нецифровых данных

Недавно я работал над использованием CMU sphinx4 для транскрипции и, в конечном итоге, принудительного выравнивания, то есть выравнивания аудио с его транскриптом. Я нашел проект под названием AutoCap, который в основном сделал то, что я хотел разра…
1 ответ

Расшифровать запись по телефону

Существует определенная организация, которая периодически предоставляет информацию в виде записанного сообщения на "горячей линии". Существует ли какое-либо решение с открытым исходным кодом (или набор компонентов, которые могут быть "соединены" вме…
11 окт '11 в 14:54
2 ответа

Можно ли расшифровать вызов Twilio "как вы говорите"?

Кто-нибудь знает, возможно ли в Twilio создавать несколько аудиозаписей во время разговора на основе своего рода звукового флага или шаблона, например, тишины. Чтобы вы могли запустить обратный вызов в конце каждой части речи, чтобы генерировать тек…
16 сен '13 в 19:14
1 ответ

Google Speech Transcription

Если Google Speech API транскрибирует звук практически в реальном времени, а моя задержка для фактического сервера составляет всего 50 мс, почему я получаю свой окончательный результат транскрипции через 1,6 с? Разве я не должен получить его всего з…