Описание тега transcription
1
ответ
MTURK: скрыть объект в предварительном просмотре, показать, когда вы принимаете HIT (URL изменяется в предварительном просмотре, скрывать в зависимости от URL)
Я использую механический турок Amazon, платформу для выполнения простых задач. Я использую его для расшифровки аудио файлов. Вот мои настройки: я использую базовую веб-форму для создания HIT, вставив аудио-плеер с помощью JWplayer Механический турок…
04 сен '15 в 17:10
0
ответов
Amazon Транскрибируют конвертирование.json транскрипта
Я пытаюсь преобразовать транскрипт Amazon Transcribe .json в более читабельный транскрипт (т. Е. Тот, который разделяет текст по динамикам). У кого-нибудь есть идеи, как это сделать?
03 окт '18 в 22:21
0
ответов
Настройка Google Cloud Speech API для записи интервью
У меня есть более 100 часов аудио, связанных с видео-интервью для документального фильма, который необходимо транскрибировать в текст - надеюсь, с какими-то маркерами временного кода каждые 30 секунд или около того, чтобы видео можно было легко сопо…
27 авг '16 в 06:24
1
ответ
Метка времени аудио с любого языка, учитывая источник звука и точную транскрипцию
Я ищу, чтобы получить примерно точные метки времени для каждого слова в аудиофайле. У меня также есть оригинальный текст для аудио файла, который можно использовать в качестве источника перекрестных ссылок. Это похоже на "извлечение звука", которое,…
11 май '12 в 01:00
1
ответ
Автоматически генерировать стенограмму видео, т.е. субтитры и подписи
Есть ли способ или любой плагин, который может генерировать стенограмму видео для воспроизведения на странице сайта. например, подписи и субтитры к видео на английском языке
15 авг '17 в 14:13
1
ответ
Использование транскрипции Apple
Мне было интересно, можно ли использовать то, что Apple использует для Siri и Dictation, в моем собственном приложении для IOS. Если это возможно, то как бы я это сделал? Если Apple использует третьи лица для расшифровки аудиофайлов, то что это? Ест…
20 окт '15 в 22:09
1
ответ
Как получить чат-чат
Я работаю на службе лазурного бота, бот работает нормально. Как только чат завершен, мне нужно отправить весь разговор по электронной почте в виде расшифровки или. Как этого добиться?
18 янв '19 в 08:15
0
ответов
Почему командлет `Start-Transcript` вставляет новые строки, даже когда я использую Write-Host -NoNewline?
Из Start-Transcript: Командлет Start-Transcript создает запись всего сеанса PowerShell или его части в текстовый файл. Стенограмма включает в себя все команды, которые вводит пользователь, и все выходные данные, которые отображаются на консоли. Код …
06 фев '19 в 12:28
0
ответов
Распознавание речи: альтернативные подстроки всегда пустые, достоверность 0 большую часть времени
Я пытаюсь работать с распознаванием речи в iOS, но я думаю, мы не заводим друзей... Я создал SFSpeechRegonizer и установите его делегата соответственно. Теперь я реализую метод делегата следующим образом: func speechRecognitionTask(_ task: SFSpeechR…
27 дек '18 в 09:07
0
ответов
Сканирование Scrapy прекращается слишком рано и получение URL-адресов вне выражения регулярного выражения
Цель: Очистить сайт стенограммы мыльной оперы, чтобы получить корпус стенограмм. Стенограммы находятся на страницах в форме http://tvmegasite.net/transcripts/amc/main/2001transcripts.shtml и имеют регулярное выражение: (https?:\/\/?tvmegasite\.net\/…
13 июл '15 в 21:21
1
ответ
Какая строка подходит для представления неразборчивых данных в цифровой гуманитарной транскрипции?
У меня есть цифровое гуманитарное приложение, которое я создаю, где у нас есть куча оцифрованных исторических документов, и студенты будут транскрибировать текст. Вот схема... create_table "documents", force: true do |t| t.string "document_name" t.d…
12 сен '14 в 20:17
3
ответа
Аудио-текстовый API?
Существуют ли (бесплатные) API преобразования речи в текст, которые я мог бы использовать с PHP? (Я знаю только PHP и HTML / CSS.) Я хотел бы отправить ему аудиофайл, а затем вернуть транскрипцию.
02 янв '11 в 23:42
0
ответов
Как интегрировать речь Microsoft Azure в текст в клавиатуре iOS?
Работаю над проектом. Наилучшим подходом, кажется, является создание пользовательской клавиатуры, которая выглядит так же, как и существующая клавиатура iOS, только я хотел бы изменить функцию преобразования голоса в текст с использования яблочных р…
13 сен '18 в 19:03
1
ответ
Почему я не могу скопировать символы IPA из PDF в Linux?
У меня есть файл PDF с некоторыми фонетическими символами (IPA), такими как: ʤ, ə и т. Д. Если я копирую текст с этими символами, я вставляю текст без них. Linux Mint 17.
27 сен '16 в 20:49
1
ответ
Диалог экспорта / создания диалога? Уотсон Беседа (Помощник)
После завершения разговора в Assistant (Formerly Conversation) - я собираюсь опубликовать стенограмму разговора, опубликовать текстовый или TXT-файл и т. Д. Я не смог выяснить какие-либо методы для этого, надеялся на какие-либо идеи?
08 апр '18 в 13:33
1
ответ
Sphinx4 распознавание речи trasncribe демо не работает точно для короткого файла WAV
Я только что реализовал демоверсию транскрибера для транскрибирования аудио файла. Мой аудио файл - это файл.wav, который состоит только из таких имен, как "BHAVIK", ANKIT" "SAGAR" Мой файл грамматики состоит из этого грамматика следующим образом: p…
03 сен '12 в 12:30
2
ответа
Используйте CMU sphinx4 для расшифровки нецифровых данных
Недавно я работал над использованием CMU sphinx4 для транскрипции и, в конечном итоге, принудительного выравнивания, то есть выравнивания аудио с его транскриптом. Я нашел проект под названием AutoCap, который в основном сделал то, что я хотел разра…
11 авг '11 в 12:03
1
ответ
Расшифровать запись по телефону
Существует определенная организация, которая периодически предоставляет информацию в виде записанного сообщения на "горячей линии". Существует ли какое-либо решение с открытым исходным кодом (или набор компонентов, которые могут быть "соединены" вме…
11 окт '11 в 14:54
2
ответа
Можно ли расшифровать вызов Twilio "как вы говорите"?
Кто-нибудь знает, возможно ли в Twilio создавать несколько аудиозаписей во время разговора на основе своего рода звукового флага или шаблона, например, тишины. Чтобы вы могли запустить обратный вызов в конце каждой части речи, чтобы генерировать тек…
16 сен '13 в 19:14
1
ответ
Google Speech Transcription
Если Google Speech API транскрибирует звук практически в реальном времени, а моя задержка для фактического сервера составляет всего 50 мс, почему я получаю свой окончательный результат транскрипции через 1,6 с? Разве я не должен получить его всего з…
16 окт '18 в 05:43