Управление звуком для обхода обнаружения идентификатора контента
Я использую функцию "автоматически сгенерированных" субтитров YouTube для генерации транскриптов mp3 файлов. Я делаю это, сначала конвертируя mp3 в пустой mp4, загружая на YouTube, ожидая появления автоматически сгенерированных титров, затем извлекая файл SRT.
Однако проблема, с которой я столкнулся, заключается в том, что некоторые из загруженных мною mp3-файлов помечены как имеющие авторские права на содержание, и поэтому для них не было создано автоматически созданных подписей.
У меня нет желания публиковать mp3-файлы на YouTube, они загружены как незарегистрированные видео, и все, что мне нужно, это файлы SRT. Есть ли способ манипулировать аудио, чтобы обойти систему идентификации контента YouTube? Я пытался изменить высоту звука в Audacity, но не имеет значения, насколько тонким или экстремальным является изменение высоты звука, они по-прежнему помечены как имеющие авторские права на контент. Есть ли что-нибудь еще, что я могу сделать с аудио, кроме регулировки высоты звука, которая может работать?
Я надеюсь, что этот пост не нарушает никаких правил здесь, и я не могу не подчеркнуть, что я не собираюсь публиковать эти mp3, я просто хочу автоматически сгенерированные SRT.
1 ответ
Никто не может знать, как обмануть Content ID
Очевидно, что так как Content ID является частным алгоритмом, разработанным Google, никто не может точно знать, как они обнаруживают защищенное авторским правом аудио в видео.
Но мы можем предположить, что одним из первых, что они сделали, было сделать их алгоритм независимым от высоты тона. В противном случае каждый мог бы легко изменить тональность своих видео и обмануть Content ID.
Как использовать Youtube, чтобы получить ваши субтитры в любом случае
Если я не ошибаюсь, Content ID блокирует вас из-за музыкального контента, а не вокального контента. Таким образом, для решения вашей первоначальной проблемы одним из решений будет обнаружение музыкального контента (на основе спектрального анализа) и вырезание его из исходного аудио. Если проблема связана также с чистым вокальным контентом, вы можете попробовать отфильтровать его, и это может сработать.
Другие решения
Youtube, созданный Google, почему бы не использовать напрямую API речи, который предлагает Google и который, скорее всего, выполняет транскрипцию аудио на Youtube? И если результаты неудовлетворительные, вы можете попробовать другие сервисы (IBM, Microsoft, Amazon и другие имеют свои).