12.08.2018, 01:42 | #1 |
Главный Кинооператор
Любитель
|
ИЗВЛЕЧЕНИЕ СУБТИТРОВ ИЗ МАТРЁШКИ
Начнём с того, что субтитры в матрёшке могут быть двух видов: графические и текстовые. Подходы к ним тоже разные.
ИЗВЛЕЧЕНИЕ ТЕКСТОВЫХ СУБТИТРОВ. 1) Вам понадобится программа MKVToolNix (официальный сайт). Инструкции по инсталляции на вашу конкретную систему найдёте там же. 2) Вторым шагом вы просматриваете дорожки матрёшки. Следующая команда в теминале (Мак), или в командной строке выведет список дорожек вашего видео: mkvmerge -i my_movie.mkv здесь вместо my_movie.mkv проставьте имя (правильный путь) к вашему видеофайлу. Выводимый список примерно такого вида: File 'my-movie.mkv': container: Matroska Track ID 0: video (MPEG-4p10/AVC/h.264) Track ID 1: audio (DTS) Track ID 2: audio (DTS) Track ID 3: subtitles (Srt) Track ID 4: subtitles (Srt) Chapters: 16 entries 2) Как видно, нас интересуют дорожки 3 и 4. Их-то мы и извлекаем следующей командой: mkvextract tracks my-movie.mkv 3:sub3.srt 4:sub4.srt Как видите, с текстовыми субтитрами просто работать. ГРАФИЧЕСКИЕ СУБТИТРЫ С графическими субтитрами дела обстоят посложнее. Их не только извлечь надо, но и распознать надо. Причём есть графические субтитры трудно распознаваемые (иероглифы-арабские, китайские, японские). Хороших автоматизированных программ по распознаванию иероглифов я лично не встречал. Существующие требуют кропотливого ручного ввода, что не является целью этой темы. Поэтому всё дальнейшее будет касаться графических субтитров - не иероглифов. 1) Первый шаг аналгичен извлечению текстовых субтитров. Просматриваем сначала дорожки: mkvmerge -i my_movie.mkv Список дорожек будет подобен этому: File 'my-movie.mkv': container: Matroska Track ID 0: video (MPEG-4p10/AVC/h.264) Track ID 1: audio (DTS) Track ID 2: audio (DTS) Track ID 3: subtitles (VobSub) Track ID 4: subtitles (VobSub) Chapters: 16 entries Как видно дорожки 3 и 4 содержат графические субтитры. Извлекаем их: mkvextract tracks my-movie.mkv 3:sub3.srt 4:sub4.srt Здесь важное отличие: субтитры в отличие от текстовых извлекаются в виде пары sub/idx файлов. 3) Далее вы можете их скормить их какой-нибудь программе OCR-распознавания (находите и устанавливаете себе сами, вроде tesseract. Наиболее простой способ, однако, воспользоваться бесплатной онлайн-службой: Convert Sub/Idx to Srt Результат вас чуть разочарует: вам придётся в некоторых местах исправлять ошибки самим. Однако этот метод онлайн выдаёт наилучшие результаты для матрёшки. ПРИМЕЧАНИЕ Хотя это не касается темы напрямую, дам совет: Для извлечения графических сутитров из DVD используйте программу SubRip. Единственная программа которая даёт точный результат, по моим наблюдениям. Единственная проблема - распознаёт буквы "ы" русского языка как мягкий знак (ь) и вертикальную палочку. Выход такой: 1) при запросе у вас на ввод палочки введите английскую i, а мягкий знак введите как мягкий знак. Тогда в ваших субтитрах все русские "ы" будут парой "ьi". 2) В любой программе редактирования субтиров (AegiSub-лучший) найдите "Заместить"--->ьi на ы. И всё. Лично я извлекаю графические сабы только из DVD, так как результат получается точный, а в рипах ещё и качество их ухудшено, что добавляет ручную работу по распознаванию. Если что-то непонятно, пишите |
12.08.2018, 22:57 | #2 |
Сообщения: n/a
|
А к чему эти упражнения с командной строкой, когда давным-давно есть GUI?
|
16.08.2018, 07:16 | #3 |
Главный Кинооператор
Любитель
|
С командной строкой вам не надо упражняться, если не хотите. Для остальных скажу так: Все существующие GUI являются упрощённой версией командной строки с меньшим функционалом. Так сказать, на дурака. Кроме того некоторые операционки не имеют даже хоть немного стоящей GUI-программы для выполнения подобных задач. Кроме того, обычно такие программы платные или крякнутые, или с глюками. Вместе с платной прогой и кряком в ваш комп заселяются и посторонние процессы. Ну и глупо не знать мощь своего компьютера, то бишь командную строку. Я только предложил самый мощный универсальный путь - без кряков, глюков и отупления вас графическими неполноценными картинками. Например, многие даже не знают, что 50% программ в компе сидят зря и жрут ресурсы. Ну, некоторые GUI-программы совершенные, как тот же SubRip. Такие не жалко держать под рукой |
17.08.2018, 01:52 | #4 |
Сообщения: n/a
|
|
17.08.2018, 02:00 | #5 |
Сообщения: n/a
|
|
19.08.2018, 05:39 | #6 |
Главный Кинооператор
Любитель
|
Отличная прога, согласен. Но на Mac Os X и Linux mkvextract GUI в неё не встроен. Можно решить, что всё - каюк, ничего не поделаешь. Многие хорошие GUI-программы ограничиваются в функционале, как только отходят от своей родной операционки. Но с командной строки есть рабочий аналог. Оно и понятно, те же GUI используют родившиеся задолго до них команды командной строки. Когда говорю об унивесальности только это имею ввиду. GUI-варианта у некоторых OS может не быть, но вариант командной строки почти всегда решает проблему. Насчёт платности, кряков и глюков - чаще всего бесплатная программа с чужой операционки становится платной со следующими оттуда последствиями. Ну, в данном случае, пользователям Windows действительно легче пользоваться GUI-версией mkvextract, раз уж она существует и хороша. Но я надеюсь, что и моя статья некоторым пойдёт на пользу, так как проливает некоторый свет на главные аспекты извлечения субтитров в духе старого времени, когда пользователи ещё не были "чайниками" и кое-что соображали во внутренностях своего компа. Последнее, что хочу добавить: 3 года назад я перешёл с Windows на Mac OS X и никогда не пожалел об этом. С содроганием вспоминаю теперь термины Windows: вирус, бэкап, реестр, антивирус Касперского, чистка системы и переустановка, следящие программы, дефрагментация диска и т.д. Их здесь или нет, или в них нет неободимости. Минус один только: хорошие программы с Windows хочется использовать в полном функционале. Командная строка (Терминал в Mac Os X) это могёт. |
22.08.2018, 15:16 | #7 |
Сообщения: n/a
|
MKVCleaver или MKVCleaver_x64
Про MKVCleaver или MKVCleaver_x64 никто видимо не слышал?
|
22.08.2018, 18:35 | #8 |
Сообщения: n/a
|
|