Вернуться   Форум > Университет > Видеораздел
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме
Старый 12.08.2018, 01:42   #1
KniazidisR
Главный Кинооператор
Медаль пользователю. ЗОЛОТО Любитель
Регистрация: 13.08.2016
Адрес: Греция
Сообщения: 199
Репутация: 24
ИЗВЛЕЧЕНИЕ СУБТИТРОВ ИЗ МАТРЁШКИ

Начнём с того, что субтитры в матрёшке могут быть двух видов: графические и текстовые. Подходы к ним тоже разные.

ИЗВЛЕЧЕНИЕ ТЕКСТОВЫХ СУБТИТРОВ.

1) Вам понадобится программа MKVToolNix (официальный сайт). Инструкции по инсталляции на вашу конкретную систему найдёте там же.

2) Вторым шагом вы просматриваете дорожки матрёшки. Следующая команда в теминале (Мак), или в командной строке выведет список дорожек вашего видео:
mkvmerge -i my_movie.mkv

здесь вместо my_movie.mkv проставьте имя (правильный путь) к вашему видеофайлу.

Выводимый список примерно такого вида:

File 'my-movie.mkv': container: Matroska
Track ID 0: video (MPEG-4p10/AVC/h.264)
Track ID 1: audio (DTS)
Track ID 2: audio (DTS)
Track ID 3: subtitles (Srt)
Track ID 4: subtitles (Srt)
Chapters: 16 entries

2) Как видно, нас интересуют дорожки 3 и 4. Их-то мы и извлекаем следующей командой:
mkvextract tracks my-movie.mkv 3:sub3.srt 4:sub4.srt

Как видите, с текстовыми субтитрами просто работать.

ГРАФИЧЕСКИЕ СУБТИТРЫ

С графическими субтитрами дела обстоят посложнее. Их не только извлечь надо, но и распознать надо. Причём есть графические субтитры трудно распознаваемые (иероглифы-арабские, китайские, японские). Хороших автоматизированных программ по распознаванию иероглифов я лично не встречал. Существующие требуют кропотливого ручного ввода, что не является целью этой темы. Поэтому всё дальнейшее будет касаться графических субтитров - не иероглифов.

1) Первый шаг аналгичен извлечению текстовых субтитров. Просматриваем сначала дорожки:

mkvmerge -i my_movie.mkv

Список дорожек будет подобен этому:

File 'my-movie.mkv': container: Matroska
Track ID 0: video (MPEG-4p10/AVC/h.264)
Track ID 1: audio (DTS)
Track ID 2: audio (DTS)
Track ID 3: subtitles (VobSub)
Track ID 4: subtitles (VobSub)
Chapters: 16 entries

Как видно дорожки 3 и 4 содержат графические субтитры. Извлекаем их:

mkvextract tracks my-movie.mkv 3:sub3.srt 4:sub4.srt

Здесь важное отличие: субтитры в отличие от текстовых извлекаются в виде пары sub/idx файлов.

3) Далее вы можете их скормить их какой-нибудь программе OCR-распознавания (находите и устанавливаете себе сами, вроде tesseract. Наиболее простой способ, однако, воспользоваться бесплатной онлайн-службой:

Convert Sub/Idx to Srt

Результат вас чуть разочарует: вам придётся в некоторых местах исправлять ошибки самим. Однако этот метод онлайн выдаёт наилучшие результаты для матрёшки.

ПРИМЕЧАНИЕ

Хотя это не касается темы напрямую, дам совет:
Для извлечения графических сутитров из DVD используйте программу SubRip. Единственная программа которая даёт точный результат, по моим наблюдениям. Единственная проблема - распознаёт буквы "ы" русского языка как мягкий знак (ь) и вертикальную палочку. Выход такой: 1) при запросе у вас на ввод палочки введите английскую i, а мягкий знак введите как мягкий знак. Тогда в ваших субтитрах все русские "ы" будут парой "ьi". 2) В любой программе редактирования субтиров (AegiSub-лучший) найдите "Заместить"--->ьi на ы. И всё.

Лично я извлекаю графические сабы только из DVD, так как результат получается точный, а в рипах ещё и качество их ухудшено, что добавляет ручную работу по распознаванию.

Если что-то непонятно, пишите
  Ответить с цитированием
Старый 12.08.2018, 22:57   #2
AMDG1000
Сообщения: n/a
А к чему эти упражнения с командной строкой, когда давным-давно есть GUI?
  Ответить с цитированием
Старый 16.08.2018, 07:16   #3
KniazidisR
Главный Кинооператор
Медаль пользователю. ЗОЛОТО Любитель
Регистрация: 13.08.2016
Адрес: Греция
Сообщения: 199
Репутация: 24
AMDG1000 сказал(a):
А к чему эти упражнения с командной строкой, когда давным-давно есть GUI?

С командной строкой вам не надо упражняться, если не хотите. Для остальных скажу так: Все существующие GUI являются упрощённой версией командной строки с меньшим функционалом. Так сказать, на дурака. Кроме того некоторые операционки не имеют даже хоть немного стоящей GUI-программы для выполнения подобных задач. Кроме того, обычно такие программы платные или крякнутые, или с глюками. Вместе с платной прогой и кряком в ваш комп заселяются и посторонние процессы. Ну и глупо не знать мощь своего компьютера, то бишь командную строку. Я только предложил самый мощный универсальный путь - без кряков, глюков и отупления вас графическими неполноценными картинками.

Например, многие даже не знают, что 50% программ в компе сидят зря и жрут ресурсы. Ну, некоторые GUI-программы совершенные, как тот же SubRip. Такие не жалко держать под рукой
  Ответить с цитированием
Старый 17.08.2018, 01:52   #4
AMDG1000
Сообщения: n/a
KniazidisR сказал(a):
Все существующие GUI являются упрощённой версией командной строки с меньшим функционалом.
И чем же функционал GUI в данном конкретном случае уступает командной строке? Я с субтитрами в MkvToolNix уже 6 лет работаю и мне ни разу командная строка не понадобилась.
  Ответить с цитированием
Старый 17.08.2018, 02:00   #5
AMDG1000
Сообщения: n/a
KniazidisR сказал(a):
Кроме того, обычно такие программы платные или крякнутые, или с глюками.
Побойтесь бога, MkvToolNix программа бесплатная, а GUI к ней сам автор разрабатывает. О каких кряках и глюках Вы толкуете?
  Ответить с цитированием
Старый 19.08.2018, 05:39   #6
KniazidisR
Главный Кинооператор
Медаль пользователю. ЗОЛОТО Любитель
Регистрация: 13.08.2016
Адрес: Греция
Сообщения: 199
Репутация: 24
AMDG1000 сказал(a):
И чем же функционал GUI в данном конкретном случае уступает командной строке? Я с субтитрами в MkvToolNix уже 6 лет работаю и мне ни разу командная строка не понадобилась.

Отличная прога, согласен. Но на Mac Os X и Linux mkvextract GUI в неё не встроен. Можно решить, что всё - каюк, ничего не поделаешь. Многие хорошие GUI-программы ограничиваются в функционале, как только отходят от своей родной операционки. Но с командной строки есть рабочий аналог. Оно и понятно, те же GUI используют родившиеся задолго до них команды командной строки. Когда говорю об унивесальности только это имею ввиду. GUI-варианта у некоторых OS может не быть, но вариант командной строки почти всегда решает проблему.

Насчёт платности, кряков и глюков - чаще всего бесплатная программа с чужой операционки становится платной со следующими оттуда последствиями.

Ну, в данном случае, пользователям Windows действительно легче пользоваться GUI-версией mkvextract, раз уж она существует и хороша. Но я надеюсь, что и моя статья некоторым пойдёт на пользу, так как проливает некоторый свет на главные аспекты извлечения субтитров в духе старого времени, когда пользователи ещё не были "чайниками" и кое-что соображали во внутренностях своего компа.

Последнее, что хочу добавить: 3 года назад я перешёл с Windows на Mac OS X и никогда не пожалел об этом. С содроганием вспоминаю теперь термины Windows: вирус, бэкап, реестр, антивирус Касперского, чистка системы и переустановка, следящие программы, дефрагментация диска и т.д. Их здесь или нет, или в них нет неободимости. Минус один только: хорошие программы с Windows хочется использовать в полном функционале. Командная строка (Терминал в Mac Os X) это могёт.
  Ответить с цитированием
Старый 22.08.2018, 15:16   #7
Figli1
Сообщения: n/a
MKVCleaver или MKVCleaver_x64

Про MKVCleaver или MKVCleaver_x64 никто видимо не слышал?
  Ответить с цитированием
Старый 22.08.2018, 18:35   #8
AMDG1000
Сообщения: n/a
Figli1 сказал(a):
Про MKVCleaver или MKVCleaver_x64 никто видимо не слышал?
Они тоже только в Windows работают. В Mac и Linux работает Inviska MKV Extract.
  Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей - 0 , гостей - 1)
 
Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск



Часовой пояс GMT +3, время: 15:21.