Вернуться   Форум > Университет > Библиотека и Графика
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме
Старый 11.06.2015, 23:07   #1
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
Создание книги из jpeg файлов

Есть отсканированная книга, при попытке собрать, ничего не выходит. Находил много мануалов, но...руки не с того места. Есть книга и в OCR формате с ошибками, но её запрещают заливать, ибо её делал сам, распознавание текста, нет вычитке. Хотел бы объединить сканы. Кто может помочь?

Вот ссылка на архив отсканированной книги
  Ответить с цитированием
Старый 11.06.2015, 23:21   #2
вагонный
Техподдержка
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для вагонный
Регистрация: 26.01.2010
Адрес: 40 км от НН
Сообщения: 3,962
Репутация: 556
nikson1987 сказал(a):
Есть отсканированная книга, при попытке собрать, ничего не выходит. Находил много мануалов, но...руки не с того места. Есть книга и в OCR формате с ошибками, но её запрещают заливать, ибо её делал сам, распознавание текста, нет вычитке. Хотел бы объединить сканы. Кто может помочь?

Вот ссылка на архив отсканированной книги
В результате какой файл желаете получить?
  Ответить с цитированием
Старый 11.06.2015, 23:42   #3
Koliа
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Гуру Форума
Аватар для Koliа
Регистрация: 26.07.2011
Сообщения: 1,822
Репутация: 522
nikson1987 сказал(a):
Есть отсканированная книга, при попытке собрать, ничего не выходит. Находил много мануалов, но...руки не с того места. Есть книга и в OCR формате с ошибками, но её запрещают заливать, ибо её делал сам, распознавание текста, нет вычитке. Хотел бы объединить сканы. Кто может помочь?

Вот ссылка на архив отсканированной книги
Добрый вечер. На форуме есть до сих пор актуальная инструкция по самостоятельному созданию книги в формате PDF из сканов - Как создать PDF файл. Посмотрите, самому делать книгу достаточно интересно, а если возникнут вопросы, пишите здесь, поможем найти ответы.
  Ответить с цитированием
Старый 12.06.2015, 01:47   #4
вагонный
Техподдержка
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для вагонный
Регистрация: 26.01.2010
Адрес: 40 км от НН
Сообщения: 3,962
Репутация: 556
Если на скорую руку, не выравнивая страницы, можно использовать для получения PDF файла программу PDF24 Creator (русский язык в комплекте, бесплатна).
Минут за 15, получаем такой файл.
  Ответить с цитированием
Старый 12.06.2015, 12:01   #5
Koliа
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Гуру Форума
Аватар для Koliа
Регистрация: 26.07.2011
Сообщения: 1,822
Репутация: 522
вагонный сказал(a):
Если на скорую руку, не выравнивая страницы, можно использовать для получения PDF файла программу PDF24 Creator (русский язык в комплекте, бесплатна).
Минут за 15, получаем такой файл.

А если потратить в два раза больше времени, используя ScanTailor и Adobe Acrobat можно получить вот такой результат https://yadi.sk/d/vHf8CY47hDcDY )

п.с. яндексдиск работает с перебоями
  Ответить с цитированием
Старый 12.06.2015, 12:06   #6
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
kolia1984 сказал(a):
А если потратить в два раза больше времени, используя ScanTailor и Adobe Acrobat можно получить вот такой результат https://yadi.sk/d/vHf8CY47hDcDY )

п.с. яндексдиск работает с перебоями

Некоторые страницы, где был темный край, нечитаемы:

Можно в ScanTailor выбрать смешанный режим и увеличить жирность текста до 12 пунктов. Проблемные области на первых страницах перевести в режим картинки.
  Ответить с цитированием
Старый 12.06.2015, 12:08   #7
Koliа
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Гуру Форума
Аватар для Koliа
Регистрация: 26.07.2011
Сообщения: 1,822
Репутация: 522
nb92 сказал(a):
Некоторые страницы (где был темный край) нечитаемы:

Да, верно. Этого можно избежать, если при сканировании разворот книги прижимать к стеклу сканера. Сложно, но результат того стоит.
  Ответить с цитированием
Старый 12.06.2015, 13:56   #8
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Вот такой вариант.
  Ответить с цитированием
Старый 12.06.2015, 18:46   #9
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
Книгу я прижимал к стеклу сканира видать слабо давил.

nb92, kolia1984 Спасибо. Возьму вариант nb92. Если нет возражений, то его и залью. Есть и моя личная работа, как писал распознанный текст, но без вычитки, жаль запрещено и вес куда меньше и смотрится лучше, вот
  Ответить с цитированием
Старый 12.06.2015, 19:20   #10
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Конечно, такой распознанный, переведенный в текст и великолепно отформатированный материал гораздо лучше любых сканов.

Я не контроллер в разделе Библиотека. Поэтому вопрос дилетанта: а что такое вычитка?
Нужно сравнивать текст с исходником?
  Ответить с цитированием
Старый 12.06.2015, 19:28   #11
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
Проверка на грамматические ошибки. В распознанном тексте они могут появится.

На книжных трекерах такие раздачи разрешены, просто качество указывается OCR с ошибками. Но один из редакторов мне запретил заливать мою версию увы
  Ответить с цитированием
Старый 12.06.2015, 19:44   #12
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Так а что мешает текстовый исходник прогнать в том же Ворде, включив Орфографию?
  Ответить с цитированием
Старый 12.06.2015, 20:00   #13
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
Текстовика не осталось, можно просто скопировать, но все переделывать выйдет. Например в программе, что бы получить длинное тире нужно написать "--- и это одна из команд. Те же сноски задаются командой footnote{текст}, а так я копировал текст при создании документа и вставлял его сперва в translit.ru и на сайте проверял орфографию, но были слова, которые сайт не знал, а некоторые подчеркивал как ошибки, хотя в книги это слово было написано именно так.
  Ответить с цитированием
Старый 12.06.2015, 20:19   #14
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Само собой, если много японских имен и фамилий или терминов, то он не будет их знать. Поэтому просто сверяете с оригиналом и жмете Пропустить все.
  Ответить с цитированием
Старый 12.06.2015, 20:27   #15
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
nb92 сказал(a):
Само собой, если много японских имен и фамилий или терминов, то он не будет их знать. Поэтому просто сверяете с оригиналом и жмете Пропустить все.
Так и делал, японские имена пропускал и все же запретили. Вычитка нужна как сказали мне, даже если я и проверял орфографию в программе.
  Ответить с цитированием
Старый 12.06.2015, 21:19   #16
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Мой вариант, к сожалению, не пойдет. Воспользовался онлайн-конвертером, а он мне последовательность страниц перепутал.
А исходники уже удалил.
Сейчас попробую поковыряться с Вашим текстовым вариантом.
  Ответить с цитированием
Старый 12.06.2015, 22:33   #17
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
Воспользуйтесь утилитой ScanTailor.
Она великолепно работает со сканами, автоматически разбивая на страницы, выравнивая, выставляя поля.
Там есть хороший видеоурок на русском.
Режим для всех страниц выставьте смешанный, жирность увеличьте до 12.
И пройдитесь по всем страницам. Часть, что нечитаема можно пометить как картинку.
В отдельной папке после пакетной обработки будут готовые постраничные сканы в tif
Их можно конвертировать в pdf
  Ответить с цитированием
Старый 12.06.2015, 23:48   #18
nikson1987
Главный Кинооператор
Новичок
Регистрация: 18.06.2013
Сообщения: 9
Репутация: 8
Получилось, что то вроде этого, местами не ахти. НЕ понял как оставить картинку в этой программе
  Ответить с цитированием
Старый 13.06.2015, 11:52   #19
nb92
ВИП
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для nb92
Регистрация: 03.11.2011
Адрес: Санкт-Петербург
Сообщения: 4,238
Репутация: 1404
На этапе Вывода, когда просматриваете сканы, на нужной картинке выбираете Зоны картинок и выделяете область, которая нечетко читается (правой клавишей мыши ставятся вершины многоугольника, который и обозначит границы зоны скана, который будет распознан как картинка).
Потом возвращаетесь на вкладку Вывод и видите результат - та часть картинки, которую вы выделите, не будет переводиться в режим черно-белого контрастного изображения, а будет оставлена как цветное изображение.
  Ответить с цитированием
Старый 15.09.2018, 00:29   #20
Рickwick
Зритель
Медаль пользователю. ЗОЛОТОМедаль автору. ЗОЛОТО Великий Гуру
Аватар для Рickwick
Регистрация: 11.04.2013
Адрес: г.Рига.
Сообщения: 3,355
Репутация: 1467
Доброго времени суток всем! Подскажите, пожалуйста, куда можно обратиться на счёт фонов для электронных книг? Может существуют какие-то программы с этими фонами, которые подойдут для запуска на андроиде? Или здесь кто-то в курсе этого?
  Ответить с цитированием
Ответ


Здесь присутствуют: 2 (пользователей - 0 , гостей - 2)
 
Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск



Часовой пояс GMT +3, время: 13:50.