PDA

Просмотр полной версии : Переверстка журнала ПК БК из имеющихся djvu



Woland
16.08.2013, 10:52
Нужен совет от тех, кто хорошо разбирается в верстке.
Поигрался я на днях с FineReader 11, хорошая стала штука однако.. Конечно во все нюансы настройки там очень долго въезжать, но уже сразу удалось имеющиеся в инете djvu-образы журналов ПК БК распознать в максимально близком форматировании и стиле к оригинальному виду. Т.е. по идее день работы на журнал и вполне может быть готова печатабельная версия (разве что обложку надо фотошопить дольше). Но вопрос в том, подойдет ли она к тому, чтобы в типографии сделали идентичную копию по всем параметрам - размеру, виду, сшивке и т.п. Потому как получается просто документ с похожим по стилистике и пропорциональности расположения содержимым, но не имеющий строгой верстки. Т.е. если его тупо распечатать постранично на А4, будет неплохо, но это же будет далеко не оригинальный журнал.

Есть так же куча мелочей, с которыми пока не разобрался в самом FineReader, например опция - сохранять максимально близкую к оригиналу стилистику, сохраняет даже факт неровности отсканированного блока текста - как относительно горизонтали/вертикали, так и в плане неровности периметра блока (если текст отсканировался дугой, так и остается дугой после распознавания). Также всякие там настройки шрифтов - как сделать более близкое распознавание шрифтов к оригиналам, как обойти проблему, если какого-то шрифта не будет в системе произвольного читателя документа, но этот шрифт FineReader запрещает интегрировать внутрь pdf (видимо согласно защите авторского права).

http://files.mail.ru/BDE709718ACC4E20A03C93C214FF7C77
в архиве оригинал в ПК БК 1'93 в djvu и pdf-файл, где распознана часть страниц. В целом похоже, но размер шрифтов "гуляет", поля неровными остались, надпись названия журнала в начала распозналась почему-то в двух разных шрифтах.

Надеюсь на ваши советы...

Atari
16.08.2013, 11:19
верстка и файнридер вещи несовместимые.
или делаеется репринт (полная фотокопия) или надо все переделывать заново.

perestoronin
16.08.2013, 21:38
Конечно же надо верстать заново.

Отрисовывать все картинки в векторном формате.
Для вёрстки применять что-то "тяжелее" чем ворд или прямая правка (сохранение в) pdf.

Идеально - изучить что такое (La)TeX, в нем получатся очень качественные книги и журналы.

Файнридер для меня давно уже лишняя, да к тому же не безплатная проприетарная софтина. Текст отлично распознаётся безплатным софтом под линем и денег не нужно за разпознавалки платить, форматировать этот софт даже и не пытается ничего - на выходе просто текст, большего и не нужно, а автоформатирование после файнридера всё равно по прежнему ужасное.

Atari1974
25.10.2013, 12:49
A лично для меня любой хоть и один в один сделанный журнал это все равно новодел. Для меня главное сохранить всю информацию и картинки как было. А каким шрифтом напечатать и на сколько картинки будут отступать от блока текста или края страницы мне не важно. Еще не особо важно что все это будет заново перерисовано. Главное листинг кода нормально перепечатать. Это главный бич нашей старой литературы и книг.
Главное понять цель зачем досконально копировать все до мелочей все равно это уже новодел и исторической ценности не представляет. А вот информация скорректированная и возможно исправленная важна для таких настальгирующих как я.

klingon
25.10.2013, 13:49
Конечно же надо верстать заново.

Отрисовывать все картинки в векторном формате.
Для вёрстки применять что-то "тяжелее" чем ворд или прямая правка (сохранение в) pdf.

Идеально - изучить что такое (La)TeX, в нем получатся очень качественные книги и журналы.

Файнридер для меня давно уже лишняя, да к тому же не безплатная проприетарная софтина. Текст отлично распознаётся безплатным софтом под линем и денег не нужно за разпознавалки платить, форматировать этот софт даже и не пытается ничего - на выходе просто текст, большего и не нужно, а автоформатирование после файнридера всё равно по прежнему ужасное.

Латекс слишком сложен.
Каким именно бесплатным софтом распознавать текст под линуксом? Я до сих пор не нашел сколько-нибудь приемлемого распознавальщика русского текста. Предполагаю куниформ?
Насчет оформления должен подойти Скрибус, благо он кросплатформенный и позволяет получать вменяемый результат.

perestoronin
25.10.2013, 15:58
Латекс слишком сложен.
Слишком сложный офис - любой.
Проще ТеХа может быть только обычный текст без разметки.
С распознаванием текста (только лишь текста без сохранения ненужного форматирования) на русском языке под linux давно проблем нет - gOCR и еще есть другие. Но мне и gOCR достаточно. Вопрос не в том, чтобы распознать, это можно сделать и платным ПО под виндой (с сохранением форматирования, правда это форматирование не то что править тяжко, оно ещё и кривым будет), а чем и в чём сверстать по уму и красиво. А также кто заново иллюстрации отрисует в векторном формате - чтобы идеальные на выходе электронные журналы получились.

Я могу для шаблона пару страниц сделать на LaTeX, на большее увы пока времени нет, разве что в 2014 году. Да и не быстро это - верстать.

klingon
26.10.2013, 00:25
Слишком сложный офис - любой.
Проще ТеХа может быть только обычный текст без разметки.
С распознаванием текста (только лишь текста без сохранения ненужного форматирования) на русском языке под linux давно проблем нет - gOCR и еще есть другие. Но мне и gOCR достаточно. Вопрос не в том, чтобы распознать, это можно сделать и платным ПО под виндой (с сохранением форматирования, правда это форматирование не то что править тяжко, оно ещё и кривым будет), а чем и в чём сверстать по уму и красиво. А также кто заново иллюстрации отрисует в векторном формате - чтобы идеальные на выходе электронные журналы получились.

Я могу для шаблона пару страниц сделать на LaTeX, на большее увы пока времени нет, разве что в 2014 году. Да и не быстро это - верстать.
gocr вроде не поддерживает русский язык? По крайней мере раньше не поддерживал. Впрочем, если проблема с форматированием, то можно сделать в чем угодно, а потом через pdf принтер получить вменяемый результат. ЛатеХ же для пользователя избалованного посложней чем тот же скрибус будет. Да и не каждый ныне имеет склад ума программиста.
Сам все давно хочу освоить Латех, но все остается пока только в мечтах.

perestoronin
26.10.2013, 01:16
gocr вроде не поддерживает
Возможно Вы и правы, я давно уже ничего не распознавал и забыл чем именно в последний раз воспользовался, но то была точно не связка вина с файном, нужды особой в распознавателях не стало, как научился 10 пальцами клавиатуру давить.
Теперь вот вынашиваю в планах сделать, и научиться еще быстрее давить клавиши с помощью такого устройства: http://habrahabr.ru/post/185500/
Подробных обзор подходящих инструментов ocr есть на этом сайте:
https://help.ubuntu.com/community/OCR

Atari1974
14.11.2013, 10:39
Нужен совет от тех, кто хорошо разбирается в верстке.


http://files.mail.ru/BDE709718ACC4E20A03C93C214FF7C77
в архиве оригинал в ПК БК 1'93

Прикольно, прочел впервые первые страницы этого издания.
Узнаю нашу электронику а так же и машины жигули и все остальное которое с завода нужно доводить напильником:)
Поставляемые с завода
компьютеры требуют незначительной доработки:
доработка контроллера НГМД, предотвращающая зависание
компьютера при обращениях к диску
Я вот никак не пойму если это устройство зависало даже при обращении к дисководу то как же это все смогло пройти проверку и начать выпускаться в серийное производство?
Впрочем это офтоп конечно.

Atari1974
14.11.2013, 16:32
производится всё в Китае, тоже требует доводки напильниками, и часто просто нет таких напильников или кривые руки, поэтому очень быстро (примерно через неделю после покупки) перепродается другому "счастливчику", или дарится родственникам.

Ну сейчас мы можем углубиться в политическую дискуссию через рыночные отношения и почему китай поставляет к нам кучу дерьма а в другие "цивилизованные" страны совсем другое. Я бы не путал сегодняшнее положение дел с китайским барахлом которое наши коммерсанты любят покупать за гроши а продавать в тридорого и то что производила наша промышленность в то время.