PDA

Просмотр полной версии : Отсканил книгу. Кто соберет в djvu?



ZX_NOVOSIB
06.08.2014, 21:40
http://files.inbox.lv/ticket/33761e6082f87e70973242c435195ab2617f6d95/Tomsk_Spectrum.rar

Книга про спектрум из Томска. Это мой первый опыт сканирования книги. 300 dpi. JPG. 110 mb. Первые страницы чуть хуже, но читабельны, дальше вроде нормально. До меня не сразу дошло, что можно сканировать не весь A4, а настраивать размер сканируемой области, в общем по разрешению картинки разные получились.

Кстати, в книге есть что-то оригинальное, или сплошная копипаста?

Rindex
06.08.2014, 21:58
300 dpi. JPG

Это не правильно. 600dpi TIFF в градации серого. А так ничего скорее всего не выйдет при переводе.

digger
06.08.2014, 22:41
вот - http://rghost.ru/57327996

ZX_NOVOSIB
06.08.2014, 23:00
Это не правильно. 600dpi TIFF в градации серого. А так ничего скорее всего не выйдет при переводе.
Ага, и потом эти сканы мне бы пришлось по почте кому-нибудь отсылать. Я и эти 110 мб еле-еле выложил, целая эпопея только с выкладыванием получилась, долго рассказывать. А 600dpi TIFF весило бы в 10 раз больше.

---------- Post added at 02:00 ---------- Previous post was at 01:57 ----------


вот - http://rghost.ru/57327996
Спасибо. Качество конечно сильно пострадало... 3 мб из 110 это нехилое сжатие.

Я просто думал может кто-то посерьёзней поколдует над книгой. Подрежет страницы, качество получше сделает. Мож какая-то прога сама умеет лишнее обрезать, выравнивать, подгонять?..

rasmer
06.08.2014, 23:03
на яндексоблако запилил бы....

---------- Post added at 23:03 ---------- Previous post was at 23:00 ----------


Я просто думал может кто-то посерьёзней поколдует над книгой. Подрежет страницы, качество получше сделает. Мож какая-то прога сама умеет лишнее обрезать, выравнивать, подгонять?..Умеет, dev/hands называется, всё очень аккуратно и качественно делает. Поищи в интернетах, вроде билд для винды тоже должен быть... Распознаёт кстати тоже довольно неплохо...

DJs3000
06.08.2014, 23:48
Я и эти 110 мб еле-еле выложил, целая эпопея только с выкладыванием получилась, долго рассказывать. А 600dpi TIFF весило бы в 10 раз больше.

Капец докатились и вернулись во времена дискет
https://cloud.mail.ru
https://disk.yandex.ru
https://drive.google.com

ZX_NOVOSIB
06.08.2014, 23:56
Капец докатились и вернулись во времена дискет
https://cloud.mail.ru
https://disk.yandex.ru
https://drive.google.com
Ну вот типа я не знаю, ага )))
У меня интернет через 3G модем, в сутки 70 мб дается без ограничения скорости. Этого даже на серфинг не хватает. Поэтому пошел к знакомому, у него проводной инет. Но у него как раз инет переглючил. Потом он сам пытался и на маил и на яндекс выложить - у него нихрена не выкладывалось. Пришлось опять к нему идти. В итоге удалось выложить на inbox.lv и то это заняло чуть ли не час.

DJs3000
07.08.2014, 00:03
В Новосибе нет нормального инета? Оо

Addison
07.08.2014, 00:13
Кстати, в книге есть что-то оригинальное, или сплошная копипаста?
В том и дело, что нет. Бегло посмотрел, стандартная книжка, сплошные перепевы, все это есть уже на VT в других книжках.
Это скорее чисто для тебя, чтобы был справочник под рукою в бумажном виде.
Но, в принципе, отдай ее Newart, пусть он ее положит на VT для коллекции, если ее еще там нет.

ZX_NOVOSIB
07.08.2014, 00:41
В Новосибе нет нормального инета? Оо

http://speccy1.mag.su/xas6jb.png

В Москве нет нормальных очков? :)

DJs3000
07.08.2014, 00:42
В Москве нет нормальных очков? :)

Закончились :D

Shadow Maker
07.08.2014, 00:51
Но, в принципе, отдай ее Newart, пусть он ее положит на VT для коллекции, если ее еще там нет.
Каким боком newart к VT относится?

BlastOff
07.08.2014, 04:40
При установке сжатия CCITT на серое изображение можно добиться сжатия не хуже чем при кодировании в jpeg. А если вообще отказаться от градаций и сканить в ч/б с сжатием, то результат будет и того меньше.

scl^mc
07.08.2014, 09:06
а чего не в pdf? :)

denpopov
07.08.2014, 09:32
Не проще ли глянуть на:
http://sourceforge.net/projects/djvu/
http://any2djvu.djvuzone.org

?

gurfunkel
07.08.2014, 13:22
Ну вот типа я не знаю, ага )))
У меня интернет через 3G модем, в сутки 70 мб дается без ограничения скорости. Этого даже на серфинг не хватает.
Может, ты и это знаешь, но на всякий случай скажу. Раньше была программа TrafficCompressor, она сжимала трафик. Но это давно было щас помоему поддержку ее прекратили. Можно ещё в Опере режим Турбо включить, или еще в Яндекс.Браузере есть помоему этот режим.

ZX_NOVOSIB
07.08.2014, 14:33
В том и дело, что нет. Бегло посмотрел, стандартная книжка, сплошные перепевы, все это есть уже на VT в других книжках.
Это скорее чисто для тебя, чтобы был справочник под рукою в бумажном виде.
Но, в принципе, отдай ее Newart, пусть он ее положит на VT для коллекции, если ее еще там нет.
Не, чисто для себя я бы делать не стал, ибо копипаста. Просто я kas29 обещал отсканить. На VT естественно нет, ибо тогда сканирование вообще утратило бы всякий смысл :)

А вот глава "ошибки", страница 122, эта инфа где-то еще встречается?

---------- Post added at 17:19 ---------- Previous post was at 17:17 ----------


а чего не в pdf? :)
А в pdf чем? Скачал несколько прог - гадость полная, токо винду засорили. Снёс всё. То глючит, то код просит, то вообще писец. Интернет сервисы это не для меня, это инет надо нормальный иметь.

---------- Post added at 17:23 ---------- Previous post was at 17:19 ----------


Не проще ли глянуть на:
http://sourceforge.net/projects/djvu/
http://any2djvu.djvuzone.org

?
Второе это онлайн сервис походу, отпадает.
А первое что? Там что-то 9 метров скачать надо. Это инсталятор какой-то, который потом начнет всякую дрянь качать на десятки мегабайт? Или нормальная прога с настройками сжатия, которая поможет сделать нормальную djvu?

Накрайняк придется в дежавю соло делать, там 40 мегабайт получается, зато качество нормальное. Просто думал может кто-то лучше сделает, но видимо придется всё самому делать.

---------- Post added at 17:33 ---------- Previous post was at 17:23 ----------

Скачал ту прогу 9 метров, это просто просмотрщик djvu :/

denpopov
07.08.2014, 14:37
Это инсталятор какой-то, который потом начнет всякую дрянь качать на десятки мегабайт?

ну подожди, попробую поставить и посмотреть на нёё. Соло удобнее, конечно же..

Rindex
07.08.2014, 15:29
Ага, и потом эти сканы мне бы пришлось по почте кому-нибудь отсылать. Я и эти 110 мб еле-еле выложил, целая эпопея только с выкладыванием получилась, долго рассказывать. А 600dpi TIFF весило бы в 10 раз больше.

Ну, если 3G модем, то да. В несколько гигабайт пересылать просто замучаешься. Но как ты понял, с JPG качество упало в разы.

ZX_NOVOSIB
07.08.2014, 16:06
Но как ты понял, с JPG качество упало в разы.
Ты имеешь ввиду первую выложенную в этой теме дежавю размером 3 метра? Ну да, качество упало ниже плинтуса. А если бы было в TIFF (300dpi), то качество бы так не упало?? Ну дык тогда проще JPG сконвертить в TIFF, а потом уже делать дежавю. Ибо исходный JPG хорошего качества. Щас специально сосканил в TIFF - никакой разницы с джипегом не заметил вообще.

P.S. Несколько страниц пересканил. Ща обрезаю свои джипеги, муторное занятие. Как обрежу, с помощью дежавю соло сделаю файл под 40 метров. Короче качество будет в норме )) Но чтоб я еще раз что-то сканил - упаси аллах! :v2_dizzy_tired2:

SlashNet
07.08.2014, 16:36
Для работы со сканами пользуйтесь ScanTailor (http://scantailor.sourceforge.net/?q=ru/about) (обрезка, выравнивание и т.д.)

SAM style
07.08.2014, 20:30
А в pdf чем? Скачал несколько прог - гадость полная, токо винду засорили. Снёс всё. То глючит, то код просит, то вообще писец. Интернет сервисы это не для меня, это инет надо нормальный иметь.convert из imagemagick спасёт, или обязательно надо мышкой тыкать? В djvu не умеет, но в pdf все картинки соберёт.

scl^mc
08.08.2014, 11:56
А в pdf чем? Скачал несколько прог - гадость полная, токо винду засорили. Снёс всё. То глючит, то код просит, то вообще писец. Интернет сервисы это не для меня, это инет надо нормальный иметь.
берешь кучку картинок, берешь faststone, чуть-чуть dev/hands... и все, pdf готов

ZX_NOVOSIB
08.08.2014, 21:37
Архив с джипегами скачало 17 человек, но пришлось всё делать самому. Итак, как и обещал 40-метровая дежавю (http://files.inbox.lv/ticket/cd8bd761288f517483ce9263ed2b569fce18a57e/Tomsk1992.djvu)! Качество в норме, сканы подрезаны, убрано всё лишнее, кое-что пересканил, короче очень даже читабельно!

Рекомендую читать с помощью WinDjView, там жмем F11 и потом страницы щелкаются кнопками мыши, оч. удобно.

Как книгу залить на вирт-трдос? Кому и куда писать?

Rindex
08.08.2014, 21:42
Как книгу залить на вирт-трдос? Кому и куда писать?

Писать Страйкеру, там мыло его написано в контактах. Но он похоже на него забил. Я туда ещё месяца два кучу игр и программ отправил, а обновлений нет... :(

ZX_NOVOSIB
08.08.2014, 22:44
Писать Страйкеру, там мыло его написано в контактах. Но он похоже на него забил. Я туда ещё месяца два кучу игр и программ отправил, а обновлений нет... :(
Там поди до сих пора даже Last Ninja Remix от drbars нету? :eek_std:
Короче надо не мыло, раз он на него забил, а надо как то по-другому на него выходить. Через соц.сети, или еще как. Кто-то же наверняка знает как на него выйти.

dbk
02.05.2019, 14:02
Дайте ссылку на оригинальные файлы из которого вы делали djvu. Спасибо

ZX_NOVOSIB
25.05.2019, 07:32
Дайте ссылку на оригинальные файлы из которого вы делали djvu. Спасибо
Зачем?? )) Оригиналов наверно давно уж нет. Чем дежавю не устраивает? Да и вообще в книге 0% оригинального материала. Ценность книги нулевая.

krotan
25.05.2019, 12:45
Чем дежавю не устраивает? Дежавю сам по себе дерьмовый формат, лучше им не пользоваться. Сходные по начертания буквы заменяет одним и тем же символом, что для технической и научной литературы критично. Например "н" и "и", "Ы" и "bI".

balu_dark
25.05.2019, 13:17
Ну вероятно для того чтобы перевести изображения в текст и уменьшить обьем файла... Не ?

ZX_NOVOSIB
25.05.2019, 18:08
Сходные по начертания буквы заменяет одним и тем же символом
Ничо он не заменяет. Там же просто сканы страниц, нераспознанные )

- - - Добавлено - - -


Не ?
Не.

balu_dark
25.05.2019, 19:47
Не.

А чего вы отвечаете за другого пользователя ? знаете зачем он просит оригинальные сканы ?

ZX_NOVOSIB
25.05.2019, 20:14
Вопрос "не?" - был ответом на мой вопрос :) Значит адресован мне, вот я и ответил ))

krotan
25.05.2019, 23:12
Ничо он не заменяет. Там же просто сканы страниц, нераспознанные ) Я видел, что заменяет. Там не просто сканы, дежавю их дополнительно упаковывает по своему алгоритму.

balu_dark
25.05.2019, 23:32
Вопрос "не?" - был ответом на мой вопрос :) Значит адресован мне, вот я и ответил ))

Тупить не надо - там в сообщении конкретно указано что человеку возможно охота перевести в текст и ваше мнение о конкретном действе не выяснялось. Не указано было в контексте что не надо отбрасывать это возможное желание.
Поэтому отвечать скорее вопрошавшему - зачем ему сканы. Потому как 40 мегабайт это дибилизм. Ладно бы были цветные картинки в высоком разрешении а чернобелый текст.... 40 мегабайт 100 страниц по моему ??? Ну.... на любителя короче...

ZX_NOVOSIB
26.05.2019, 08:13
Тупить не надо
Плюсую, ибо твой 30-ый пост был ответом на мой 28 пост и никак иначе. Я на 30-ый ответил, а потом "почему вы отвечаете за другого пользователя?" :D


человеку возможно охота перевести в текст
Что там переводить в текст? Этот текст уже сто раз переведен, разные картинки на обложках, разные типографии, а текст один и тот же, который уже продублирован десятки раз и на вирте и на прессе.

newart
26.05.2019, 23:12
Дайте ссылочку на книгу. В любом формате.

dbk
27.05.2019, 00:37
Дайте ссылочку на книгу. В любом формате.
Автор полученный djvu выложил тут (https://zx-pk.ru/threads/23861-otskanil-knigu-kto-soberet-v-djvu.html?p=731858&viewfull=1#post731858).

Grand
27.05.2019, 07:22
Дежавю сам по себе дерьмовый формат, лучше им не пользоваться. Сходные по начертания буквы заменяет одним и тем же символом, что для технической и научной литературы критично. Например "н" и "и", "Ы" и "bI".Если грамотно настроить профили кодирования - этих проблем не будет.

CodeMaster
27.05.2019, 08:07
Дайте ссылку

Зачем?? ))

Ну вероятно для того... He?

Не.


Плюсую, ибо твой 30-ый пост был ответом на мой 28 пост и никак иначе.
Он был ответом тебе, но это было предположение и вопрос был для dbk для подтверждения этого предположения. ИМХО это очевидно.

krotan
27.05.2019, 15:19
Если грамотно настроить профили кодирования - этих проблем не будет. Ну тогда расскажи как их настроить, я не смог...

Grand
28.05.2019, 17:22
Ну тогда расскажи как их настроить, я не смог...Охотно :)

Однобитные (бинаризованные) сканы я чаще всего кодирую в DjVu при помощи программы DjVu Small:

http://saveimg.ru/thumbnails/28-05-19/14339ccc5caa4d26ddcb5734e50896ee.PNG (http://saveimg.ru/show-image.php?id=2a61d53c1a151b63244775df51d9f59f)

- - - Добавлено - - -

Цветные сканы я перевожу в 256-цветные и далее использую пакет Document Express Enterprise 5:
кодируя в Workflow Manager, предварительно создав профиль в Configuration Manager.

Configuration Manager позволяет создавать свои профили на основе более 50 стандартных и тут же проверить их на одном скане. Вот часть настроек профиля, который я подбирал для "серых" сканов, когда создавал DjVu-книгу Elite. Space Traders Flight Training Manual:

http://saveimg.ru/thumbnails/28-05-19/24eb1ceb8f1315c652e6b0beb73b3745.jpg (http://saveimg.ru/show-image.php?id=a077fa1d269f145d755da2b0188dfa53)

krotan
28.05.2019, 18:57
использую пакет Document Express Enterprise 5 Спасибо! Нашёл Document Express Editor 6 Portable сборка от irokkezz. Буду обкатывать...

Grand
28.05.2019, 19:14
Нашёл Document Express Editor 6 Portable сборка от irokkezz. Буду обкатывать...Это другое: редактор для готовых DjVu-документов. В нем можно компоновать единый документ из других, созданными разными профилями, расставлять гиперссылки и т.д.

krotan
28.05.2019, 19:28
Это другое: редактор для готовых DjVu-документов. Спасибо. Вот такой видимо подойдёт?:
Document Express Enterprise with DjVu 5.1 build 946 (Light Edition)

Grand
29.05.2019, 04:31
Спасибо. Вот такой видимо подойдёт?:
Document Express Enterprise with DjVu 5.1 build 946 (Light Edition)Да. Light Edition - очевидно значит без поддержки OCR. Впрочем, я если и распознаю текст для DjVu, то в Fine Reader'е.

Вот старенький, но интересный сайт, как делать DjVu:
http://djvu-soft.narod.ru

Можно найти и другие публикации.

krotan
29.05.2019, 04:47
Да. Light Edition - очевидно значит без поддержки OCR. Пишут: удалены IRIS OCR, Asian Support, Docs.

Grand
29.05.2019, 16:26
Пишут: удалены IRIS OCR, Asian Support, Docs.Для наших задачь достаточно.



Вообще, закодировать сканы - это дело не сложное. Сложнее их перед этим обработать. Тут могут потребоваться и графические редакторы, и специальные программы, например Book Restorer. Нужно стремиться к минимальному размеру файла электронной книги. Маленький файл не только занимает меньше места на носителе, но и быстрее открывается, а это важно для мобильных устройств.

Вот несколько примеров качественных DjVu от меня: здесь, здесь и здесь.



Но заниматься сканами имеет смысл только, если мы хотим увековечить художественное оформление книги. Если достаточно только текста и иллюстраций, то можно сделать электронную книгу, например, в формате FB2.