Отсканировал книгу " Полный дизассемблер ПЗУ ZX-Spectrum " в русском переводе от Програм-АСС, перевёл в djvu, 50 mb в фотокачестве.
Вид для печати
Отсканировал книгу " Полный дизассемблер ПЗУ ZX-Spectrum " в русском переводе от Програм-АСС, перевёл в djvu, 50 mb в фотокачестве.
Возьмется ли какой боец за конвертирование книги в удобочитаемый формат?
Оригинал хренового качества, после скана контрастности бы добавить, шумы убрать, тогда бы распозналось отлично.
У автора остались сканы страниц в jpeg?
Выложил jpeg-и: http://narod.ru/disk/4870594001/romdisasm.rar.html
XXX
X5X
816
Не ну блин сколько можно то одно и тоже, может все таки кто то возьмет на себя труд и переведет это в голый текст? Буржуйские коменты конечно сойдут, но на великом могучем гораздо кошернее.
FineReader с таким мусором на изображении не распознает, а вручную с нуля... вряд-ли найдется герой.Цитата:
Сообщение от savelij
Количество просмотров темы - 1103.
Даже суперхиро с таким качеством - не под силу, а вот если бы из этой тысячи хотя бы человек 30 каждый по 10 страниц "отреставрировали" - это вполне возможно, ридером пройти ,а потом вычитать\исправить что получилось, скинуть сюда в формате Word, ну и потом скомпилировать до "кучи" :) Только обязательно оригинальный дамп ПЗУ нужен, с которого это писалось, для вичитывания и сравненийя по адресам
Идея дельная. Предложил - записывай в список желающих, координируй, первые 10 листов бери. Я подпишусь на следующую 20ку;)Цитата:
Сообщение от zebest
Берите меня к себе - возьму 10 листов на обработку, пусть только мне объяснят в каком виде и как надо обрабатывать :)
Для сверки, в качестве базиса (удобнее по "рыбе" править) берем эти документики:
ftp://ftp.worldofspectrum.org/pub/si...ssemblyThe.pdf
ftp://ftp.worldofspectrum.org/pub/si...ssemblyThe.txt
Итого:
zebest - листы 1-10
spensor - листы 11-20
prusak - листы 21-30
ewgeny7 - листы 31-40
Я правильно понял?
ну четверо желающих - уже гут. Только давайте так - отписываемся, чтобы не было путаницы. по 10. зНачит пусть у меня первые 10, с 1 стр по 10, второй берет с 11 по 20, дальше 21-30 и т.д. и отписываться кто-что взял.
попробую сперва файнридерами, потом видно будет:)
---------- Post added at 17:57 ---------- Previous post was at 17:56 ----------
почти одновремЁнно:) понили значит все правильно
Берите за основу англоязычный вариант, весьма облегчается обработка, это не говоря про то что вероятность ошибки близка к 0% - рядом английский текст, который все более-менее понимают, процедуры уже вычещены. Файнрид тут только лишние глюки привнесет, буквочки в скане-оригинале такие, что чтобы понять фразу приходится на английский вариант посматривать.Цитата:
Сообщение от zebest
Если набирать в Word, то как быть с параметрами документа (шрифт, отступы, абзацы и т.п.)? Если каждый будет делать по-своему, то как потом все эти файлы вместе в одну книгу свести, ведь каждые 10 страниц будут по-разному?
И я так понимаю, что под номерами листов имеется в виду нумерация страниц в оригинальной русской книге, а не сканированные по развороту два листа?
главное текст, а отступы и прочие рюшки можно потом сделать.
docs.google.com ?
совместная работа над документом
история версий
сразу видно готовую работу ...
оформи, будем там, если удобно.
далее.
Выкладываю первые 8 страниц, с моим форматированием. Ругайте. Предлагайте.
формат Word 2003, шрифт стандартный ТаймсНьюРоман, 12-14 кегль, по тексту видно где какой. форматирование старался делать табуляцией, где возможно, где слипаются операнды - пробелами, (а шо делать). Занятие тоскливое, поэтомуу оставшиеся страницы - точно не сего дня. Кое-где - художественная правка по смыслу и по ангельскомуу тексту, правьте, если не так. перевод местами ужасный, но для тех лет - вполне сносный.
ps - нумерацию страниц пока предлагаю не делать, я лично не знаю как от нее избавиться, в случае если что не так. Поэтомуу каждый следит за своими 10 страницами сам, потом или подклеивает к общей, или выкладывает свой кусок.
Беру 10 листов: 41-50.
Я смутно представляю как можно будет потом склеить между собой всё полученные сейчас куски текста. Каждый делает по-своему, это же потом при склейке можно запариться всё приводить к одному виду, по сути придётся переформатировать всю книгу. Кто-то табуляцией делает отступы. Мне, допустим, удобнее это в виде таблицы оформить. Уже вразнобой всё идёт.
Всё же по моему мнению нужен какой-то общий шаблон текста, куда бы каждый потом просто вписывал свой текст.
Prusak, набирайте в plain txt, тогда вопросов со склейкой не будет.
еще раз предлагаю docs.google
для примера загрузил кусок имени zebest
вот на него ссылка https://docs.google.com/document/d/1...thkey=CJP9n9UE
по идее все имеют право на редактирование
там будет история изменений
можно работать паралельно
по поводу форматирования - вариант с plaintext очень даже рулит
т.к. потом можно будет сделать форматер в любой формат
Уже два раза предложил, наступил третий:) Берите за основу англоязычный вариант книги с WOS и корректируйте. Уже готовая "рыба", 80% информации даже корректировать не надо; форматирование однозначное; да, чистый TXT, но когда в финале будет оформляться, будет минимум мороки.Цитата:
Сообщение от Prusak
PS: Кажется разумным начиная с поста #11 выделить в отдельный топик, а zebest вести учет желающих поучавствовать в переводе книги и состояние по готовности, в шапке будет сразу все видно.
spensor, собственно как раз делал ;)
https://docs.google.com/document/d/1...thkey=CIXoub0K
это залиты ENGLISH документ
можете его редактировать ...
Мои 31-40, подтверждаю.
Взял для корректировки .txt с ВОСа, "область перевода" смотрю по .djvu русского варианта.
Работаю в ворде2003, Times New Roman, togg 12, 14.
стр. 101 - plain text, пробелы, без табуляции
Ну и я тогда добавлю образец моей писанины (стр.31), в ПДФе.
хотя... ладно, будем также ориентироваться на книгу на русском.
стр. 102
Syntal, у Вас русский столбец сдвинут влево на два символа относительно английского текста с WOS. Поправьте.
http://zx.pk.ru/showpost.php?p=386891&postcount=29
---------- Post added at 12:14 ---------- Previous post was at 12:05 ----------
добавил в docs.google.com "карту перевода"
---------- Post added at 12:24 ---------- Previous post was at 12:14 ----------
кстати, еще один + в сторону plaintext
после "обработки" можно будет скриптом сравнить eng/rus версию и проверить не потерялось ли чего.
это достаточно важно.
подправленные 101,102 и 103
Сорри, google.docs тормозит безбожно