Это предложение
Т.е. не в текстовом формате?
попробуем FineReader_ом :)
Вид для печати
В этом файл ничего интересного, просто 185 страниц стабличками прошивок, их нужно распознать (сделать OCR) и получить маленькие файлы по 32, 256 и 512 байт.
Если OCR-ить возьмутся несколько человек, то надо согласовать какие страницы кто берет.
Это просто отсканированная документация, без коррекций и прочего. Есть уже "вылизанная" версия, очень качественно упакованная в DjVu всего на 30М, это то же самое, убрана грязь, почищен фон, убраны неактуальные данные (предыдущие версии, листы почерканы просто, есть новые версии тех же страниц), штампы и прочее. У себя я уже большой исходный архив на 1.7GB удалил, мне он не нужен.
А смысл? Хостинги поддерживают докачку, и например, Download Master (бесплатный и удобный) вполне потихоньку может все забрать, полосу ему ограничить и можно даже серфится одновремнно спокойно.
- - - Добавлено - - -
Выкладывайте список, чего у Вас есть, или готовые ссылки на файлы.
Можно и текстовом, но только актуальные вычитанные данные. Разделители типа столбиков и строк таблиц - не нужны. Адреса собственно тоже лишние. То есть - бинарник в 512 байт или его текстовый эквивалент - просто идеальный вариант :)
- - - Добавлено - - -
Вот сюда, я выкладываю все странички с ROM-ами от 2420/2420.01 для распознавания. Выложил отдельными файлами.
По мере распознавания и потери актуальности - файлы будут удаляться. Все желающие могут поучаствовать.
СМ1420.6010 КОНТРОЛЛЕР ИРПС ТЕСТ-ПРОГРАММА.djvu
СМ1420.6010 КОНТРОЛЛЕР ИРПС.djvu
DZ Восьмиканальный мультиплексор
Исходные материалы любезно предоставил dk_spb
- - - Добавлено - - -
А как быть с такимВложение 56512
делать два варианта или только исправленный?
По мелким ПЗУ-шкам есть расхождения. Они расписаны в трех документах - ТО на 2420, ТО на 2420.01 и таблица прошивок 3.414. Самая старая версия у меня это ТО-2420, в ней нет части изменений которые есть в 3.414.
- - - Добавлено - - -
Достаточно исправленный. Я еще у BYTEMAN-а фотки прошивок получил, там тоже есть отличия
Как правило есть два варианта, отличаются одним байтом, обычно отличается версия из 2420.01. Возможно, что-то улучшили/поправили. Я пишу в журнал где какие отличия обнаружились - мелкие ПЗУ набираю ручками, сначала в двоичном виде из 3.414, потом в hex из 2420.01, оно сразу и вылазит, только перепроверить.
- - - Добавлено - - -
Нашлась еще какая-то старая версия пульта, интересно, чем отличается. В машине BYTEMAN-а прошивка пульта уже новая, совпадает с моим листингом из комплекта документов 2420.01.
3.414.003-14 D23 2420/006 ; Программа пульта, разряды 07-00, слои 1/0, старая версия
3.414.003-15 D24 2420/006 ; Программа пульта, разряды 15-08, слои 1/0, старая версия
Распознанные файлы можно в формате .txt, в том виде в котором они из Finereader таблицей экспортируются, будет программка для их верификации.
Распознавать следует только табличку с адресами, шапки и прочее не нужны, пример файлика (для распознаной РЕ3, табуляции можно оставить, тут они на пробел заменены):
Код:00 0 1 1 1 0 1 1 0
01 0 1 1 1 0 1 1 0
02 0 1 1 1 1 0 1 0
03 0 1 1 1 1 0 1 0
04 0 1 1 1 1 0 0 0
05 0 1 1 1 1 0 0 0
06 0 1 1 1 1 1 1 1
07 0 1 1 1 1 1 1 1
10 0 1 1 1 0 1 1 0
11 0 1 1 1 0 1 1 0
12 0 1 1 1 1 0 1 0
13 0 1 1 1 1 0 1 0
14 0 1 1 1 1 0 0 0
15 0 1 1 1 1 0 0 0
16 0 1 1 1 1 1 1 1
17 0 1 1 1 1 1 1 1
20 0 0 1 1 1 1 1 1
21 0 1 1 1 1 1 1 1
22 0 1 0 0 1 1 1 1
23 0 1 1 1 1 1 1 1
24 0 1 1 1 1 1 1 1
25 0 1 1 1 1 1 1 1
26 0 1 1 1 1 1 1 1
27 0 1 1 1 1 1 1 1
30 0 0 1 1 1 1 1 1
31 0 1 1 1 1 1 1 1
31 0 1 1 0 1 1 1 1
33 0 1 0 1 1 1 1 1
34 0 1 1 1 1 1 1 1
35 0 1 1 1 1 1 1 1
36 0 1 1 1 1 1 1 1
37 0 1 1 1 1 1 1 1
Нестрашно, адреса добавлю копи-пастой, разделители легко поменять, пойдет в-общем.
Я пока распознал все мелкие 155РЕ3, немного 556РТ4 и часть печатной микропрограммы, которой нет в 3.414.003.
Также распознан и откорректирован исходник пульта, страница 0 совпала со считанной из реальной машины, ждем остальные страницы от BYTEMAN.
вот отсюда?
получается что делаем одно и тоже.
я пока в таймауте по прерыванию на 21 странице, 18-я меня привела в шок. Не смотря на обучение файнридера и языка распознавания из двух символов 0 и 1 эта зараза, ладно пустые ячейки, так путает 0 и 1, в итоге пришлось половину ручками править.
Те что уже распознаны (до p_019 включительно), оттуда удалены, там сейчас лежат актуальные странички, которые надо распознать.
То, что я буду распознавать в последнюю очередь, написано вот в этом сообщении.
Начинается со страницы p_062.tif. Если хотите пораспознавать другие страницы - сообщите, какие. По мере получения дампов, буду из каталога PAGES файлы удалять.
Если Вы уже распознали дампы p_002-p_019 - все равно присылайте, сделаем сверку, это полезно.
То что там написано не привязано к страницам.
Продолжу с 62 страницы и до упора :). Да, там встречаются страницы "лист изменений" их я пропускаю.