Просмотр полной версии : ФЛЕЙМ - сжатие ассемблерных файлов архиваторами
HardWareMan
31.12.2016, 17:39
Это 8 мб RAR-архивов, из одних текстов. Степень сжатия текстов 2-3%. Так что при распаковке получается несколько сотен мегабайт текста.
А можно посмотреть скриншот статистики свойств архива? Ато я вот тут с середины 90х пользуюсь разными версиями RARа (от DOS до Win x64 версий) и для текстов лучше 10% сжатия не получал, даже если создавать непрерывный архив (это который с общим словарем и которого не было у простого ZIPа а появился только у 7zip). Вот не верю я что текст можно сжать RARом плотнее 10%.
Извиняюсь, за кодировку, но нижеследующий текст искажён при попытке редактировать на другой машине в свеже инсталлированной Win XP Pro SP1, а надо SP3.
я с середины 90-х пользуюсь разными версиями RAR-а и для текстов лучше 10% сжатия не получал
Я ниÑего, кÑоме ÑекÑÑов вÑкладÑваÑÑ Ð½Ðµ могÑ, Ñ
оÑÑ Ð½Ð°Ð´ÐµÑÑÑ, ÑÑо когда-нибÑÐ´Ñ ÑÑо измениÑÑÑ, Ñ.к вÑеÑа Ñменил модем. Ð*анее вÑÑ
одил в ÐнÑеÑÐ½ÐµÑ ÑеÑез ÑелеÑон 3G, иÑполÑзÑемÑй в каÑеÑÑве модема. ÐÑÑего многие ÑеÑеÑÑÑÑ ÑмнÑе ÑайÑÑ ÑÑиÑали Ð¼ÐµÐ½Ñ ÑелеÑоном, а не компÑÑÑеÑом, оÑÑего и бÑли пÑÐ¾Ð±Ð»ÐµÐ¼Ñ Ñ ÑайÑами (не мог ниÑего ÑкаÑиваÑÑ, - ÑайÑÑ Ð½Ð°Ð³Ð»Ð¾ поÑÑлали веÑÑии пÑогÑамм Ð´Ð»Ñ Ð¼Ð¾Ð±Ð¸Ð»Ñного ÑелеÑона, а веÑÑии Ð´Ð»Ñ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑа ÑкаÑиваÑÑ Ð½Ðµ давали). Ðо ÑвÑ, 2 Ð´Ð½Ñ Ð½Ð°Ð·Ð°Ð´ пÑоизоÑло ÑÑагиÑеÑкое ÑобÑÑие, - доÑогой мобилÑнÑй ÑелеÑон ÑгоÑел в Ñ
лам, не вÑдеÑжал 12 волÑÑ Ð²Ð¼ÐµÑÑо 3.6. ÐенадÑжнÑе нÑне делаÑÑ Ð¼Ð¾Ð±Ð¸Ð»ÑнÑе ÑелеÑонÑ. ÐоÑÑÐ¾Ð¼Ñ Ð¿ÑиÑлоÑÑ ÑмениÑÑ ÐнÑеÑÐ½ÐµÑ Ð°Ð¿Ð¿Ð°ÑаÑÑÑÑ.
ÐекоÑоÑÑе ASM-аÑÑ
Ð¸Ð²Ñ Ñ Ð¼ÐµÐ½Ñ ÑжаÑÑ Ñ ÑакÑоÑом 1%. ÐеллеÑÑиÑÑÐ¸ÐºÑ RAR ÑÐ¶Ð¸Ð¼Ð°ÐµÑ Ð´Ð¾ 10-30%. ÐÑогÑÐ°Ð¼Ð¼Ñ Ð½Ð° СРи ÐаÑкале обÑÑмом до 30Ð ÑжимаÑÑÑÑ Ð½Ð° 8-13%. РболÑÑие аÑÑемблеÑнÑе иÑÑ
одники в ÑÑеднем 3-4%. СожмиÑе аÑÑемблеÑнÑе иÑÑ
одники какой-нибÑÐ´Ñ Ð¿ÑогÑÐ°Ð¼Ð¼Ñ Ð² 70-100 Ðб в неÑколÑкиÑ
ÐµÑ Ð²ÐµÑÑиÑÑ
и Ñами ÑбедиÑеÑÑ. РеÑли комменÑаÑиев Ð½ÐµÑ Ð¸ меÑки малобÑквеннÑÐ µ или аÑÑ
ивиÑÑеÑÑÑ Ð½ÐµÑколÑко Ñелизов, Ñо бÑÐ´ÐµÑ 1%. УÑÑиÑе Ñакже, ÑÑо аÑÑемблеÑнÑе мнемоники Z80 ÑжимаÑÑÑÑ Ð»ÑÑÑе, Ñем мнемоники ÐÐ*580. ÐапÑимеÑ, иÑÑ
одники Ð´Ð»Ñ Ð¡ÐÐЦÐÐÐÐСТРÑжалиÑÑ Ð²Ñего на 10% именно из-за Ñого, ÑÑо они в кодаÑ
ÐÐ*580 (а Ñакже из-за ÑазномаÑÑноÑÑ Ð¸). Ð ÑÑом Ñоже ÑбедиÑеÑÑ (еÑÑÑ Ñ ÐÐ°Ñ Ð½Ð°Ð²ÐµÑно какаÑ-нибÑÐ´Ñ Ð¿ÑогÑамма Ð´Ð»Ñ ÐºÐ¾Ð½Ð²ÐµÑÑии иÑÑ
одников ÐÐ*580 в иÑÑ
одники Z80, кÑÑаÑи пÑогÑамм обÑаÑного назнаÑÐµÐ½Ð¸Ñ Ð² пÑиÑоде не ÑÑÑеÑÑвÑеÑ).
ÐÑÐ¸Ð²Ð¾Ð¶Ñ Ð²ÑбоÑÐºÑ Ð´Ð°Ð½Ð½ÑÑ
о ÑжаÑии лиÑÑ Ð½ÐµÐºÐ¾ÑоÑÑÑ
ÑвоиÑ
аÑÑ
ивов иÑÑ
одников. Ð`олÑÑие ÑиÑÑÑ ÑакÑоÑа ÑжаÑÐ¸Ñ Ð³Ð¾Ð²Ð¾ÑÑÑ Ð¾ ÑазномаÑÑноÑÑ Ð¸ Ñайлов в аÑÑ
иве или о налиÑии в аÑÑ
иве History- и ДОК-тексты, REL-файлы, а иногда и COM-файлы (для ASM 80x86 также TASMX.EXE, TLINK.EXE и другие файлы для трансляции программ для PC).
Привожу список некоторых RAR-архивов с указанием степени их сжатия. Если в архив входят тысячи одинаковых файлов (например драйверов, стандартных INCLUDE-файлов и т.п.), то достигается степень сжатия исходников и 0.5%. Степерь сжатия меньше, где файлы разномастные, а также там где в архив входят History- и ДОК-тексты, REL-файлы, COM-файлы (для ASM-исходников 86-го также TASMX.EXE, TLINK.EXE и другие файлы для трансляции программ для PC).
.
RK-KNGMD.rar - 1115K 1%
NC & LORD.rar - 256K 1%
MICRO-DOS.rar - 281K 1%
CPM 2003.rar - 415K 1%
TURBO-DOS.rar - 496K 2%
EM RK86 OR.rar - 200K 2%
EM_RK86.rar - 252K 2%
EMULATORS.rar - 1815K 3%
CPM 1997.rar - 463K 3%
EKR_drivers.rar - 390K 4%
CPM 1991.rar - 263K 4%
EM_CPM.rar - 340K 5%
S-DOS.rar - 81K 6%
Formaters.rar - 45K 6%
ROM F800.rar - 211K 7%
Raznoe.rar - 180K 7%
FONTS.rar - 347K 7%
CPM 1990.rar - 80K 8%
SPECIALIST.rar - 250K 10%
ALIEN_disasm.rar - 380K 10%
CPM 1992.rar - 82K 14%
Subroutines.rar - 32K 19%
УважаемÑй HardWareMan поздÑавлÑÑ ÐÐ°Ñ Ñ ÐовÑм Ðодом, Ð¶ÐµÐ»Ð°Ñ Ðам ÑÑаÑÑÑÑ Ð¸ ÑÑпеÑ
ов в ÐаÑем Ñ
обби. РлиÑнÑÑ
инÑеÑеÑаÑ
Ñ
оÑелоÑÑ Ð±Ñ Ðам пожелаÑÑ ÑÑаÑÑ Ð¿Ð¾Ð´Ð¾Ð±Ñее к коллегам по Ñ
обби (ÑÑо вÑгоднее, Ñ.к зло вÑегда возвÑаÑаеÑÑÑ).
- - - Добавлено - - -
Извиняюсь, за кодировку, но вышеприведённый текст был редактирован на другой машине в свеже инсталлированной Win XP Pro SP1, а надо SP3. Отчего на этом сайте почему-то при попытке использовать пункт "редактировать" меняется кодировка на 16-ти битную кодировку UTF-8. Т.е при исходном вводе текста всё уходит в нормальной кодировке, но при попытке исправить грамматические ошибки, используя пункт "редактировать" происходит отсылка "мусора", т.е текста в иной кодировке.
Это может исправить только админ сайта или модератор perestoronin. Который уже один раз делал это используя какой-то таинственный внешний сервис: https://2cyr.com/decode/?lang=ru. Не знаю, что это значит и не знаю как это исправить. Это может исправить любой модератор, кто также сумеет воспользоваться эти сервисом. Но модератор может поступить ещё проще. - он может просто взять резервированную исходную версию этого текста (первая версия, то что уходит из пункта "ответить в теме" или "быстрый ответ", всегда при этом глюке в верной кодировке).
Помочь может и обычный продвинутый пользователь, кто выложит исправленный текст моего сообщения в своём сообщении (или пошлёт его мне по личке, но не E-mail-ом), а я его скопирую и вставлю вместо "мусора". Этот текст пишу на другой машине, где могу редактировать русскими буквами. Таким образом у всех появляется возможность научиться пользоваться вышеприведённым сервисом по перекодированию текстов.
Поздравляю всех с Новым Годом ! Новых творческих успехов в области рэтро ЭВМ.
HardWareMan
01.01.2017, 00:01
А если комментариев нет и метки малобуквенные или архивируется несколько релизов, то будет 1%. Учтите также, что ассемблерные мнемоники Z80 сжимаются лучше, чем мнемоники КР580. Например, исходники для СПЕЦИАЛИСТА сжались всего на 10% именно из-за того, что они в кодах КР580 (а также из-за разномастности). В этом тоже убедитесь (есть у Вас наверно какая-нибудь программа для конверсии исходников КР580 в исходники Z80, кстати программ обратного назначения в природе не существует).
Из архива вот этого поста (http://zx-pk.ru/threads/25617-iskhodniki-i-kody-moikh-narabotok-na-z80-pod-spektrum.html) взят файл ZRSH-TXT.$C (да простит меня автор, но я науки ради). Из него удалены все комментарии, сокращены все длинные и не системные метки (в ручную, правда, может чего упустил). Результат сжатия (тестовый файл в аттаче):
http://savepic.ru/12536894.png
http://savepic.ru/12533822.png
http://savepic.ru/12534846.png
Т.е., я даже не достиг 10%. Так я еще раз спрашиваю, откуда 1%? Покажите мне реальный архив с такой степенью сжатия.
PS В свое время интересовался темой и изучал разные алгоритмы (правда не на столько, чтобы написать свой архиватор, но все же). Даже собирал по методичке свои архивные бомбы (https://ru.wikipedia.org/wiki/Zip-%D0%B1%D0%BE%D0%BC%D0%B1%D0%B0). Вот еще интересный вариант. (https://xakep.ru/2015/09/03/png-bomb/)
Ассемблерные исходники жмутся лучше.
При желании можно иметь степень сжатия в 0.5%. Не надо брать крошечные файлики в 30 килобайт, а надо брать многофайловые архивы по 30 Мб. Тогда в них много повторяющихся фрагментов. И надо использовать "непрерывный архив".
HardWareMan Вы декодировали моё сообщение в верную кодировку. Почему не помочь, не избавить модераторов от работы и не выложить декодированный текст, чтобы я мог вставить его в своё сообщение?
HardWareMan
01.01.2017, 16:44
Ассемблерные исходники жмутся лучше.
А я что, бэйсиковские пробую? Было сказано, что ассемблерские, причем именно Z80.
- - - Добавлено - - -
HardWareMan Вы декодировали моё сообщение в верную кодировку. Почему не помочь, не избавить модераторов от работы и не выложить декодированный текст, чтобы я мог вставить его в своё сообщение?
Это Unicode UTF-8 (а не 16). Используйте любой текстовый редактор, умеющий уникод. При этом не копируйте текст напрямую из него. Скопируйте его в обычный нотпад, чтобы он сконвертировался в cp1251. И только потом уже копируйте в браузер.Ну вот, я попробовал бессмысленный набор мнемоник, который повторяется - действительно, при превышении определенного размера процентаж начинает падать стремительно (рост обьема архива замедляется по сравнению с ростом исходных файлов).
При желании можно иметь степень сжатия в 0.5%. Не надо брать крошечные файлики в 30 килобайт, а надо брать многофайловые архивы по 30 Мб. Тогда в них много повторяющихся фрагментов. И надо использовать "непрерывный архив".
"Непрерывный архив" (aka "Solid archive") это архив с общим словарем, о чем я уже говорил. Он действительно помогает, но отказонеустойчив: при повреждении вы не сможете вытащить из него файлы, т.к. они связаны. Для архивации на хранение лучше делать обычный архив + информация для восстановления. Непрерывный архив лучше если надо передать много файлов по сети.
http://savepic.ru/12558428.png
Таким образом, степень сжатия есть показатель качества исходников (обратно пропорционально), верно?
Powered by vBulletin® Version 4.2.5 Copyright © 2024 vBulletin Solutions, Inc. All rights reserved. Перевод: zCarot