Важная информация

User Tag List

Показано с 1 по 7 из 7

Тема: ФЛЕЙМ - сжатие ассемблерных файлов архиваторами

  1. #1
    Guru Аватар для HardWareMan
    Регистрация
    26.02.2011
    Адрес
    г. Павлодар, Казахстан
    Сообщений
    4,404
    Спасибо Благодарностей отдано 
    319
    Спасибо Благодарностей получено 
    598
    Поблагодарили
    444 сообщений
    Mentioned
    10 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию ФЛЕЙМ - сжатие ассемблерных файлов архиваторами

    Цитата Сообщение от barsik Посмотреть сообщение
    Это 8 мб RAR-архивов, из одних текстов. Степень сжатия текстов 2-3%. Так что при распаковке получается несколько сотен мегабайт текста.
    А можно посмотреть скриншот статистики свойств архива? Ато я вот тут с середины 90х пользуюсь разными версиями RARа (от DOS до Win x64 версий) и для текстов лучше 10% сжатия не получал, даже если создавать непрерывный архив (это который с общим словарем и которого не было у простого ZIPа а появился только у 7zip). Вот не верю я что текст можно сжать RARом плотнее 10%.

  2. #1
    С любовью к вам, Yandex.Direct
    Размещение рекламы на форуме способствует его дальнейшему развитию

  3. #2
    Banned
    Регистрация
    05.10.2016
    Адрес
    г. Санкт-Петербург
    Сообщений
    1,080
    Спасибо Благодарностей отдано 
    0
    Спасибо Благодарностей получено 
    5
    Поблагодарили
    5 сообщений
    Mentioned
    1 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Извиняюсь, за кодировку, но нижеследующий текст искажён при попытке редактировать на другой машине в свеже инсталлированной Win XP Pro SP1, а надо SP3.

    Цитата Сообщение от HardWareMan
    я с середины 90-х пользуюсь разными версиями RAR-а и для текстов лучше 10% сжатия не получал
    Я ничего, кроме текстов выкладывать не могу, хотя надеюсь, что когда-нибудь это изменится, т.к вчера сменил модем. Ð*анее выходил в Интернет через телефон 3G, используемый в качестве модема. Отчего многие чересчур умные сайты считали меня телефоном, а не компьютером, отчего и были проблемы с сайтами (не мог ничего скачивать, - сайты нагло посылали версии программ для мобильного телефона, а версии для компьютера скачивать не давали). Но увы, 2 дня назад произошло трагическое событие, - дорогой мобильный телефон сгорел в хлам, не выдержал 12 вольт вместо 3.6. Ненадёжные ныне делают мобильные телефоны. Поэтому пришлось сменить Интернет аппаратуру.

    Некоторые ASM-архивы у меня сжаты с фактором 1%. Ð‘ÐµÐ»Ð»ÐµÑ‚Ñ€Ð¸ÑÑ‚Ð¸ÐºÑ ƒ RAR сжимает до 10-30%. Программы на СИ и Паскале объёмом до 30К сжимаются на 8-13%. А большие ассемблерные исходники в среднем 3-4%. Сожмите ассемблерные исходники какой-нибудь программы в 70-100 Кб в нескольких её версиях и сами убедитесь. А если комментариев нет и метки малобуквенныРµ или архивируется несколько релизов, то будет 1%. Учтите также, что ассемблерные мнемоники Z80 сжимаются лучше, чем мнемоники КÐ*580. Например, исходники для СПЕЦИАЛИСТА сжались всего на 10% именно из-за того, что они в кодах КÐ*580 (а также из-за Ñ€Ð°Ð·Ð½Ð¾Ð¼Ð°ÑÑ‚Ð½Ð¾ÑÑ ‚и). В этом тоже убедитесь (есть у Вас наверно какая-нибудь программа для конверсии исходников КÐ*580 в исходники Z80, кстати программ обратного назначения в природе не существует).

    Привожу выборку данных о сжатии лишь некоторых своих архивов исходников. Б`ольшие цифры фактора сжатия говорят о Ñ€Ð°Ð·Ð½Ð¾Ð¼Ð°ÑÑ‚Ð½Ð¾ÑÑ ‚и файлов в архиве или о наличии в архиве History- и ДОК-тексты, REL-файлы, а иногда и COM-файлы (для ASM 80x86 также TASMX.EXE, TLINK.EXE и другие файлы для трансляции программ для PC).

    Привожу список некоторых RAR-архивов с указанием степени их сжатия. Если в архив входят тысячи одинаковых файлов (например драйверов, стандартных INCLUDE-файлов и т.п.), то достигается степень сжатия исходников и 0.5%. Степерь сжатия меньше, где файлы разномастные, а также там где в архив входят History- и ДОК-тексты, REL-файлы, COM-файлы (для ASM-исходников 86-го также TASMX.EXE, TLINK.EXE и другие файлы для трансляции программ для PC).

    Код:
    .
    RK-KNGMD”.rar     - 1115Kš 1%
    NC & LORD.rar    - 256K  1%
    MICRO-DOS.rar    - 281K  1%
    CPM 2003.rar     - 415Kš  1%
    TURBO-DOS.rar    - 496K  2%
    EM RK86 OR.rar   - 200K  2%
    EM_RK86.rar      - 252Kš  2%
    EMULATORS.rar    - 1815Kš 3%
    CPM 1997.rar     - 463Kš  3%
    EKR_drivers.rar  - 390Kš  4%
    CPM 1991.rar     - 263Kš  4%
    EM_CPM.rar       - 340Kš  5%
    S-DOS.rar        - 81K   6%
    Formaters‹.rar    - 45K   6%
    ROM F800.rar     - 211K  7%
    Raznoe.rar       - 180K  7%
    FONTS‹.rar        - 347Kš  7%
    CPM 1990.rar	 - 80K   8%
    SPECIALIST.rar   - 250Kš  10% 
    ALIEN_disasm.rar - 380K  10% 
    CPM 1992.rar     - 82K   14%
    Subroutines.rar  - 32Kš   19%
    Уважаемый HardWareMan поздравляю Вас с Новым Годом, желаю Вам счастья и успехов в Вашем хобби. В личных интересах хотелось бы Вам пожелать стать подобрее к коллегам по хобби (это выгоднее, т.к зло всегда возвращается).

    - - - Добавлено - - -

    Извиняюсь, за кодировку, но вышеприведённый текст был редактирован на другой машине в свеже инсталлированной Win XP Pro SP1, а надо SP3. Отчего на этом сайте почему-то при попытке использовать пункт "редактировать" меняется кодировка на 16-ти битную кодировку UTF-8. Т.е при исходном вводе текста всё уходит в нормальной кодировке, но при попытке исправить грамматические ошибки, используя пункт "редактировать" происходит отсылка "мусора", т.е текста в иной кодировке.

    Это может исправить только админ сайта или модератор perestoronin. Который уже один раз делал это используя какой-то таинственный внешний сервис: https://2cyr.com/decode/?lang=ru. Не знаю, что это значит и не знаю как это исправить. Это может исправить любой модератор, кто также сумеет воспользоваться эти сервисом. Но модератор может поступить ещё проще. - он может просто взять резервированную исходную версию этого текста (первая версия, то что уходит из пункта "ответить в теме" или "быстрый ответ", всегда при этом глюке в верной кодировке).

    Помочь может и обычный продвинутый пользователь, кто выложит исправленный текст моего сообщения в своём сообщении (или пошлёт его мне по личке, но не E-mail-ом), а я его скопирую и вставлю вместо "мусора". Этот текст пишу на другой машине, где могу редактировать русскими буквами. Таким образом у всех появляется возможность научиться пользоваться вышеприведённым сервисом по перекодированию текстов.

    Поздравляю всех с Новым Годом ! Новых творческих успехов в области рэтро ЭВМ.
    Последний раз редактировалось barsik; 01.01.2017 в 09:13.

  4. #3
    Member
    Регистрация
    23.01.2016
    Адрес
    г. Омск
    Сообщений
    189
    Спасибо Благодарностей отдано 
    11
    Спасибо Благодарностей получено 
    2
    Поблагодарили
    2 сообщений
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Заген зи мир битте цурюк
    Радио-86РК-SRAM, Орион-128 512, ОРИОН-ПРО 3.2, ZXM-Phoenix 05.2 (+VGA), ПОИСК-2, Xi 8088, Micro 8088

  5. #4
    Guru Аватар для HardWareMan
    Регистрация
    26.02.2011
    Адрес
    г. Павлодар, Казахстан
    Сообщений
    4,404
    Спасибо Благодарностей отдано 
    319
    Спасибо Благодарностей получено 
    598
    Поблагодарили
    444 сообщений
    Mentioned
    10 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от barsik Посмотреть сообщение
    А если комментариев нет и метки малобуквенные или архивируется несколько релизов, то будет 1%. Учтите также, что ассемблерные мнемоники Z80 сжимаются лучше, чем мнемоники КР580. Например, исходники для СПЕЦИАЛИСТА сжались всего на 10% именно из-за того, что они в кодах КР580 (а также из-за разномастности). В этом тоже убедитесь (есть у Вас наверно какая-нибудь программа для конверсии исходников КР580 в исходники Z80, кстати программ обратного назначения в природе не существует).
    Из архива вот этого поста взят файл ZRSH-TXT.$C (да простит меня автор, но я науки ради). Из него удалены все комментарии, сокращены все длинные и не системные метки (в ручную, правда, может чего упустил). Результат сжатия (тестовый файл в аттаче):



    Т.е., я даже не достиг 10%. Так я еще раз спрашиваю, откуда 1%? Покажите мне реальный архив с такой степенью сжатия.

    PS В свое время интересовался темой и изучал разные алгоритмы (правда не на столько, чтобы написать свой архиватор, но все же). Даже собирал по методичке свои архивные бомбы. Вот еще интересный вариант.

  6. #5
    Guru
    Регистрация
    24.01.2008
    Адрес
    Уфа
    Сообщений
    3,847
    Спасибо Благодарностей отдано 
    84
    Спасибо Благодарностей получено 
    229
    Поблагодарили
    167 сообщений
    Mentioned
    9 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Ассемблерные исходники жмутся лучше.

  7. #6
    Banned
    Регистрация
    05.10.2016
    Адрес
    г. Санкт-Петербург
    Сообщений
    1,080
    Спасибо Благодарностей отдано 
    0
    Спасибо Благодарностей получено 
    5
    Поблагодарили
    5 сообщений
    Mentioned
    1 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    При желании можно иметь степень сжатия в 0.5%. Не надо брать крошечные файлики в 30 килобайт, а надо брать многофайловые архивы по 30 Мб. Тогда в них много повторяющихся фрагментов. И надо использовать "непрерывный архив".

    HardWareMan Вы декодировали моё сообщение в верную кодировку. Почему не помочь, не избавить модераторов от работы и не выложить декодированный текст, чтобы я мог вставить его в своё сообщение?
    Миниатюры Миниатюры Нажмите на изображение для увеличения. 

Название:	Сжатие исходников.jpg 
Просмотров:	94 
Размер:	19.7 Кб 
ID:	59178  
    Последний раз редактировалось barsik; 01.01.2017 в 15:51.

  8. #7
    Guru Аватар для HardWareMan
    Регистрация
    26.02.2011
    Адрес
    г. Павлодар, Казахстан
    Сообщений
    4,404
    Спасибо Благодарностей отдано 
    319
    Спасибо Благодарностей получено 
    598
    Поблагодарили
    444 сообщений
    Mentioned
    10 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от b2m Посмотреть сообщение
    Ассемблерные исходники жмутся лучше.
    А я что, бэйсиковские пробую? Было сказано, что ассемблерские, причем именно Z80.

    - - - Добавлено - - -
    Цитата Сообщение от barsik Посмотреть сообщение
    HardWareMan Вы декодировали моё сообщение в верную кодировку. Почему не помочь, не избавить модераторов от работы и не выложить декодированный текст, чтобы я мог вставить его в своё сообщение?
    Это Unicode UTF-8 (а не 16). Используйте любой текстовый редактор, умеющий уникод. При этом не копируйте текст напрямую из него. Скопируйте его в обычный нотпад, чтобы он сконвертировался в cp1251. И только потом уже копируйте в браузер.Ну вот, я попробовал бессмысленный набор мнемоник, который повторяется - действительно, при превышении определенного размера процентаж начинает падать стремительно (рост обьема архива замедляется по сравнению с ростом исходных файлов).

    Цитата Сообщение от barsik Посмотреть сообщение
    При желании можно иметь степень сжатия в 0.5%. Не надо брать крошечные файлики в 30 килобайт, а надо брать многофайловые архивы по 30 Мб. Тогда в них много повторяющихся фрагментов. И надо использовать "непрерывный архив".
    "Непрерывный архив" (aka "Solid archive") это архив с общим словарем, о чем я уже говорил. Он действительно помогает, но отказонеустойчив: при повреждении вы не сможете вытащить из него файлы, т.к. они связаны. Для архивации на хранение лучше делать обычный архив + информация для восстановления. Непрерывный архив лучше если надо передать много файлов по сети.

    Таким образом, степень сжатия есть показатель качества исходников (обратно пропорционально), верно?

Информация о теме

Пользователи, просматривающие эту тему

Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)

Похожие темы

  1. Сжатие и упаковка - обсуждение и сравнения
    от introspec в разделе Программирование
    Ответов: 107
    Последнее: 01.04.2023, 16:58
  2. Сжатие и упаковка. hrum3.5, hrust1, hrust2, laser compact x.x.
    от Hrumer в разделе Программирование
    Ответов: 113
    Последнее: 02.01.2020, 14:52
  3. Архивирование, сжатие, упаковка.
    от GriV в разделе Программирование
    Ответов: 30
    Последнее: 22.07.2019, 17:25
  4. RLE сжатие (покритикуйте)
    от Vladson в разделе Программирование
    Ответов: 12
    Последнее: 16.03.2008, 12:29

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •