Упаковщики

Вид для печати

Показывать 40 сообщений этой темы на одной странице

03.08.2021, 11:21
grf

Упаковщики

Какие есть упаковщики графики и кода для БК, кроме KOMP2?
03.08.2021, 13:10
gid

Bkpack. Я только им и пользовался. Единственный из упаковщиков такого типа который мне нравился.
03.08.2021, 13:47
grf

Цитата:

Сообщение от gid

Bkpack. Я только им и пользовался. Единственный из упаковщиков такого типа который мне нравился.

Спасибо, попробую найти и заюзать)
03.08.2021, 15:10
Manwe

Цитата:

Сообщение от grf

Какие есть упаковщики графики и кода для БК, кроме KOMP2?

Советую LZSA
03.08.2021, 15:51
grf

Цитата:

Сообщение от Manwe

Советую LZSA

Спасибо! Но это только распаковщик. Упаковывать предполагается на PC?
03.08.2021, 18:20
jerri

Цитата:

Сообщение от grf

Спасибо! Но это только распаковщик. Упаковывать предполагается на PC?

а в чем проблема - это же удобно.

могу предложить еще вот такой упаковщик. zx0

распаковщик есть и под PDP11
03.08.2021, 18:25
reddie

Цитата:

Сообщение от jerri

распаковщик правда под z80
но переписать как мне кажется трудностей не составит

Интересующимся могу предложить глянуть Спектрумовские жамкалки скринов и данных, работали неплохо.
Для данных вообще была прога, создающая sfx-архивы - Hrust. Упаковщик картинок, по памяти - ASC Screen Crasher.
В свое время Писишники переделывали Hrust/Dehrust для распаковки интрух, настолько мало он весил =)
03.08.2021, 19:29
Manwe

Вложений: 1

Цитата:

Сообщение от jerri

распаковщик есть и под PDP11

Вложение 75927
Исходники распаковщиков LZSA1, LZSA2, ZX0, ZX1 для БК0010
04.08.2021, 15:58
grf

BKPACK дал хорошие результаты, буду юзать его )
04.08.2021, 20:28
jerri

Цитата:

Сообщение от grf

BKPACK дал хорошие результаты, буду юзать его )

насколько хорошо жмет?
https://introspec.retroscene.org/com...o_20210128.png
лучше чем Shrinker?
05.08.2021, 06:21
grf

Файлы заставок, которые мне нужно сжать, жмет в среднем в два раза:

hallblnk было 40000, стало 22053
mainhall 40000 -> 23502
titr1 40000 -> 15004
titr2 40000 -> 14631
titr3 40000 -> 14573
titr4 40000 -> 12642
tmaincl 40000 -> 30615

Для пробы сжал код:
main.exe 36724 -> 27223

Все числа восьмеричные. Причем это он делает исполняемый файл с встроенным распаковщиком, который надо из них будет выдрать и использовать только в одном экземпляре.
05.08.2021, 08:52
reddie

Цитата:

Сообщение от grf

Файлы заставок, которые мне нужно сжать

а можно сюда их выложить? поковыряюсь на досуге с переделкой спектрумовского.
Для сравнения результатов, чтоб было понятней, кто как жмет.
05.08.2021, 11:05
grf

Цитата:

Сообщение от reddie

а можно сюда их выложить? поковыряюсь на досуге с переделкой спектрумовского.
Для сравнения результатов, чтоб было понятней, кто как жмет.

https://cloud.mail.ru/public/5NuJ/UDEP6T154
05.08.2021, 11:13
ivagor

ZX0
TITR1.PIC - 3890dec байт=7462oct байта
TITR2.PIC - 3784dec байт=7310oct байт
+распаковщик 102dec=146oct байт
05.08.2021, 20:49
Manwe

в PONG Charged я использовал LZSA2 и очень доволен
05.08.2021, 21:19
ivagor

Оффтоп про распаковщики

Цитата:

Сообщение от Manwe

LZSA2

Если распаковщик мой, то вариант для pdp11 был совсем неудачный, даже не стал его выкладывать на github. Но и при наличии более эффективного распаковщика актуальность lzsa2 после появления zx0/1 сильно уменьшилась. lzsa1 - быстрый; zx0 - сильно сжимает; zx2 - компактный распаковщик; zx1 - степень сжатия немного уступает zx1, зато скорость почти как у lzsa2, а в варианте для pdp11 даже быстрее, что правда больше говорит о недоработанности того распаковщика lzsa2.
[свернуть]
05.08.2021, 21:38
Manwe

Цитата:

Сообщение от ivagor

zx1 - степень сжатия немного уступает zx1

Вот этого я не понял :)
zx0 я попробовал, но он не сильней чем lzsa2 сжал.
06.08.2021, 01:49
grf

Цитата:

Сообщение от Manwe

в PONG Charged я использовал LZSA2 и очень доволен

Мне вполне хватит BKPACK, тем более он полностью БКшный - и упаковщик и распаковщик :)
06.08.2021, 07:03
ivagor

Цитата:

Сообщение от Manwe

Вот этого я не понял

Пардон, "zx1 - степень сжатия немного уступает zx0".

Цитата:

Сообщение от Manwe

zx0 я попробовал, но он не сильней чем lzsa2 сжал.

Для редких отдельных файлов это возможно (кстати, пока не находил примеров таких файлов, можно куда-нибудь выложить тот самый?), но в среднем по больнице он заметно опережает.
06.08.2021, 08:39
grf

Цитата:

Сообщение от gid

Bkpack. Я только им и пользовался. Единственный из упаковщиков такого типа который мне нравился.

Распаковщик BKPACK существует в версии, которая пригодна к многократной распаковке архива и не портит сама себя?
06.08.2021, 08:56
Manwe

Цитата:

Сообщение от ivagor

Если распаковщик мой, то вариант для pdp11 был совсем неудачный, даже не стал его выкладывать на github.

Не подскажешь как в LZSA2 это устроено? Read a nibble... then read a byte. После чтения токена (байта) нужно прочитать ниббл (4 бита), а потом байт. Получается, этот байт сдвинут на 4 бита? То есть расположение данных в памяти выглядит так (побитно, где | означает границы байтов в памяти)?

Код:

| tokenmmm | niblbyte | byte.... | ^^^^ ^^^^
06.08.2021, 09:06
Sandro

Цитата:

Сообщение от grf

Распаковщик BKPACK существует в версии, которая пригодна к многократной распаковке архива и не портит сама себя?

Насколько я помню, он вообще ничего в себе не изменяет, поэтому можно хранить в памяти кучу данных и распаковывать им по мере надобности. Благо алгоритм неожиданно удачный. Он близок по степени сжатия к ZIP/DEFLATE, и при этом вообще не использует побитовой упаковки!
06.08.2021, 09:42
ivagor

Цитата:

Сообщение от Sandro

близок по степени сжатия к ZIP/DEFLATE

Спорное утверждение, например TITR1.PIC и TITR2.PIC zip/deflate сжал в полтора раза лучше, чем bkpack.

пара слов про нибблы в lzsa2

Цитата:

Сообщение от Manwe

как в LZSA2 это устроено

Про формат lzsa2 я вряд ли напишу лучше автора, но если ограничиться нибблами, то можно сказать, что есть как бы параллельный поток нибблов (это как поток битов во многих других упаковщиках), перемежающийся с потоком байтов. Если нужен ниббл, то мы проверяем текущее состояние "буфера нибблов", и
1. если там пусто, читаем следующий байт, берем оттуда один ниббл, а второй - в буфер нибблов.
2. если там не пусто, берем ниббл и помечаем, что "буффер нибблов" пуст.
[свернуть]
06.08.2021, 09:54
Manwe

Цитата:

Сообщение от ivagor

Про формат lzsa2 я вряд ли напишу лучше автора, но если ограничиться нибблами, то можно сказать, что есть как бы параллельный поток нибблов (это как поток битов во многих других упаковщиках), перемежающийся с потоком байтов. Если нужен ниббл, то мы проверяем текущее состояние "буфера нибблов", и
1. если там пусто, читаем следующий байт, берем оттуда один ниббл, а второй - в буфер нибблов.
2. если там не пусто, берем ниббл и помечаем, что "буффер нибблов" пуст.

То есть нибблы всегда хранятся парами, чтобы занимать ровно байт?

P.S. мне кажется, обсуждение распаковки - НЕ оффтопик в теме про упаковку, так что можно не прятать обсуждение в спойлер.
06.08.2021, 10:13
ivagor

Цитата:

Сообщение от Manwe

То есть нибблы всегда хранятся парами, чтобы занимать ровно байт?

да
06.08.2021, 10:16
grf

Вложений: 2

Цитата:

Сообщение от Sandro

Насколько я помню, он вообще ничего в себе не изменяет, поэтому можно хранить в памяти кучу данных и распаковывать им по мере надобности. Благо алгоритм неожиданно удачный. Он близок по степени сжатия к ZIP/DEFLATE, и при этом вообще не использует побитовой упаковки!

Распаковщик изначально выглядит так:
Вложение 75933

Он пересылает часть кода в назначенную рабочую область, потом делает JMP на начало этого кода, и первым делом затирает свое начало, пересылая туда 572 байта из конца архива:

Вложение 75934

Таким образом, повторный запуск уже не имеет смысла, потому что там нет изначального кода.
06.08.2021, 11:01
jerri

Цитата:

Сообщение от grf

Таким образом, повторный запуск уже не имеет смысла, потому что там нет изначального кода.

можно было бы использовать 1 распаковщик на все файлы.
Но нет так нет.
06.08.2021, 12:59
Sandro

Цитата:

Сообщение от grf

Распаковщик изначально выглядит так:
Таким образом, повторный запуск уже не имеет смысла, потому что там нет изначального кода.

Но сам же себя он не ломает? Что мешает эту пересылку отрезать? Она нужна только для того, чтобы можно было запускать программу со стандартного адреса 1000, и одновременно там в начале был бы распаковщик. если этого требования нет, то и так фокусничать не надо.
06.08.2021, 13:07
grf

Цитата:

Сообщение от Sandro

Но сам же себя он не ломает? Что мешает эту пересылку отрезать? Она нужна только для того, чтобы можно было запускать программу со стандартного адреса 1000, и одновременно там в начале был бы распаковщик. если этого требования нет, то и так фокусничать не надо.

Он ломает себя не тем, что пересылает куда-то кусок своего кода, а тем, что пересылает кусок данных из конца архива в свое начало уже после этого. И архив начинает распаковывать уже после этого. Понятно, что его можно переделать. Но это необратимое таскание своих кусков совсем не вяжется с "он вообще ничего в себе не изменяет". Потому я и спросил, нет ли версии, изначально просто распаковывающей архив в нужный адрес без выкрутасов.
06.08.2021, 13:18
Sandro

Цитата:

Сообщение от grf

Он ломает себя не тем, что пересылает куда-то кусок своего кода, а тем, что пересылает кусок данных из конца архива в свое начало уже после этого. И архив начинает распаковывать уже после этого. Понятно, что его можно переделать. Но это необратимое таскание своих кусков совсем не вяжется с "он вообще ничего в себе не изменяет". Потому я и спросил, нет ли версии, изначально просто распаковывающей архив в нужный адрес без выкрутасов.

Вопрос понятен. У нас, похоже, несколько разное понимание вопросов изменения. Пусть будет так. Так вот, версию распаковщика без этих манипуляций я совершенно точно видел в работе. И упаковать можно было в непрерывный поток, а не так вот с перекидкой.
Попробую вспомнить.
06.08.2021, 13:40
gid

Цитата:

Сообщение от Sandro

Но сам же себя он не ломает? Что мешает эту пересылку отрезать?

Алгоритм мешает. Он возвращает в начало, взамен модуля автораспаковщика, тот участок упакованных данных, которые должны там находится.
Чтобы всё это исправить, надо по сути написать новую версию упаковщика.

Цитата:

Сообщение от grf

Потому я и спросил, нет ли версии, изначально просто распаковывающей архив в нужный адрес без выкрутасов.

Нет. Основное назначение бкпака - сжатие исполняемых файлов, т.е. файл загрузился, распаковался в памяти и запустился.
Если нужно многократное использование сжатых массивов, то в случае бкпака делали так - копировали сжатый массив в нужное место, и запускали автораспаковщик. Там у него был режим "сжатие данных", когда после распаковки делался не запуск, а просто возврат из п/п RTS PC.
Ну и существенный минус - нужна область для таблиц распаковки.

Для данных, особенно, если массив надо распаковать куда-то в определённое место, на БК использовали самарский Crunch/Decrunch.

Или, как тут советуют, использовать ZXn/DZXn, правда сперва придётся написать нужный упаковщик конкретно для БК.
06.08.2021, 14:15
ivagor

Цитата:

Сообщение от gid

использовать ZXn/DZXn, правда сперва придётся написать нужный упаковщик конкретно для БК.

Чем не устраивает имеющиеся? Проверял их в том числе в эмуляторе БК, работали. Или какие-то проблемы на реале?
06.08.2021, 14:16
Manwe

Цитата:

Сообщение от ivagor

да

Спасибо! А можешь объяснить что такое "match"? Просто документация автора рассчитана на тех, кто знаком с другими его алгоритмами - описаны только особенности lzsa2, а базовые понятия не описаны.
Про биты LL (literals length) я понял: сколько байт из входного потока копировать в выходной поток. Но не понял как при этом используется XYZ (offset). И что делать когда literals length = 0 - пропускать этот токен или разбирать биты MMM?
Про биты MMM (match length) вообще не врубился: что если задано значение и LL, и MMM? Выполнять и то, и другое? Если да, то в каком порядке? Чем match length отличается от literals length и что делать если match length = 0?
06.08.2021, 14:26
ivagor

Возможно несколько запутывает то, что автору пришлось объединить в "токене", с которого начинается каждый отдельный фрагмент все сразу - и информацию о литералах и о ссылках, все чтобы избежать дробления служебной информации на более мелкие небайтовые куски.
LL отдельно, сколько литералов скопировать, там может быть и 0.
XYZ и MMM отдельно, соответственно смещение и длина ссылки в уже раскодированном блоке, чтобы взять оттуда фрагмент и скопировать его в текущую позицию. Конечно по 3 бита мало на все случаи жизни, поэтому он там расписал, когда и как берутся дополнительные байты для длинных совпадений и дальних ссылок.
06.08.2021, 14:50
Manwe

Цитата:

Сообщение от ivagor

LL отдельно, сколько литералов скопировать, там может быть и 0.

А что если LL=1 и MMM=1? Сначала копируем один байт из входного потока, а потом применяем оффсет (1+2)?

Цитата:

Сообщение от ivagor

XYZ и MMM отдельно, соответственно смещение и длина ссылки в уже раскодированном блоке, чтобы взять оттуда фрагмент и скопировать его в текущую позицию.

Спасибо. По названию "match" я догадывался, но в описании прямо об этом не сказано. Мне кажется немного странным, что нужно устанавливать старшие биты в 1, а потом прибавлять оффсет. Было бы логично биты не трогать и отнимать оффсет. Может быть так и сделаю. Тогда, вроде, надо предварительно увеличить оффсет на 1 (преобразование отрицательных чисел в положительные).
06.08.2021, 15:10
ivagor

Цитата:

Сообщение от Manwe

А что если LL=1 и MMM=1? Сначала копируем один байт из входного потока, а потом применяем оффсет (1+2)?

Да, ну и смещение из XYZ (и при необходимости из следующих байт) надо взять.

Цитата:

Сообщение от Manwe

Мне кажется немного странным, что нужно устанавливать старшие биты в 1, а потом прибавлять оффсет. Было бы логично биты не трогать и отнимать оффсет.

Для pdp11 это без разницы, а вот для z80 и особенно 8080 это очень важная оптимизация. У z80 команда 16 битного вычитания длиннее и медленнее 16 битного сложения, а у 8080 нет команды 16 битного вычитания. Раньше я даже кое-какие упаковщики переделывал на эту тему.
06.08.2021, 15:43
Manwe

Цитата:

Сообщение от ivagor

У z80 команда 16 битного вычитания длиннее и медленнее 16 битного сложения, а у 8080 нет команды 16 битного вычитания.

Было у меня такое подозрение.

Цитата:

Сообщение от ivagor

Для pdp11 это без разницы

В данном случае можно было бы в распаковщике сэкономить несколько инструкций, если бы оффсеты во входном потоке хранились положительные. А это плюс к быстродействию.
06.08.2021, 17:00
gid

Цитата:

Сообщение от ivagor

Чем не устраивает имеющиеся?

Тем, что по данной вами ссылке нету упаковщиков под pdp-11, только распаковщики. А самому писать лень. Ибо не приспичило.
Не, может, где-то когда-то кто-то давал ссылки на упаковщики zx0..2, lzsa2, написанные для pdp-11, но это как-то мимо меня прошло.
06.08.2021, 17:05
ivagor

Цитата:

Сообщение от gid

нету упаковщиков

Ошибся. Для lzsa2 еще можно представить упаковщик для pdp-11, а вот для zxов нет, соответствующие упаковщики были бы или невыносимо медленны или уступали бы имеющимся для ПК. Все же фишка оптимальных упаковщиков в том, что они опираются на мощь современных компьютеров.
06.08.2021, 17:19
jerri

Цитата:

Сообщение от gid

Тем, что по данной вами ссылке нету упаковщиков под pdp-11, только распаковщики. А самому писать лень. Ибо не приспичило.
Не, может, где-то когда-то кто-то давал ссылки на упаковщики zx0..2, lzsa2, написанные для pdp-11, но это как-то мимо меня прошло.

Ну они изначально существуют только под ПЦ
вот исходники - можно в С собрать.
есть С под БК?

Показывать 40 сообщений этой темы на одной странице

Текущее время: 12:15. Часовой пояс GMT +3.

Упаковщики

Оффтоп про распаковщики

пара слов про нибблы в lzsa2