Программирование

Вид для печати

Показывать 40 сообщений этой темы на одной странице

14.09.2022, 15:05
ivagor

Цвета можно и без слоев уменьшить, хотя и не очень удобно. Один поток - двухбитный (4 точки в байте), второй - однобитный (8 точек в байте).
14.09.2022, 15:57
svofski

Цитата:

Сообщение от ivagor

Цвета можно и без слоев уменьшить, хотя и не очень удобно. Один поток - двухбитный (4 точки в байте), второй - однобитный (8 точек в байте).

Ну не, хватит мне тут потоков и так =) Не хочешь сделать "прямой" dzx0?
14.09.2022, 16:03
ivagor

Что нужно спрямить в dzx0? Ты писал про поточный, но я не совсем понял, ты же уже сделал поточный и я там какие-то мелочи дошлифовывал.
14.09.2022, 16:49
svofski

Цитата:

Сообщение от ivagor

Что нужно спрямить в dzx0?

Сейчас dzx0 -- это от начала до конца один цикл. Если я хочу что-то делать с данными по частям, то есть пока этот цикл не завершился, мне приходится встревать в него разными зверскими способами.

Было бы удобно, если бы дополнительно существовал вариант dzx0, который устроен так, что можно вызывать из основной программы типа "call dzx0_stream_getbyte" когда надо. А он бы внутри себя декодировал очередную порцию по мере надобности. В картинках у меня сейчас именно так и сделано, но методом выворачивания цикла наизнанку. Почти так же, как в гигачаде, но попроще, потому что один поток. У этого есть недостатки -- плохая читаемость, необходимость запрещать прерывания пока стеки подменяются, оверхед на все это тоже может быть больше, чем если бы был прямой вызов.

Предполагаемый API такой:
dzx0_stream_init: -- инициализация: d=адрес откуда читаем, b=адрес буфера
dzx0_stream_getbyte: -- очередной байт (допустим Carry=1, если конец потока)
dzx0_stream_getbyte внутри себя вызывает dzx0_decode_chunk, когда исчерпываются данные в буфере

Все это разумеется применимо только к варианту с ограниченным размером буфера. 256 показал себя хорошо.
14.09.2022, 17:03
ivagor

Цитата:

Сообщение от svofski

d=адрес откуда читаем

de?
Побайтно можно, но сравнительно неэффективно. Может по 256 байт?
14.09.2022, 17:25
svofski

Цитата:

Сообщение от ivagor

de?
Побайтно можно, но сравнительно неэффективно. Может по 256 байт?

de, bc (хотя bc будет выровнен по 256)

Алгоритм внутри себя будет декодировать порциями в любом случае. Можно сделать фиксированный размер порции 256 байт. getbyte в обычном случае будет просто брать очередной байт из циклического буфера, если данные уже декодированы, и обращаться к алгоритму за очередной порцией когда буфер истощен.

Для смелых пользователей, кому важна эффективность и не хочется вызывать getbyte для каждого байта, останется возможность вызывать dzx0_decode_chunk напрямую.

256 байт хороший размер с точки зрения эффективности. Но чтобы не блокировать исполнение юзерского когда слишком на долго, хорошо иметь возможность рулить размером порции. Можно условной компиляцией 16/256, например. Или вообще по размеру порции в LDIR-е, правда это усложнит getbyte.
14.09.2022, 20:10
ivagor

Вложений: 1

Пока для пробы сделал распаковщик чанками по 256 байт. GetByte можно сделать внешним, как с файловыми буферами: берем байт из буфера, если буфер пуст - распаковываем следующий чанк.

Пример почанковой распаковки всего файла

Код:

lxi b,dzx0_Buffer ;DE - откуда ;HL - куда ;BC - буфер MovLoop2: push h call dzx0 pop h jnc LastMov MovLoop1: ldax b mov m,a inr c inx h jnz MovLoop1 jmp MovLoop2 LastMov: inr c dcr c jz Start mov e,c mvi c,0 LastMov1: ldax b mov m,a inr c inx h dcr e jnz LastMov1 jz Start

[свернуть]

Забыл в файле написать - на выходе из dzx0
CY=0 - закончили распаковку
CY=1 - еще не закончили

- - - Добавлено - - -

Отмечу, что учитывая самомодификацию распаковщик однопоточный.

- - - Добавлено - - -

Один чанк распаковывается в среднем за 35000-45000 тактов. Крайние значения, которые видел - от 20000 до 50000 тактов.

Upd 18.09.2022: Примерно на 3% быстрее, сохраняет BC между распаковкой чанков (если убрать сохранение BC, то будет на 7 байт короче).
14.09.2022, 21:37
svofski

ivagor, спасибо! Попробовал, работает. Для моего случая годно. По-моему backwards тут не имеет смысла, под себя заменил макросы, потому что prettyasm в них не умеет. Ко всем меткам приставил stream_, чтобы не было конфликтов. А зачем нужна часть, которая подменяет точку входа, почему не просто отдельно инициализация и отдельно распаковка?
15.09.2022, 00:40
svofski

Ну что, на этом можно и успокоиться, правда 144 байта еще осталось http://sensi.org/~svo/b/mandrill/progdemo.rom
15.09.2022, 06:36
ivagor

Ты опять сумел удивить, три картинки (пусть и не полноэкранных)! И музычка хорошо подобрана.

Цитата:

Сообщение от svofski

А зачем нужна часть, которая подменяет точку входа, почему не просто отдельно инициализация и отдельно распаковка?

Личное предпочтение, чтобы упростить вызов. Понятно, что это можно вынести наружу, возможно для гитхаба я так и сделаю, надо еще подумать.
Насчет размера чанков. Степени двойки (2-128) можно получить добавив по паре команд перед jnz dzx0_ldir1_3 и jnz dzx0_ldir2_3
mvi a,Mask
ana c
Mask=(16-1) для 16 и т.д.

- - - Добавлено - - -

Ну и для простоты лучше сжимать файлы с размером кратным чанку, тогда хвосты не надо отдельно обрабатывать.
15.09.2022, 12:47
svofski

Да ладно, тут я всего-то взял все твои штуки и склеил в одну. Работа редакторская -- подпилить музон под ви53 (vt2 гениальная штука, можно редактировать в vim-е, как нормальный человек), подобрать дизер. А, ну правда тормозная прогрессивная загрузка -- это мое. Надо бы что ли задержку небольшую между картинками вставить.

Про способ вызова -- я быстро адаптировался, потому что сейчас в теме. Но так с ходу это может показаться непонятным.

Размеры чанков 16/256 у меня так и были сделаны. Сейчас, когда декодер не запрещает прерывания, для этой конкретно демы это стало не нужно. Но возможность управлять размером чанка иметь хорошо -- будет другая ситуация, где все будет наоборот.
16.09.2022, 23:30
svofski

Немного ускорил вывод и замедлил промежутки между картинками. Выкладываю как есть.
https://github.com/svofski/v06c-progdemo
http://sensi.org/scalar/ware/920

Upd: Забил буфера львом.
17.09.2022, 12:04
ivagor

rom целиком с -w256 сжимается до 26 с половиной килобайт. Мне кажется, что некоторые резервы есть, пусть и не на 6 килобайт.

- - - Добавлено - - -

Часть ответа нашел. При -w256 сильно ухудшается эффективность сжатия последовательностей одинаковых байт (по крайней мере для absinthe-diag и fille-diag), увеличение хотя бы до -w512 заметно улучшает ситуацию. Альтернативный вариант - обрезать пустоту по бокам и сжать без нее.
17.09.2022, 12:42
BlaireCas

Цитата:

Сообщение от svofski

Выкладываю как есть.

Посмотрел на эмуляторе. Красиво смотрится и музыка радует. Зачотно. Даже напомнило времена когда джипеги на диалапе загружались подобным образом (понемногу улучшая видимость).
17.09.2022, 12:55
svofski

Примерно 4К этого резерва -- это буфера гигачада, которые тут оказываются посередине файла -- можно без особых дополнительных ухищрений впихнуть в них одноразовую заставку, которая будет показываться один раз при запуске, потом затираться. Надо придумать, чего бы можно было туда втиснуть. ~~Тигр~~лев в джунглях Руссо мне нравится, может быть если обрезать джунгли немного и уменьшить, он поместится.

Картинку произвольного размера было бы прикольно уметь. Может быть не для этой демки, а для вообще реюзабельности для чего-нибудь еще. Подумал типа кому нафик нужны такие тормозные картинки 7 Но если они будут маленькими врезками 64х64 или около того, они будут совсем не такие тормозные и это могло бы для чего-нибудь прийтись и кстати.

- - - Добавлено - - -

Цитата:

Сообщение от BlaireCas

музыка радует

Это респект музыкантам.
17.09.2022, 13:10
ivagor

Цитата:

Сообщение от svofski

Примерно 4К этого резерва -- это буфера гигачада

Здесь хватит 11*256=2816 байт (6 - частоты, 1 - микшер, 1 - старший байт огибающей, 3 - громкости), т.е. еще килобайт резерва.

- - - Добавлено - - -

Все же на громкости 3 байта в данном случае расточительство, можно свести в 1 байт. Или даже приплюсовать к микшеру вместо шума.
17.09.2022, 13:26
svofski

ivagor, сейчас остается возможность одним движением включить AY, если вдруг захочется (хотя музон немного пережеван для ви53, но совсем чуть-чуть, не так сильно, чтобы совсем испортиться). Или даже сделать неприятный хорус (tm).
17.09.2022, 14:14
ivagor

Если оставить возможность перенаправить на AY, то есть еще вариант. Композиция довольно компактная, думаю если пережать с -w128 она не сильно увеличится, а буферы сразу в 2 раза меньше.
Кстати, некоторое время пользуюсь сальвадором 1.40, он иногда на 1-2 байта лучше сжимает, мелочь, а приятно.
17.09.2022, 16:59
svofski

ivagor, забил буфера львом (вдавил). Пока я об эту демку достаточно потешился, но ты добро пожаловать ускорять, ужимать и добавлять еще конечно ;)

Ссылки те же.
17.09.2022, 17:10
ivagor

Мне пришлось бы приложить немало усилий, чтобы откомпилировать эту дему, но в принципе потенциал развития есть, тема интересная.

- - - Добавлено - - -

На примере льва хорошо видно, что ограничение размера картинки еще и сильно ускорило бы.
17.09.2022, 18:19
svofski

Да, там занудненько так распаковывается и рисуется много-много черных пикселей. Но добавление еще и размера картинки -- это непомерное, непосильное усложнение.

Собрать проще, чем ты думаешь. У тебя python3 стоит? Виндовый.

pip3 install pypng lhafile -- это все зависимости

winbuild.bat
[здесь был первый черновик winbuild.bat, который сейчас в репе]

Ассемблер ты все равно будешь пользовать tasm, поэтому тут про него ничего нет. Для конверсии льва в db у тебя тоже наверняка есть любимый инструмент. Ну или можно исхитриться и обойтись тем же copy/b, но там надо аккуратно подогнать выравнивание, чтобы основной блок картинок не затерся буферами.
17.09.2022, 19:12
ivagor

Сходу тасм не откомпилирует, надо немного править. Но это не важно, дема интересная и вдохновляющая, появились новые идеи.
17.09.2022, 19:17
svofski

Цитата:

Сообщение от ivagor

Сходу тасм не откомпилирует, надо немного править. Но это не важно, дема интересная и вдохновляющая, появились новые идеи.

Это главное. Но я все равно немного доделываю скрипты, чтобы упростить батник и обойтись без xxd/awk. Вдруг пригодится.
17.09.2022, 22:04
svofski

ivagor, залил версию, собирающуюся tasm-ом вместе с проверенным батничком winbuild.bat

(ох и цаца этот ваш тасм, строчки ему длинные..)

P.S. пустился во все тяжкие и сделал поддержку обрезанных картинок. Ширина должна быть кратна 16, высота кратна 8. Ссылки все те же.
18.09.2022, 07:36
ivagor

Ну ты крутой. Под влиянием положительного примера постарался проявить сознательность и убрал тупизну из чанкового распаковщика, стало немного лучше.
18.09.2022, 11:52
svofski

Присовокупил dzx0v2, работает, все обновил-перезалил. 3% из одного только распаковщика на глаз конечно не заметишь, но все вместе бесспорно стало как-то бодрее и веселее.

Кстати там просто прорва неиспользованных байт -- 256 это буфер dzx0, который может быть использован один раз при запуске, и 443 в конце. Ну и это без учета того, что это даже не r0m.

- - - Добавлено - - -

P.S. не учел, что bc теперь можно не сохранять, но один раз на 256 байт это совсем не критично.

- - - Добавлено - - -

P.P.S. если убрать push / pop b из picstream_fetch, к концу стрима что-то не так заворачивается. Лень разбираться, пока оставил push/pop, даром, что это ни на что не влияет.
18.09.2022, 13:18
ivagor

Поздравляю, ты заставил меня откомпилировать прогдему :)
При выходе из dzx0 между чанками c=0, а в последний раз c=индекс последнего байта в буфере+1. Можно убрать push b и pop b из picstream_fetch, если добавить перед picstream_gb_L1 mvi c,0
18.09.2022, 13:36
svofski

Цитата:

Сообщение от ivagor

Поздравляю, ты заставил меня откомпилировать прогдему

Вот это настоящее событие! :)
Надеюсь это была самая последняя версия с уже вставленным новым dzx0v2.
18.09.2022, 16:32
ivagor

Вложений: 1

Оставалось немного места и я заполнил его setpixelями. Выигрыш от 2 до 3.5%

- - - Добавлено - - -

Upd: 4-5.5%
18.09.2022, 16:36
BlaireCas

Кажется побыстрее стало (субъективно конечно, там нет ведь замеров скорости.. ну и добавилась картинка какого-то кошака вначале). А это будет демка такая?
18.09.2022, 17:49
svofski

BlaireCas, это уже как бы демка такая спонтанно самообразовавшаяся. Не всем демкам суждено звать себя продами и релизами. Бывают же и просто сны (tm). Кошак, кстати, это деталь из "Сна" Анри Руссо ;)

ivagor, спасибо, я попозже сегодня посмотрю и соберу.
18.09.2022, 20:00
svofski

Цитата:

Сообщение от ivagor

Оставалось немного места и я заполнил его setpixelями. Выигрыш от 2 до 3.5%

Upd: 4-5.5%

Стало прям летать бешено круто. Всё перезалил.
18.09.2022, 21:16
ivagor

Хорошо бы придумать что-то побыстрее, но для вывода отдельных цветных точек это пока похоже на предел (или близко к нему). "Медленный вектор" и все такое.
Все здорово, но желательно бы доработать очистку экрана:
1. Или гасить палитру, потом стирать, потом новая палитра
2. Или очищать как-нибудь не по порядку адресов. По строкам, или чересстрочно и потом навстречу или спиралью и т.п.

- - - Добавлено - - -

Кстати, можно очищать и LFSRом по точкам
18.09.2022, 21:43
svofski

LFSR-ом по байтам лучше. И не совсем резко и не надо ждать полчаса. Еще можно фейдить палитру в черное.

Upd: сделал через три строки, получилось просто и симпатично.
19.09.2022, 06:34
ivagor

По моему впечатлению так лучше.
Что касается предельности сетпикселя. Не обязательно пытаться прошибить лбом этот порог, можно обойти. Нам известна вся картинка, поэтому можно кодировать не абсолютные значения точек, а изменения относительно уже имеющегося в данной позиции цвета. Ускорение за счет того что:
1. Не будет спарок ora c\ xra c, максимум xra c
2. Можно пропускать неизменные плоскости (это главный выигрыш)
Вопрос в том, сожмется ли такой вариант не хуже абсолютного.
19.09.2022, 12:12
svofski

Если записывать значение, с которым надо поксорить чтобы получить очередной пиксель, это может получиться. Предсказать про сжатие не могу, но есть опасение, что будет сжиматься заметно хуже.
20.09.2022, 02:11
svofski

Опасение подтвердилось, сжимается заметно хуже.

- - - Добавлено - - -

Но я все-таки смог срезать 4 такта на setpixel1 :)
20.09.2022, 02:25
parallelno

А если картинки сжимать не по пикселям, а по байтам будет хуже сжиматься?
20.09.2022, 08:01
ivagor

Как известно, одна голова - хорошо, а две - некрасиво. Зато есть эффект.

и вскрываем резерв еще на 16 тактов

Код:

setpixel1: push d rrc \ rrc \ rrc mov b, a ; b = saved a, c free ani 11110b sta setpixel1setjmp+1 mov a, e sub m mov e, a ; update pixel addr inx h ; hl -> pixel mask mov c, m ; c = set mask inx h ; hl -> next in tile sequence push h ; save hl setpixel1setjmp: lhld setpixel1tab ldax d ora c pchl

[свернуть]

- - - Добавлено - - -

Если поменять знак у смещений возьмужек, то еще -4 такта за счет замены
mov a,e
sub m
на
mov a,m
add e
20.09.2022, 12:24
svofski

parallelno, картинки заворачиваются в прогрессивную последовательность пикселей-полубайт. Полубайты объединяются в байты, а байты уже потом сжимаются.

Показывать 40 сообщений этой темы на одной странице

Текущее время: 16:38. Часовой пояс GMT +3.

Программирование

Пример почанковой распаковки всего файла

и вскрываем резерв еще на 16 тактов