переделал формат хранения спрайтов и процедуру вывода

на примере дизика 48*43
на стандартном вывод было:
16ц - спрайт 2064 байт
16ц+гига - спрайт 4128 байт
вывод ~ 45000 тактов

стало:
16ц - спрайт 1945 байт
16ц+гига - спрайт 2504 байт
вывод ~ 25000 тактов

или
16ц - спрайт 1252 байт
16ц+гига - спрайт 1811 байт
вывод ~ 38000 тактов

марио примерно на 10% дольше выводится

так что вполне на 7Мhz и 1Mb в 16ц можно сделать BT не сильно тормозное