Ну это и так вполне было понятно =) умножаем 78х160х16 получаем уже 200 тысяч, плюс обвязка двух циклов.
Вывод по стеку, кстати, никак не влазит в 16Кб, хоть push-pop, хоть pop-ld (nn). У первого много обвязки, у второго размер данных х2.
Окно вывода 78х160=12480х2 = почти 25 тысяч через второй способ. Через первый мм чуть поменьше.
Можно сделать оба адреса пересчитываемыми в коде (откуда + куда), но жрать станет больше по времени, по сути, сравняется с LDI.
Остается хардкорный вариант раскидать музу и весь остальной код по страницам, оставив в нулевой лишь блок управления =)





Ответить с цитированием