Спасибо.
Буду исследовать,очень интересно узнать производительность.
Сейчас только начинаю изучать ассемблер.
Моя цель вывод спрайта 4x4знакоместа, с маской и координатами точностью до пикселя.
Я написал процедуру со сдвигом, она кушает от 16500 до 32000 тактов на такой спрайт, но есть перспектива уменьшить до соответственно 16500-24000 тактов.

Может у кого будут ещё предложения.

Хранить в памяти сдвинутые спрайты нереально, у меня спрайтов на 16кб.