Можно сделать таблицу подготовленных значений сдвигов 4кб длинной, и потенциально это позволит ускорить вывод спрайта.