перенос спрайта из квазидиска на основной экран сделан по столбцам. Переносить спрайт горизонтальными линиями у меня получилось медленнее.
Если выводить в три плоскости подряд (по 3 байта) и змейкой, то нет разницы в скорости, хоть по столбцам, хоть по строкам (но по строкам менее заметен тиринг без аппаратной двойной буферизации).