Пока я вижу неимоверными усилиями попытку реализовать спрайтовый движок какими то странными командами

Еще раз напомню мысль, как можно ускорить кардинально графику

Берем ядро AVR на opencores, привязываем к примеру регистры ядра к блокам DMA, MMU и получаем шейдерный процессор, добавляем блоков для формирования изображения, перехватов данных процессора о которых тут много речи и получаем движок, который сможет все вышеописанное реализовать, но не какими то странными а достаточно простым способом, залили прошивку, получили спрайтовый движок, залилили другую, получили карту которая умеет примитивы рисовать, третья прошивка к примеру может уметь текстурированые треугольники выводить, можно спец прошивки для игр, которые будут к примеру по известным адресам и игрушке брать координаты спрайтов и сама выводить их на экран, т.е. можно вообще без переделывания игры качественно изменить графику.