Известно, что их RRA: RRA: RRA: RLCA, сдвигать нужно. И маску
ещё. Потом XOR: AND: XOR. Всё это отнимает кучу тактов.
Некоторые умники сдвигают весь шрифт целиком. 2048*4=8КБайт,
а то и все 16. Жуть.
Имеется решение в 512 байт: таблица, где для каждого возможного
байта из шрифта будет храниться два байта сдвинутых на нужное расстояние. 4 инструкции в примерно 22 такта заменяют несколько
операций сдвига. Экономия. Но, наверное, небольшая.