Слегка ускорил процедуру blackmirrora - с 313 до 323 линий/секунду.

Проверил свою идею (и, соответственно, одну из идей blackmirrora) по разворачиванию циклов с избавлением от сдвига маски. Но применил, конечно, уже к процедуре blackmirrora.
Разворачивание пологих циклов: +320 байт, зато 353 линии/секунду.
+еще разворачивание крутых циклов: +еще 350 байт, 355 линий/секунду - нафиг нужно.