Быстрый алгоритм можно опитимизировать по памяти, вместо 256 байт таблички, можно 32мя обойтись, кажому числу по биту, пробегаемся ставим биты, потом набигаем на битовый массив и из него получаем результат, а что бы не париться с сдвигами можно сделать самомодифицирующийся код, который инструкцию bit будет патчить




Ответить с цитированием
Размещение рекламы на форуме способствует его дальнейшему развитию 

Интересно, насколько оно быстрее будет.
