Какое деление/умножение, знаковое, без? Последовательное или одновременное?

Некоторые алгоритмы есть тут - http://www.piter.com/lib/97857190003...il=wgasm09#n01. Насчет оптимальности не знаю, но меня убила процедура SQR размером 28 байт.