SfS, а насколько дико? Вот здесь есть табличка про некоторую библиотеку которая даёт в среднем 163 микросекунды на сложение, 693 на умножение и 905 на деление, на Z80 с частотой 6МГц. Если пересчитать в такты, то получается 978, 4158 и 5430 соответственно, чтобы понять много это или мало, можно прикинуть сколько тактов требует умножение 24x24. Если делать через три умножения формата 8x24, поместив один множитель в C:D:E, в A:H:L записав 0, а в B записывая очередной байт второго множителя, то выполнив 8 раз блок ADD HL,HL/ADC A,A/RL B/JR NC,Xn/ADD HL,DE/ADC A,C/JR NC,Xn/INC B/Xn: на выходе в B:A:H:L мы получим 32х разрядное произведение. Среднее время выполнения умножения 8X24 составляет 8*(11+4+8)+4*(7+12+11+4)+2*(7+12+4)=366 тактов, или 1098 тактов на вычисление всех трёх произведений, без учёта загрузки регистров и окончательного суммирования. Чтобы обработать знаки,порядки и всякие исключительные ситуации думаю еще тактов 500 потребуется, в общем по сравнению с существующими библиотеками максимальное ускорение которое можно получить переписав всё на ассемблер это 2-3 раза.

