GCC 11.2.1 с поддержкой процессоров 1801вм1 и 1801вм2

User Tag List

Показано с 1 по 10 из 41

Древовидный режим

Предыдущее сообщение

Следующее сообщение

30.11.2021, 13:41 #39
Sandro

Просмотр профиля

Сообщения форума

Личное сообщение

Записи в дневнике

Просмотр статей

Master
Регистрация

20.01.2010

Адрес

г. Зеленоград

Сообщений

600

Спасибо
28

Спасибо
231

Поблагодарили
123 сообщений

Mentioned

1 Post(s)

Tagged

0 Thread(s)
Заменить #10 на #20. Но тогда, естественно, уже возможно перепеолнение.

Код совершенно классический, есть в любом букваре. Есть также классическая вариация с выходом по обнулению второго множителя. Она в среднем быстрее, если множитель маленький, то в разы.

Код:

; r0 = r1 * r2 mul: clr r0 cmp r1, r2 bhis 1$ xor r1, r2 xor r2, r1 xor r1, r2 1$: tst r2 beq 0$ clc ror r2 bcc 2$ add r1, r0 2$: asl r1 add r1, r0 asr r2 bcs 2$ beq 3$ sub r1, r0 br 2$ 3$: sub r1, r0 0$: rts r7

Набил по памяти, но вроде правильно. Это т.н. алгоритм с восстановлением, классическая оптимизация. Тело цикла умножения -- это 2$..bcs 2$ для единичного бита и 2$..br 2$ для нулевого. Выполняется до исчерпания единичных бит в меньшем множителе.
Можно ещё быстрее, но это приводит к ещё большему объёму кода.

А ещё быстрее -- через таблицу квадратов, пользуясь следующим равенством:

((x + y) ^ 2) / 4 - ((x - y) ^ 2) / 4 = x * y;
Ответить с цитированием

Эти 3 пользователя(ей) поблагодарили Sandro за это полезное сообщение:

Oleg N. Cher(30.11.2021), tnt23(02.12.2021), yu.zxpk(30.11.2021)