Имхо еще сдвиг ASHC делается за то-же время что и ASH? Тут писали про это. Ну господа, это-ж чудеса. Как это сдвиг двух слов может быть таким-же как сдвиг одного? Явно "замедлили где-то!"
Это происходит потому, что сдвиговый регистр условно говоря 32-битный. И ему все равно, что сдвигать, 16 бит или 32 бита.
Дополнительные 8 тактов занимает лишь копирование второго слова в сдвиговый регистр (4 такта), и копирование после сдвига обратно (4 такта). И все.