Народ экспериментируетЕсть и однобайтные.
Заманчиво. Но всё это упрётся в пропускную способность шины и никакого кэша не хватит.
Не совсем понял что с чем соединить, но по-моему это называется VLIW. У него ещё одна проблема есть, кроме ширины шин: кто это программировать будет? Или человек с особой усидчивостью, или оптимизирующий ассемблер, но кто ж его напишет. Был такой процессор Transmeta Crusoe. Неплохой, но "не взлетел". Нативно программировать его было некому, а в эмуляции x86 он по понятным причинам проигрывал этому самому x86.
- - - Добавлено - - -
Почему инструкция 8 байт? Да она и 20 может быть при таком подходе.
Например, есть массив 32-разрядных значений, и в них надо установить бит с номером, равным номеру элемента.
В цикле выполнить такое:
Или, например, сортировка.Код:bset (IX+BC*4),BC
Сравнить два значения в массиве, номера элементов заданы в BC и DE:
Переход по таблице:Код:cp (IX+BC*2),(IX+DE*2)
Скопировать массив, в цикле:Код:jp (BC*4+label)
Программист пишет так, дальше уже пусть ассемблер и процессор разбираются как это закодировать и как выполнить.Код:ld (IX++),(IY++)





Есть и однобайтные.
Ответить с цитированием
Размещение рекламы на форуме способствует его дальнейшему развитию 
