PDP-11 на FPGA

Вид для печати

Показывать 40 сообщений этой темы на одной странице

20.06.2020, 22:05
Vslav

Цитата:

Сообщение от Hunta

Я не про код :) Я про систему команд :) Если система команд не содержит механизмы параллельного выполнения - чем ты что старый, что новый код распараллелишь? :)

Начиная с Pentium x86 умеет в out-of-order. Самая "простая" реализация - берем поток команд, грузим одновременно в 10 конвейров в каждый свою, разбираем-маркируем вовлеченные исходные данные, есть зависимость по данным (помечены как ждущие коммита от других команд) - ждем результатов, нет зависимости - выполняем, ждем своей очереди на коммит, финальная проверка что ничего в исходных не поменялось - коммит в реальное состояние процессора. Поскольку все делалось в параллель в 10 блоках, то в какой-то такт может оказаться что завершилось несколько команд и надо просто реализовать широкий коммит их результатов. Все br и большинство jmp/jsr/rts/sob будут просто выполняться эквивалентно за 0 тактов (по факту - в фоне, во время исполнения предыдущих команд), заметная часть независимых mov и арифметики тоже, исключение за один такт - красота. Вот с флажками и автоинкрементом/декрементом может оказаться не так быстро, это да, усиливате зависимости. Но это все в порядке бреда. Для начала более реальная реализация на одну инструкцию за такт, там наработаются блоки декодирования, загрузки-записи и прочее, станет понятнее как оно дальше может быть. На FPGA с таким играться - это надо команду типа интеловской нанимать, а потрогать идею на CUDA - уже можно и самому пробовать.

По ветвлению интересно можно сделать, на каждое ветвление порождать свою ветку виртуального состояния процессора - конвейеров у нас много, можно тащить сразу две ветки, для выполненного и пропущенного условия перехода. Если дальше опять ветвления - новые ветки породить. По коммиту инструкции ветвления - ложные ветки убивать, верные коммитить в реальность. Такой себе мета-квантовый подход :)
20.06.2020, 22:12
Hunta

Цитата:

Сообщение от Vslav

Для начала более реальная реализация на одну инструкцию за такт

Эт когда конвейер прогреется :)
А учитывая количество флажков и количества команд условных переход, плюс набор режимов адресации...
20.06.2020, 22:18
Vslav

Цитата:

Сообщение от Hunta

Эт когда конвейер прогреется :)
А учитывая количество флажков и количества команд условных переход, плюс набор режимов адресации...

Надо пробовать, вот после ВМ3 и займемся. C FPGA все понятно уже. А вот 1801ВМ1 3GHz поиметь заманчиво. Не, я понимаю, не для всех это новинка, но мне - интересно :)
20.06.2020, 22:23
Hunta

Цитата:

Сообщение от Vslav

вот после ВМ3 и займемся

Да да, у меня к ВМ3 вопросы есть :D

Цитата:

Сообщение от Vslav

А вот 1801ВМ1 3GHz поиметь заманчиво

Ну попробуй :)
21.06.2020, 03:00
Titus

Цитата:

Сообщение от Vslav

А вот 1801ВМ1 3GHz поиметь заманчиво. Не, я понимаю, не для всех это новинка, но мне - интересно

Друзья, зачем вам такие быстрые PDP? Что в прикладном плане вы собираетесь на них решать? Или это исключительно спортивный интерес?
21.06.2020, 09:38
Vslav

Цитата:

Сообщение от Titus

Друзья, зачем вам такие быстрые PDP? Что в прикладном плане вы собираетесь на них решать? Или это исключительно спортивный интерес?

И спортивный, и оглядеться, попробовать чего нового. C FPGA и обычными эмуляторами более-менее уже понятно, а чего можно выжать с эмуляции на GPU - пока нет.
21.06.2020, 11:58
Hunta

Цитата:

Сообщение от Titus

зачем вам такие быстрые PDP

Цитата:

Сообщение от Titus

Что в прикладном плане вы собираетесь на них решать?

Пощупать свои возможности - сделать такой проц PDP-11
21.06.2020, 13:17
shattered

Цитата:

Сообщение от Titus

Друзья, зачем вам такие быстрые PDP? Что в прикладном плане вы собираетесь на них решать? Или это исключительно спортивный интерес?

наконец-то можно будет написать doom для pdp, чего непонятного :-)
21.06.2020, 14:15
Hunta

Цитата:

Сообщение от shattered

наконец-то можно будет написать doom для pdp, чего непонятного

Интересная мысль :)
23.06.2020, 21:33
Hunta

Решил на синтезированном PDP-11/34 поразвлекаться с FPP. Пусть недолгих раздумий вспомнил про Whetstone :)
Ну, поскольку всякие блокировки работы RT-11 не делались, да и сам тест написан на Фортране, результаты, конечно, приблизительные :) Что бы примерный порядок быстродействия представлять :)

Код:

.RUN RK:WHTSTN ITERATIONS ? 300 300 iterations 481.2667236328 sec on iterations 1.604222416878 sec on iteration 0.6233549714088 Double Whetstone MIPS STOP .

В силу специфики реализации FPP в PDP-2011 расчёты всегда ведутся в double precision
Для сравнения (столбец MWIPS DP):

Код:

Supplier or Clock VAX MWIPS Intr System MHz MWIPS MFLOPS MIPS DP Lang Opt Date PDP 11/03 0.0027 Bas 1975 PDP 11/03 0.0267 0.0029 For 1975 PDP 11/10 0.0129 0.0032 For 1970 PDP 11/20 EAE 0.0188 0.0054 For 1970 PDP 11/34 FP 0.204 0.157 For 1976 PDP 11/34 NoF 0.0057 Bas 1976 PDP 11/34 NoF 0.029 0.0069 For 1976 PDP 11/40 EF 0.0655 0.0073 For 1973 PDP 11/45 FPP 0.189 0.075 For 1972 PDP 11/55 FP 0.714 0.552 For 1977 PDP 11/60 FPP 0.118 0.039 For 1977 PDP 11/60 FP 0.591 0.435 For 1977 PDP 11/70 FP 0.532 0.415 For 1975 VAX 11/780 FPA 5 0.494 Pas 1977 VAX 11/780 FPA 5 1.18 0.760 For Opt 1977 VAX 11/780 FPA 5 1.02 0.25 1.00 For No 1977 VAX 11/780 noF 5 0.740 0.253 For Opt 1977 VAX 11/730 1.23 0.254 0.156 For Opt 1982 VAX 11/750 0.680 0.20 0.63 0.510 For Opt 1980 VAX 11/785 7.41 1.65 0.46 1.73 1.07 For Opt 1984

- - - Добавлено - - -

Занимательно. Прошлый запуск был под RT-11 v5.0.
Ниже результат теста под RT-11 v5.7

Код:

.@W .FORTRAN/F77/LIST:WHTSTN WHTSTN .LINK WHTSTN,SY:FORLIB/LIBR .RUN WHTSTN ITERATIONS ? 300 300 iterations 481.2734375000 sec on iterations 1.604244828224 sec on iteration 0.6233462691307 Double Whetstone MIPS STOP .

Очень похоже результаты :)

Показывать 40 сообщений этой темы на одной странице