Важная информация

User Tag List

Страница 9 из 14 ПерваяПервая ... 5678910111213 ... ПоследняяПоследняя
Показано с 81 по 90 из 133

Тема: Сравнение быстродействия процессорных плат (почти в одинаковых условиях)

  1. #81

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    с PDP2011. Если я с моим уровнем знаний смог поднять тактовую частоту от автора с 50 МГц до 100 МГц
    Насколько я помню, PDP2011 на 100МГц довольно далек по производительности от реверсенного ВМ2.
    Давай 1000 знаков Пи посчитаем, сравним?

    Цитата Сообщение от Hunta Посмотреть сообщение
    думаю, запас поднятия ещё есть
    ...
    вроде заявлена до 500 МГц
    Не-а, в проекте PDP-11 всегда есть сумматор на 16 бит, то есть перенос должен отрабатывать через 16 разрядов, даже через специальные выделенные каналы получается не особо быстро.Добавляем к сумматору обвязку чтобы получить хоть что-то похожее на АЛУ - и все, +/-100МГц. Я на EP3C16 для ВМ1 выжал 133МГц со всеми мыслимыми оптимизациями и это видимый предел.

  2. #82

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Пуркуа бы и не па

    Код:
    .run hx7:pieis
    number pi calculator v5 (EIS)
    number of digits (up to 6712)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    98628034825342117067982148086513282306647093844609550582231725359408128481117450
    28410270193852110555964462294895493038196442881097566593344612847564823378678316
    52712019091456485669234603486104543266482133936072602491412737245870066063155881
    74881520920962829254091715364367892590360011330530548820466521384146951941511609
    43305727036575959195309218611738193261179310511854807446237996274956735188575272
    48912279381830119491298336733624406566430860213949463952247371907021798609437027
    70539217176293176752384674818467669405132000568127145263560827785771342757789609
    17363717872146844090122495343014654958537105079227968925892354201995611212902196
    08640344181598136297747713099605187072113499999983729780499510597317328160963185
    95024459455346908302642522308253344685035261931188171010003137838752886587533208
    38142061717766914730359825349042875546873115956286388235378759375195778185778053
    2171226806613001927876611195909216420198 0.95
    .
    - - - Добавлено - - -

    Пардон, там в системе клок 60 Гц. Поправка

    Код:
    .sho conf
    
    RT-11SB  V05.07
    Booted from RK0:RT11SB
    
    USR     is set SWAP
    EXIT    is set SWAP
    KMON    is set NOIND
    MODE    is set NOSJ
    TT      is set NOQUIET
    ERROR   is set ERROR
    SL      is set OFF
    EDIT    is set KED
    FORTRAN is set FORTRA
    KMON nesting depth is 3
    
    CLI is set DCL, CCL, UCL, NO UCF
    
    PDP 11/34 Processor
    56KB of memory
    FP11 Hardware Floating Point Unit
    Extended Instruction Set (EIS)
    60 Hertz System Clock
    
    FPU support
    
    
    .run hx7:clkon
    
    .tim 17:28
    
    .DAT 27-OCT-2020
    
    .RUN HX7:PIEIS
    number pi calculator v5 (EIS)
    number of digits (up to 6712)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    98628034825342117067982148086513282306647093844609550582231725359408128481117450
    28410270193852110555964462294895493038196442881097566593344612847564823378678316
    52712019091456485669234603486104543266482133936072602491412737245870066063155881
    74881520920962829254091715364367892590360011330530548820466521384146951941511609
    43305727036575959195309218611738193261179310511854807446237996274956735188575272
    48912279381830119491298336733624406566430860213949463952247371907021798609437027
    70539217176293176752384674818467669405132000568127145263560827785771342757789609
    17363717872146844090122495343014654958537105079227968925892354201995611212902196
    08640344181598136297747713099605187072113499999983729780499510597317328160963185
    95024459455346908302642522308253344685035261931188171010003137838752886587533208
    38142061717766914730359825349042875546873115956286388235378759375195778185778053
    2171226806613001927876611195909216420198 1.14
    .
    - - - Добавлено - - -

    Но ещё раз - я пока не сильно занимался оптимизацией с точки зрения тактовой частоты в целом и производительности в частном. По результатам SPEED3 можно понять, что, скажем, на операцию сложения регистр-регистр тратится семь тактов - так что, как я уже говорил - оптимизировать есть ещё в чём

    Пока же у меня цель - переделать взаимодействие процессора с миром на мой вариант видиния этого дела Ну и код причесать - опять же с той же целью

    - - - Добавлено - - -

    Код:
    .RUN HX7:SPEED3
    
    Тест быстродействия (кэш, если он есть, выключен)
    
    R1+R0 classic                  14 263 452 оп./сек
    R0(23456.)+R0(12345.) empty     5 546 027 оп./сек
    R1(23456.)+R0(12345.)           3 993 315 оп./сек ->  14 263 451 оп./сек
    R1+@R0 classic                 11 094 491 оп./сек
    R1(23456.)+@R0(M-12345.) empty  5 546 027 оп./сек
    R1(23456.)+@R0(M-12345.)        3 698 032 оп./сек ->  11 098 182 оп./сек
    R0*R0 classic                   8 321 325 оп./сек
    11.*12. empty                   5 546 027 оп./сек
    11.*12.                         3 327 982 оп./сек ->   8 321 327 оп./сек
    R2/R0 classic                   3 566 618 оп./сек
    R2-R3(34567.)/R1(321.) empty    4 159 635 оп./сек
    R2-R3(34567.)/R1(321.)          1 920 184 оп./сек ->   3 566 617 оп./сек
    34567./321. (FPU) empty         1 147 853 оп./сек
    34567./321. (FPU)                 628 089 оп./сек ->   1 387 079 оп./сек
    34567.89022+32109.754321 empty  1 849 217 оп./сек
    34567.89022+32109.754321        1 426 956 оп./сек ->   6 249 100 оп./сек
    34567.89022*32109.754321 empty  1 849 217 оп./сек
    34567.89022*32109.754321          805 358 оп./сек ->   1 426 707 оп./сек
    34567.89022/32109.754321 empty  1 849 217 оп./сек
    34567.89022/32109.754321          792 575 оп./сек ->   1 387 076 оп./сек
    CIS MULPI 1                    - команда не реализована
    CIS MULP  1 empty              - команда не реализована
    CIS MULP  1                    - команда не реализована
    CIS MULPI 2                    - команда не реализована
    CIS MULP  2 empty              - команда не реализована
    CIS MULP  2                    - команда не реализована
    CIS ADDNI 1                    - команда не реализована
    CIS ADDN  1 empty              - команда не реализована
    CIS ADDN  1                    - команда не реализована
    CIS ADDNI 2                    - команда не реализована
    CIS ADDN  2 empty              - команда не реализована
    CIS ADDN  2                    - команда не реализована
    MOV 8 word 1 empty              3 701 979 оп./сек
    MOV 8 word 1                      557 896 оп./сек ->     656 890 оп./сек
    MOV 8 word 2 empty              3 697 352 оп./сек
    MOV 8 word 2                      628 057 оп./сек ->     756 573 оп./сек
    CIS MOVCI 8 word 1             - команда не реализована
    CIS MOVC  8 word 2 empty       - команда не реализована
    CIS MOVC  8 word 2             - команда не реализована
    #4+R0(2000) empty              11 105 939 оп./сек
    #4+R0(2000)                     5 546 027 оп./сек ->  11 078 203 оп./сек
    CMP (R0)+,(R0)+ empty          11 092 056 оп./сек
    CMP (R0)+,(R0)+                 4 341 157 оп./сек ->   7 132 732 оп./сек
    #2+R0(2000) empty              11 092 056 оп./сек
    #2+R0(2000)                     5 546 027 оп./сек ->  11 092 052 оп./сек
    INC R0 INC R0 empty            11 092 056 оп./сек
    INC R0 INC R0                   4 754 036 оп./сек ->   8 319 953 оп./сек
    TST (R0)+ empty                11 092 056 оп./сек
    TST (R0)+                       5 254 799 оп./сек ->   9 985 259 оп./сек
    .
    - - - Добавлено - - -

    Быстродействие J11 на 20 МГц - 5 лимонов. Если бы он мог работать на 100 МГц, его быстродействие было 25, то есть вариант реализации от автора PDP-2011 с моим вмешательством уступает по эффективности на клок чуть меньше, чем в два раза

    - - - Добавлено - - -

    Хотя... если сравнить с результатом вычисления пи на 24-ёх МГц-овом J11 - 9.02 c, то получается, что на 100 МГц у J11 будет 2.16 сек, то есть у меня результат лучше почти в 1.9 раза

  3. #83

    Регистрация
    13.07.2018
    Адрес
    г. Переславль-Залесский
    Сообщений
    710
    Спасибо Благодарностей отдано 
    10
    Спасибо Благодарностей получено 
    45
    Поблагодарили
    41 сообщений
    Mentioned
    6 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Оптимизировать всегда есть куда Только это труд...
    В качестве примера - вопрос памяти... Быстрая память ускорит работу(0 тактов ожидания).
    Насчёт сумматора... Если использовать внешний сумматор?(теоретически?) Или будут большие задержки???
    Последний раз редактировалось Alex; 27.10.2020 в 17:18.

  4. #84

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    Код:
    number of digits (up to 6712)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    ....
    38142061717766914730359825349042875546873115956286388235378759375195778185778053
    2171226806613001927876611195909216420198 1.14
    То есть - 1.14 секунды? 1801ВМ2 на 100МГц - 2.46
    И это странно, потому что он дает 25MIPS на рег-рег против вот-этого:
    Цитата Сообщение от Hunta Посмотреть сообщение
    R1+R0 classic 14 263 452 оп./сек
    Надо будет глянуть как там более сложные инструкции обрабатываются, сколько и каких сумматоров, итд.

    - - - Добавлено - - -

    Цитата Сообщение от Alex Посмотреть сообщение
    Если использовать внешний сумматор?(теоретически?) Или будут большие задержки???
    Все что снаружи еще более медленное чем внутреннее - задержки на обмен все съедят.

  5. #85

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Vslav Посмотреть сообщение
    То есть - 1.14 секунды?
    Да, 1.14 секунды на 100 МГц-ах

    На classic, типа вот этого:
    Код:
    R1+R0 classic                  14 263 452 оп./сек
    лучше не смотреть, там не совсем адекватное выполнение, лучше на то, что под classic, типа вот этого
    Код:
     R1(23456.)+R0(12345.)           3 993 315 оп./сек ->  14 263 451 оп./сек
    я немного по другому тестирую у меня на входе всё время одинаковые аргументы. Но, из за особенностей реализации в PDP2011 на умножении и делении результаты по скорости получаются одинаковые...

    Цитата Сообщение от Vslav Посмотреть сообщение
    потому что он дает 25MIPS на рег-рег против вот-этого:
    Как я уже писал, сейчас в PDP2011 минимальная длина цикла ОЧЕНЬ большая (семь тактов, если правильно помню) даже для простейших операций - типа пересылка из регистра в регистр. Но на более сложных операциях количество циклов увеличивается уже не так сильно. Видимо, поэтому и получается большее быстродействие. Но.. Чёрт его знает По любому - оптимизировать есть что и есть где Просто пока мне не до этого - надо добить переделку проекта Плюс посмотреть, что ещё автор PDP2011 наделал - может, ещё что то из новых изменений перенести.

    - - - Добавлено - - -

    Vslav, будет время - прогони, пожалуйста, мой SPEED3 - http://www.KpXX.Ru/Soft/Utils/Speed3 на 100 МГц-овм ВМ2 ?

  6. #86

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Смотрим в исходники:
    Код:
                         
    eis_temp1 <= signed(alu_input) * signed(alus_input);      -- mul is easy, just use the hw multipliers
    С аппаратным умножителем оно конечно выезжает.
    Попробуем без EIS? 1801ВМ2@100MHz - 6.8 секунды.

  7. #87

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Щас сделаю

  8. #88

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    Vslav, будет время - прогони, пожалуйста, мой SPEED3 - http://www.KpXX.Ru/Soft/Utils/Speed3 на 100 МГц-овм ВМ2 ?
    Обязательно прогоню, сейчас домучаю М4 и буду делать МС1201.01/02, там через HX поднимется RT-11 и можно будет запустить.

  9. #89

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Код:
    56KB of memory
    Extended Instruction Set (EIS)
    50 Hertz System Clock
    
    FPU support
    
    
    .RUN HX7:PINEIS
    number pi calculator v5 (no EIS)
    number of digits (up to 6628)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    98628034825342117067982148086513282306647093844609550582231725359408128481117450
    28410270193852110555964462294895493038196442881097566593344612847564823378678316
    52712019091456485669234603486104543266482133936072602491412737245870066063155881
    74881520920962829254091715364367892590360011330530548820466521384146951941511609
    43305727036575959195309218611738193261179310511854807446237996274956735188575272
    48912279381830119491298336733624406566430860213949463952247371907021798609437027
    70539217176293176752384674818467669405132000568127145263560827785771342757789609
    17363717872146844090122495343014654958537105079227968925892354201995611212902196
    08640344181598136297747713099605187072113499999983729780499510597317328160963185
    95024459455346908302642522308253344685035261931188171010003137838752886587533208
    38142061717766914730359825349042875546873115956286388235378759375195778185778053
    2171226806613001927876611195909216420198 3.94
    .

    Этот пользователь поблагодарил Hunta за это полезное сообщение:

    Vslav(27.10.2020)

  10. #90

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Все равно слишком быстро . OK, подождем теста SPEED на ВМ2, посмотрим что он покажет

Страница 9 из 14 ПерваяПервая ... 5678910111213 ... ПоследняяПоследняя

Информация о теме

Пользователи, просматривающие эту тему

Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)

Похожие темы

  1. Ответов: 18
    Последнее: 16.12.2015, 20:33
  2. Сборка спектрума в домашних условиях
    от Victor в разделе Разный софт
    Ответов: 4
    Последнее: 18.05.2007, 12:56

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •