User Tag List

Страница 13 из 14 ПерваяПервая ... 91011121314 ПоследняяПоследняя
Показано с 121 по 130 из 133

Тема: Сравнение быстродействия процессорных плат (почти в одинаковых условиях)

  1. #121

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    Так я твой и взял - просто убрал работу с двумя регистрами и добавил включение таймера
    Я про этот спрашивал: ".run hx7ieis"
    Хочу посмотреть оптимизации, возможно добавить в свои тесты.

    Цитата Сообщение от Hunta Посмотреть сообщение
    Или 7.16 секунды
    Ну теперь всё более менее на свои места встало
    Ага, таки ВМ2 быстрее немножко
    Почему 2011 с EIS лучше -- тоже понятно, аппаратный умножитель.

  2. #121
    С любовью к вам, Yandex.Direct
    Размещение рекламы на форуме способствует его дальнейшему развитию

  3. #122

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Vslav Посмотреть сообщение
    Хочу посмотреть оптимизации, возможно добавить в свои тесты.
    Этот я откуда то готовый скачал

    Цитата Сообщение от Vslav Посмотреть сообщение
    Ага, таки ВМ2 быстрее немножко
    Ну, как я и писАл - у меня есть чего оптимизировать

  4. #123

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    М6 оказалась тоже рабочей. Инфа по скорострельности (неформальная, просто для понимания уровня):

    Код:
    000001
    @10000/057777 12706
    010002/136667 10000
    010004/075445 12746
    .......
    010126/040000 4715
    010130/110400 5007
    @10000G
    HX 2.2  RT-11 Cold boot..
    
    HX DSK/TTY multiplexer   v3.3  2016
    
    RT-11SB (S) V05.07
    
    .R MSCPCK
    
    .RUN HX7:SPEED3
    
    Тест быстродействия (кэш, если он есть, выключен)
    
    R1+R0 classic                     556 915 оп./сек
    R0(23456.)+R0(12345.) empty       174 292 оп./сек
    R1(23456.)+R0(12345.)             132 441 оп./сек ->     551 561 оп./сек
    R1+@R0 classic                    314 020 оп./сек
    R1(23456.)+@R0(M-12345.) empty    174 299 оп./сек
    R1(23456.)+@R0(M-12345.)          111 624 оп./сек ->     310 426 оп./сек
    R0*R0 classic                      34 473 оп./сек
    11.*12. empty                     174 342 оп./сек
    11.*12.                            28 754 оп./сек ->      34 432 оп./сек
    R2/R0 classic                     125 627 оп./сек
    R2-R3(34567.)/R1(321.) empty      132 876 оп./сек
    R2-R3(34567.)/R1(321.)             17 813 оп./сек ->      20 570 оп./сек
    34567./321. (FPU) empty            16 241 оп./сек
    34567./321. (FPU)                   2 796 оп./сек ->       3 377 оп./сек
    34567.89022+32109.754321 empty     25 434 оп./сек
    34567.89022+32109.754321            8 889 оп./сек ->      13 664 оп./сек
    34567.89022*32109.754321 empty     25 434 оп./сек
    34567.89022*32109.754321            3 096 оп./сек ->       3 525 оп./сек
    34567.89022/32109.754321 empty     25 429 оп./сек
    34567.89022/32109.754321            3 405 оп./сек ->       3 931 оп./сек
    CIS MULPI 1                    - команда не реализована
    CIS MULP  1 empty              - команда не реализована
    CIS MULP  1                    - команда не реализована
    CIS MULPI 2                    - команда не реализована
    CIS MULP  2 empty              - команда не реализована
    CIS MULP  2                    - команда не реализована
    CIS ADDNI 1                    - команда не реализована
    CIS ADDN  1 empty              - команда не реализована
    CIS ADDN  1                    - команда не реализована
    CIS ADDNI 2                    - команда не реализована
    CIS ADDN  2 empty              - команда не реализована
    CIS ADDN  2                    - команда не реализована
    MOV 8 word 1 empty                116 032 оп./сек
    MOV 8 word 1                       13 829 оп./сек ->      15 700 оп./сек
    MOV 8 word 2 empty                116 223 оп./сек
    MOV 8 word 2                       16 321 оп./сек ->      18 987 оп./сек
    CIS MOVCI 8 word 1             - команда не реализована
    CIS MOVC  8 word 2 empty       - команда не реализована
    CIS MOVC  8 word 2             - команда не реализована
    #4+R0(2000) empty                 348 089 оп./сек
    #4+R0(2000)                       174 346 оп./сек ->     349 297 оп./сек
    CMP (R0)+,(R0)+ empty             348 688 оп./сек
    CMP (R0)+,(R0)+                   133 948 оп./сек ->     217 500 оп./сек
    #2+R0(2000) empty                 348 657 оп./сек
    #2+R0(2000)                       174 336 оп./сек ->     348 687 оп./сек
    INC R0 INC R0 empty               348 629 оп./сек
    INC R0 INC R0                     154 485 оп./сек ->     277 412 оп./сек
    TST (R0)+ empty                   348 626 оп./сек
    TST (R0)+                         155 312 оп./сек ->     280 092 оп./сек
    .
    Последний раз редактировалось Hunta; 25.12.2020 в 14:51.

  5. #124

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Ещё немного инфы по быстродействию - теперь памяти в разных вариантах. В качестве подопытного кролика выступает одна и та же процессорная плата KDJ11-B

    Код:
                        Не PMI память                   PMI память, не правильно подключена,                PMI память, подключена правильно
    .RUN HX7:SPEED3                                     .RUN HX7:SPEED3                                     .RUN HX7:SPEED3
    
    Тест быстродействия (кэш, если он есть, выключен)   Тест быстродействия (кэш, если он есть, выключен)   Тест быстродействия (кэш, если он есть, выключен)
    
    R1+R0 classic                  920 149              R1+R0 classic                  883 626              R1+R0 classic                 1 162 012
    R0(23456.)+R0(12345.) empty    229 522              R0(23456.)+R0(12345.) empty    220 905              R0(23456.)+R0(12345.) empty     291 051
    R1(23456.)+R0(12345.)          183 619 -> 918 123   R1(23456.)+R0(12345.)          176 724 -> 883 620   R1(23456.)+R0(12345.)           232 840 -> 1 164 184
    R1+@R0 classic                 423 098              R1+@R0 classic                 388 259              R1+@R0 classic                  425 328
    R1(23456.)+@R0(M-12345.) empty 229 519              R1(23456.)+@R0(M-12345.) empty 220 904              R1(23456.)+@R0(M-12345.) empty  291 063
    R1(23456.)+@R0(M-12345.)       147 043 -> 409 199   R1(23456.)+@R0(M-12345.)       140 753 -> 387 929   R1(23456.)+@R0(M-12345.)        172 399 ->   422 865
    R0*R0 classic                  219 411              R0*R0 classic                  216 607              R0*R0 classic                   230 187
    11.*12. empty                  229 527              11.*12. empty                  220 904              11.*12. empty                   291 065
    11.*12.                        110 334 -> 212 467   11.*12.                        108 614 -> 213 672   11.*12.                         126 994 ->   225 289
    R2/R0 classic                  567 168              R2/R0 classic                  565 061              R2/R0 classic                   664 781
    R2-R3(34567.)/R1(321.) empty   183 620              R2-R3(34567.)/R1(321.) empty   176 723              R2-R3(34567.)/R1(321.) empty    232 840
    R2-R3(34567.)/R1(321.)          82 714 -> 150 515   R2-R3(34567.)/R1(321.)          81 106 -> 149 903   R2-R3(34567.)/R1(321.)           93 308 ->   155 705
    34567./321. (FPU) empty         90 287              34567./321. (FPU) empty         86 880              34567./321. (FPU) empty          99 345
    34567./321. (FPU)               74 060 -> 412 069   34567./321. (FPU)               72 798 -> 449 132   34567./321. (FPU)                82 274 ->   478 795
    34567.89022+32109.754321 empty  61 537              34567.89022+32109.754321 empty  59 818              34567.89022+32109.754321 empty   70 428
    34567.89022+32109.754321        56 564 -> 699 935   34567.89022+32109.754321        54 397 -> 600 243   34567.89022+32109.754321         63 540 ->   649 679
    34567.89022*32109.754321 empty  61 540              34567.89022*32109.754321 empty  59 818              34567.89022*32109.754321 empty   70 989
    34567.89022*32109.754321        56 556 -> 698 325   34567.89022*32109.754321        54 397 -> 600 243   34567.89022*32109.754321         63 579 ->   609 097
    34567.89022/32109.754321 empty  61 531              34567.89022/32109.754321 empty  59 831              34567.89022/32109.754321 empty   70 980
    34567.89022/32109.754321        56 560 -> 700 099   34567.89022/32109.754321        54 398 -> 599 058   34567.89022/32109.754321         63 614 ->   612 995
    MOV 8 word 1 empty             153 550              MOV 8 word 1 empty             147 455              MOV 8 word 1 empty              194 289
    MOV 8 word 1                    17 422 ->  19 651   MOV 8 word 1                    16 780 ->  18 934   MOV 8 word 1                     20 425 ->    22 824
    MOV 8 word 2 empty             153 013              MOV 8 word 2 empty             147 270              MOV 8 word 2 empty              194 045
    MOV 8 word 2                    21 646 ->  25 212   MOV 8 word 2                    20 349 ->  23 611   MOV 8 word 2                     24 020 ->    27 413
    R1 := M(word)                  291 083              R1 := M(word)                  271 564              R1 := M(word)                   319 578
    R1 := M(even byte)             290 730              R1 := M(even byte)             272 249              R1 := M(even byte)              318 144
    R1 := M(odd byte)              290 741              R1 := M(odd byte)              272 249              R1 := M(odd byte)               318 197
    #4+R0(2000) empty              460 051              #4+R0(2000) empty              441 811              #4+R0(2000) empty               582 163
    #4+R0(2000)                    229 521 -> 458 037   #4+R0(2000)                    220 905 -> 441 809   #4+R0(2000)                     291 073 ->   582 129
    CMP (R0)+,(R0)+ empty          459 064              CMP (R0)+,(R0)+ empty          441 812              CMP (R0)+,(R0)+ empty           582 160
    CMP (R0)+,(R0)+                168 517 -> 266 256   CMP (R0)+,(R0)+                160 357 -> 251 719   CMP (R0)+,(R0)+                 192 612 ->   287 848
    #2+R0(2000) empty              460 019              #2+R0(2000) empty              441 811              #2+R0(2000) empty               582 164
    #2+R0(2000)                    230 001 -> 459 985   #2+R0(2000)                    220 905 -> 441 809   #2+R0(2000)                     291 069 ->   582 112
    INC R0 INC R0 empty            460 063              INC R0 INC R0 empty            441 812              INC R0 INC R0 empty             582 157
    INC R0 INC R0                  229 523 -> 458 033   INC R0 INC R0                  220 905 -> 441 808   INC R0 INC R0                   291 073 ->   582 135
    TST (R0)+ empty                459 055              TST (R0)+ empty                441 811              TST (R0)+ empty                 582 161
    TST (R0)+                      220 591 -> 424 648   TST (R0)+                      206 660 -> 388 280   TST (R0)+                       247 104 ->   429 342
    CLR R0 - SOB R0, . empty       920 080              CLR R0 - SOB R0, . empty       883 626              CLR R0 - SOB R0, . empty      1 164 319
    CLR R0 - SOB R0, .                   5 ->       5   CLR R0 - SOB R0, .                   5 ->       5   CLR R0 - SOB R0, .                    7 ->         7
    Занимательно, что не PMI память оказалась чуть быстрее, чем PMI, хотя на ней на чипах памяти стоит пометка - -15, а на PMI - -10. Возможно, PMI-ную можно подстегнуть, подсказав про быстродействие чипов (все в панельках - я поменял после покупки) - есть ещё некоторое количество перемычек, назначение которые не знаю...

  6. #125

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Захотелось мне тут, как обычно, странного
    Взял я KDJ11-A (если точнее - M8192YB) и поменял кварц с штатного 15.206 на 24. Ну и J11 воткнул тот, который заводится на этой частоте.

    К некоторому удивлению (хоть и небольшому), плата запустилась.

    Прогнал тесты SPEED3 (без кэш памяти) и SPEED4 (с кэш памятью). До и после смены кварца.

    Когда увидел результаты SPEED3 после смена кварца - аж засомневался - а тот ли я кварц впаял. С воткнутой в бэкплейн платой кварца не видно (память загораживает), поэтому проверку отложил до прогона и SPEED4, но SPEED4 показал - однозначно 24. Чуть позже выложу результаты, пока ещё SPEED4 идёт.

    - - - Добавлено - - -

    Результаты (стенд один в один, менялся только кварц и процессор) (emp - empty - для расчёта накладных расходов), всё в оп/с

    Код:
                                   15.206, no cache  24, no cache      15.206, cache        24, cache
    R0(23456.)+R0(12345.) emp.    154 284           172 457           926 354             1 457 892
    R1(23456.)+R0(12345.)         123 428> 617 156  137 556> 679 708  744 540> 3 793 479  1 172 443> 5 988 093
    R1(23456.)+@R0(M-12345.) emp. 154 284           172 457           926 353             1 457 884
    R1(23456.)+@R0(M-12345.)       98 286> 270 794  110 776> 309 724  534 663> 1 264 486    842 556> 1 996 250
    11.*12. emp.                  154 284           172 457           926 353             1 457 887
    11.*12.                        73 243> 139 438   92 650> 200 209  145 371>   172 430    229 379>   272 207
    R2-R3(34567.)/R1(321.) emp.   123 428           137 556           744 541             1 172 444
    R2-R3(34567.)/R1(321.)         54 234>  96 742   70 155> 143 176   97 005>   111 536    153 090>   176 081
    34567./321. (FPU) emp.         25 837            35 865            36 433                57 506
    34567./321. (FPU)              12 022>  22 483   17 709>  34 982   14 182>    23 221     22 413>    36 727
    34567.89022+32109.754321 emp.  36 089            44 243            90 117               142 220
    34567.89022+32109.754321       23 471>  67 129   30 817> 101 551   40 748>    74 380     64 315>   117 410
    34567.89022*32109.754321 emp.  36 089            44 243            90 117               142 220
    34567.89022*32109.754321       13 600>  21 824   19 225>  33 998   18 027>    22 534     28 478>    35 608
    34567.89022/32109.754321 emp.  36 089            44 243            90 117               142 220
    34567.89022/32109.754321       13 705>  22 096   19 757>  35 698   18 227>    22 848     28 764>    36 056
    MOV 8 word 1 emp.             102 985           114 774           622 987               981 476
    MOV 8 word 1                   11 625>  13 104   13 560>  15 376   28 975>    30 388     39 649>    41 318
    MOV 8 word 2 emp.             102 857           114 972           622 208               980 249
    MOV 8 word 2                   14 169>  16 432   16 489>  19 249   34 197>    36 185     45 694>    47 928
    R1 := M(word)                 189 641           215 838           927 510             1 459 711
    R1 := M(even byte)            189 405           215 568           926 352             1 457 896
    R1 := M(odd byte)             189 405           215 567           926 352             1 459 896
    CLR R0 - SOB R0, . emp.       617 145           687 787           187 277               490 858
    CLR R0 - SOB R0, .                  3>       3        4>       4       11>        11         18>        18

  7. #126

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Вспомнилось
    Цитата Сообщение от forth32 Посмотреть сообщение
    Вот результат вычислений числа пи:
    Код:
    .RUN RK3:PIEIS
    number pi calculator v5 (EIS)
    number of digits (up to 3392)? 1000
    3141592653589793238462643383279502884197169399375105820974944592307862862089
    ......................
    2171226806613001927876611195909216420198 1.62
    
    .RUN RK3:PINEIS
    number pi calculator v5 (no EIS)
    number of digits (up to 3308)? 1000
    3141592653589793238462643383279502884197169399375105820974944592307862862089
    ......................
    2171226806613001927876611195909216420198 6.06
    Если я правильно помню, результаты для ВМ2 на 100 МГц
    Новые мои результаты (точно на 100 МГц)

    Код:
    .RU PIEIS
    number pi calculator v5 (EIS)
    number of digits (up to 6548)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    .....................
    2171226806613001927876611195909216420198 1.24
    .RUN PINEIS
    number pi calculator v5 (no EIS)
    number of digits (up to 6464)? 1000
    31415926535897932384626433832795028841971693993751058209749445923078164062862089
    .....................
    2171226806613001927876611195909216420198 4.58
    .
    - - - Добавлено - - -

    Цитата Сообщение от Vslav Посмотреть сообщение
    Не-а, в проекте PDP-11 всегда есть сумматор на 16 бит, то есть перенос должен отрабатывать через 16 разрядов, даже через специальные выделенные каналы получается не особо быстро.Добавляем к сумматору обвязку чтобы получить хоть что-то похожее на АЛУ - и все, +/-100МГц
    Ну, довёл я до 200 МГц, но только младшие процессора (нет ДП) - так что пока не готов проект перевести на постоянные 200 МГц Есть мысли по оптимизации и кое что уже и сделано и дало свой результат - 20 лимонов против 14 на самой быстрой команде (BR). Но на 100 МГц BR в пределе должна давать 50 лимонов - так что - есть куда стремиться

  8. #127

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    Ну, довёл я до 200 МГц, но только младшие процессора (нет ДП) - так что пока не готов проект перевести на постоянные 200 МГц Есть мысли по оптимизации и кое что уже и сделано и дало свой результат - 20 лимонов против 14 на самой быстрой команде (BR). Но на 100 МГц BR в пределе должна давать 50 лимонов - так что - есть куда стремиться
    Дык, исходников нет, никак прокомментировать не могу. Надо смотреть что там написано.
    Сама по себе частота не фокус, можно, например, с мультицикловыми констрейнами ВМ2 и на 500МГц переписать. Если б он от этого еще стал бы быстрее
    И у тебя плата на 5-ом циклоне вроде же? Там развлекаться сильно проще - и ресурсов много, и быстрое, и ячейки 8-входовые.

  9. #128

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Vslav Посмотреть сообщение
    Сама по себе частота не фокус, можно, например, с мультицикловыми констрейнами ВМ2 и на 500МГц переписать.
    Констрейнтами я так толком и не научился (по крайне мере пока) пользоваться, так что нет, без них
    Цитата Сообщение от Vslav Посмотреть сообщение
    И у тебя плата на 5-ом циклоне вроде же?
    Цитата Сообщение от Hunta Посмотреть сообщение
    Единственно только предположение - у меня 5CSXFC6D6F31C6N, поэтому и вылезает за счёт его быстроты.
    Цитата Сообщение от Vslav Посмотреть сообщение
    М-м-м-м.... Частота же одинаковая - 100МГц, какая тут "быстрота"?
    Частота одинаковая - причём здесь 5-ый циклон?

    - - - Добавлено - - -

    Цитата Сообщение от Vslav Посмотреть сообщение
    Дык, исходников нет, никак прокомментировать не могу. Надо смотреть что там написано.
    Поскольку у меня этот проект в значительной степени экспериментальный и изменения происходят часто и может быть откат изменений и опять возврат к ним - даже через год - я не планирую пока их делать общедоступными Смысла не вижу

  10. #129

    Регистрация
    31.03.2013
    Адрес
    г. Киев
    Сообщений
    2,413
    Спасибо Благодарностей отдано 
    132
    Спасибо Благодарностей получено 
    759
    Поблагодарили
    353 сообщений
    Mentioned
    88 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Hunta Посмотреть сообщение
    Поскольку у меня этот проект в значительной степени экспериментальный и изменения происходят часто и может быть откат изменений и опять возврат к ним - даже через год - я не планирую пока их делать общедоступными Смысла не вижу
    Тогда и обсуждать особо нечего.

  11. #130

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Что-то в упор не помню, гонял ли я свои SPEEDx на simh. А искать лень. Так что.. встречаем simh на Xeon E5680 3.33 ГГц
    Код:
    LSI 11 or PDP 11/03 Processor
    56KB of memory
    50 Hertz System Clock
    
    No SYSGEN options enabled
    
    
    .RUN SPEED0
    
    Тест быстродействия (кэш, если он есть, выключен)
    
    BR .+2                      64 031 600  оп./сек
    R0(23456.)+R0(12345.) empty 16 171 734  оп./сек
    R1(23456.)+R0(12345.)       10 162 680  оп./сек ->  27 350 088  оп./сек
    .
    То есть... При частоте в почти 139 быстрее, чем мой J11 на 24 МГц его производительность выше только в 10.66 раз...

Страница 13 из 14 ПерваяПервая ... 91011121314 ПоследняяПоследняя

Информация о теме

Пользователи, просматривающие эту тему

Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)

Похожие темы

  1. Ответов: 18
    Последнее: 16.12.2015, 20:33
  2. Сборка спектрума в домашних условиях
    от Victor в разделе Разный софт
    Ответов: 4
    Последнее: 18.05.2007, 12:56

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •