User Tag List

Показано с 131 по 140 из 189

Тема: Сравнение скорости копирования ОЗУ разными камнями и ЭВМ

Древовидный режим

Предыдущее сообщение Предыдущее сообщение   Следующее сообщение Следующее сообщение
  1. #11

    Регистрация
    16.12.2014
    Адрес
    г. Ожерелье
    Сообщений
    769
    Спасибо Благодарностей отдано 
    252
    Спасибо Благодарностей получено 
    46
    Поблагодарили
    42 сообщений
    Mentioned
    2 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от Alex Посмотреть сообщение
    Чего хотеть - Архимед на ядре ARM , первый компьютер более-менее массовый...
    Но вот зараза, за рубежом он остался экзотикой.
    Так что не только СССР проморгал его...
    Архимедов было сравнительно мало не из-за качества техники, а из-за темных штучек глобального маркетинга, тесно связанного с политикой. Американцы сделали свои риски намного раньше британцев, уже к 1981 было не менее трех изделий. Одно потом стало POWER, другое после 30 лет выдержки RISC V, а третье даже немного использовалось в тени уже тогда. Однако, глобальный тренд был показывать лидерство IBM, продвигать x86, славить Вакса и тормозить сторонние инновации. Арм лишь ускорил неизбежные перемены. Хотя считаю, что ассемблер Арма был реально самым крутым среди всех процессоров. Когда столкнулся с Архимедом в начале 1991, это было очень сильное впечатление.

    - - - Добавлено - - -

    Цитата Сообщение от Alex Посмотреть сообщение
    С одной стороны MOV (PC)+, (PC)+ здесь всегда всё хорошо, иначе большая часть программ работать не будет
    с другой MOV (R0)+,(R0)+ тут возможно западло ... А если ещё MOV -(R0),-(R0) ...
    Но к счастью большая часть народа в курсе, и ничего такого не пишет Либо если пишут, то проверяют отладчиком ...
    Интересно, откуда взялась мнемоника SOB - это же ругательство? Может там менеджмент обидел кого из инженеров? Интересно, что даже такая базовая операция как XOR есть не на всех PDP-11. Вообще писать переносимые коды для всех PDP-11 штука непростая. Не уверен, что даже MOV (PC)+,(PC)+ везде работает одинаково.

    - - - Добавлено - - -

    Цитата Сообщение от ra3qdp Посмотреть сообщение
    а мне неинтересен сам тест скорости копирования памяти, т.к. сама скорость памяти вещь не конкретная при одинаковых процессорах PDP-11.
    Как это не учитывать скорость памяти? Это ключевой параметр. На Raspberry Pi регулировал скорость кэша, это заметно влияло на быстродействие. Конечно, можно делать тесты на регистровые расчеты, но тут разница будет сильно зависить от числа регистров и особенностей расчета и от скорости памяти всё равно будет зависимость.

    - - - Добавлено - - -

    Цитата Сообщение от ivagor Посмотреть сообщение

    Подробнее про выигрыш от стековых операций 8080 при копировании


    Я приводил фрагменты кода для 8080 и могу расписать пару примеров для него:
    Дополнительные действия в прерывании, связанные с методом Медноногова занимают в районе 146 тактов, пусть даже возьмем с запасом 200, это не принципиально. Пусть частота процессора 2.5 МГц.
    При кадровых прерываниях с частотой 50 Гц длительность кадра 2.5e6/50=50000 тактов.
    200/50000=0.0040 или 0.4% накладные расходы связанные с методом Медноногова. Посмотрим как это сказывается на выигрыше от стековой пересылки. Если берем развернутые циклы, то без стека 24 такта/байт, стеком - 17 тактов/байт.
    1. Если пересылки исходно занимают хотя бы половину прерывания (для пересылок графики в современной насыщенной динамичной игре это даже мало), то при 24 тактах на байт 25000/24=1041 байт.
    При 17 тактах/байт 1041*17=17697 тактов.
    Итого: 25000-17697-200=7103 тактов чистого выигрыша/кадр при использовании метода Медноногова в описанных условиях.
    7103/50000=0.1421= округлю в меньшую сторону 14.2%
    2. Аналогично можно посчитать менее напряженный вариант, когда пересылки занимают 1/10 прерывания.
    Сразу итог: 1264/50000=0.0253= округлю в меньшую сторону 2.5%

    Можно дальше уменьшать число пересылаемых байт и в районе 30 байт на прерывание вариант без стека станет выгоднее. Но при таком незначительном количестве пересылок речь уже идет не о скорости, а о занимаем месте (значит никаких развернутых циклов) и об удобстве использования. Т.е. это предмет для обсуждения в другой ветке.
    [свернуть]
    Благодарю вас за столь детальный анализ, однако, возможно вы лишь скорее подтвердили моё мнение. Писал про выигрыш от нетипичной работы с указателем стека на фоне издержек на реализацию ВСЕЙ игровой логики. Возможно выигрыш будет и чуть больше, чем 5%, но очень сомнительно, что достигнет 10%. Это для микрош совсем неплохо: когда спрайты двигаются недостаточно плавно, то это раздражает. И даже 5-10% это приятное улучшение. Но в итоге операции копирования занимают гораздо больше места, отнимая память у общей игровой логики, и тем самым превращая игру скорее в демку. О чем и писал с самого начала.
    Последний раз редактировалось litwr; 26.05.2023 в 19:05.

Информация о теме

Пользователи, просматривающие эту тему

Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)

Похожие темы

  1. Сравнение: AY8930/AY8910/YM2149F
    от newart в разделе Звук
    Ответов: 56
    Последнее: 02.07.2022, 10:27
  2. Как сопрягать микросхемы с разными VCC?
    от dhau в разделе Несортированное железо
    Ответов: 22
    Последнее: 08.06.2012, 16:59
  3. Скорости загрузки в ОЗУ
    от ASDT в разделе ZX Концепции
    Ответов: 56
    Последнее: 07.01.2011, 14:22

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •