Электроника БК 0010-01 vs ZX.

Вид для печати

Показывать 40 сообщений этой темы на одной странице

18.02.2020, 18:41
Manwe

Цитата:

Сообщение от Lethargeek

а непонятно разве, что чем ближе к степени двойки, тем проще двоичная арифметика?
что на практике позволяет 320 умножить на любое число быстрее, чем, допустим 219

Зачем?
18.02.2020, 18:53
Lethargeek

Цитата:

Сообщение от Manwe

Зачем?

:v2_dizzy_facepalm:

- - - Добавлено - - -

Цитата:

Сообщение от Manwe

Это всё стереотипы инженеров. Реальным пользователям по фигу на степени двойки.

реальным пользователям не пофиг на качество (в том числе и скорость, и размеры) программ

Цитата:

Сообщение от Manwe

Мне даже интересно: в современных компьютерах ты тоже серьёзно заморачиваешься, чтобы экран был кратен степеням двойки? А с какой кратностью? На 8 делиться? Или на 256? Или на 2?

в современных проц не на 8 бит, аппаратные деления/умножения и дрова для вычислений на гпу

Цитата:

Сообщение от Manwe

31-цветный. У спрайтов гоблинов может быть другая расцветка. Зато скорость отрисовки высокая.

не особо выше чем с маскированием, больше позволяет сэкономить память на маске

- - - Добавлено - - -

и падажжи, ты опять собрался пиксели-байты складывать словами, не заботясь о переносе?
18.02.2020, 19:11
jerri

Цитата:

Сообщение от Manwe

На БК 0010 умеют.

Почему гоблины такие тормозные?
3 гоблина, зайчик,рог. Чего оно так тормозит?
18.02.2020, 19:49
Manwe

Погодите, у Z80 нет что ли табличной адресации? Чем вас так испугала таблица адресов строк, что вы готовы вместо обращения к таблице по индексу умножать на 256 и складывать с умножением на 64?
18.02.2020, 20:09
NEO SPECTRUMAN

таблица в любом случае лишнее обращение к памяти
чем меньше обращений к памяти
тем быстрей код работает

- - - Добавлено - - -

Цитата:

Сообщение от Manwe

умножать на 256

как бы это элементарная операция для z80 :)

- - - Добавлено - - -

Цитата:

Сообщение от Manwe

Чем вас так испугала

не то чтобы испугала
просто результат виден... :v2_dizzy_facepalm:
18.02.2020, 21:15
jerri

Цитата:

Сообщение от zx_

jerri, И всетаки мне показывали Loom. Сказали для БК0011. Блин

вспоминай вот теперь

Все правильно. Я посмотрел Loom я посмотрел обезяний остров.
Разговор шел что кто-то делает Loom. И показали Остров Обезьян на БК.
Мда. Жаль.
18.02.2020, 21:22
Manwe

Цитата:

Сообщение от NEO SPECTRUMAN

не то чтобы испугала. просто результат виден... :v2_dizzy_facepalm:

Так это результат применения совершенно других методов.

Я говорю вот про какой метод: допустим в R1 у тебя координата X, в R2 координата Y (всегда умноженная на 2). Чтобы получить адрес точки по координатам X,Y ты делаешь

Код:

MOV ScreenLines(R2),R0 ADD R1,R0

Всё, теперь в R0 у тебя адрес точки. Хочешь - стирай её CLRB (R0). Хочешь, записывай число (например, данные из спрайта) MOVB (R3)+,(R0)+

А теперь сравним с умножением на 320 (Y не умножен на 2):

Код:

SWAB R2 MOV R2,R0 ROR R0 ASR R0 ADD R2,R0 ADD R1,R0 SWAB R2

Здесь мы делаем смелое предположение, что бит C заранее сброшен и координата Y настолько мала, что при умножении на 320 не получится переполнения. Если же учесть ещё и это, добавится ещё пара команд как минимум.

Теперь посчитаем такты на БК 4 МГц.

Цитата:

Сообщение от NEO SPECTRUMAN

мы и так знаем что БКшники не умеют считать такты :)

Да-да, конечно :)

В медленной памяти:
первая процедура 56 тактов
вторая процедура 112 тактов

В быстрой памяти:
первая процедура 37.33 такта
вторая процедура 58 тактов

Внезапно 7 команд во второй программе - это 7 обращений к памяти. В то время как первая программа обращается к памяти 4 раза, причём первые два из них происходят за один цикл обработки и попадают в одно окно доступа к памяти.

Ну ладно, а что же с умножением на 256?

Код:

MOV R2,R0 SWAB R0 ADD R1,R0

48 в медленной памяти,
25 в быстрой.

В медленной памяти умножение на 256 получилось не сильно быстрей, чем по таблице (48 vs 56 ~ 17%). Любое отклонение от значения 256, будь оно хоть трижды "красивое" с точки зрения двоичной системы, с треском проигрывает табличному умножению. Любимая спектрумовская высота экрана 192 тоже проиграет.
18.02.2020, 21:47
Lethargeek

Цитата:

Сообщение от Manwe

А теперь сравним с умножением на 320:

1) две команды swab - лишние, пользуйся 16-битностью, пусть всегда будет Y*256
2) прибавляют обычно сразу к адресу, а не переводят каждый раз из координат

- - - Добавлено - - -

Цитата:

Сообщение от Lethargeek

пусть всегда будет Y*256

или *64 если ADD быстрее ROR/ASR
18.02.2020, 21:54
Manwe

Цитата:

Сообщение от Lethargeek

1) две команды swab - лишние, пользуйся 16-битностью, пусть всегда будет Y*256

Убрал два SWAB, получилось 80 тактов. Всё равно больше чем 56.

Цитата:

2) прибавляют обычно сразу к адресу, а не переводят каждый раз из координат

Это принципиально не изменит результатов теста.

Цитата:

Сообщение от Lethargeek

или *64 если ADD быстрее ROR/ASR

Тоже сильно не повлияет.
18.02.2020, 22:17
Lethargeek

Цитата:

Сообщение от Manwe

Убрал два SWAB, получилось 80 тактов. Всё равно больше чем 56.

зато +440 байт, которые могут пригодиться в других табличных расчётах
на машине, где всего-то 15.5 кб свободно
а что в быстрой, кстати?

- - - Добавлено - - -

Цитата:

Сообщение от Lethargeek

зато +440 байт

+ с 320 меньше мучиться с масштабированием/обрезкой при любимом занятии быкашников - конвертации :p

- - - Добавлено - - -

притом табличка для странных разрешений необходима даже в случаях, когда не нужна рекордная скорость, или тормозить будет всё

Показывать 40 сообщений этой темы на одной странице