Цитата Сообщение от Lethargeek Посмотреть сообщение
тупо очередь (даже не законченных команд, а отдельных записей в регистры)
каких команд? их реализация в железе потянет на сожность процессора простого, не проще сразу процессор вставить? И нафик нужен блиттер который просто куски копирует, а я может свет хочу, туман там итд.
Даже в 2d графике можно много ресурсоемких вещей найти
Цитата Сообщение от Lethargeek Посмотреть сообщение
"тормоз" по сравнению с чем? с шейдерными монстрами из миллиардов транзисторов?
тормоз по сравнению с тем что можно сделать, зачем ограничивать себя?
Цитата Сообщение от Lethargeek Посмотреть сообщение
но и даже просто висеть в вайте - всё равно в конечном итоге быстрей в разы, чем отрисовать процом то же самое
а можно и не висеть а заниматься чем то полезным а более быстрый проц у которого скажем регистровый файл подключен на прямую к блиттеру делает это быстрее

- - - Добавлено - - -

Банальный пример,
нужно нарисовать заник с водичкой там туманом, ну 2-3 слоя.
Спрайты и передний план тоже полупрозрачый.

пусть 16 бит память, работаем исключительно пакетами и потерь 0), возьмем кусок 32х32 пикселя.
1. Выводим задник, 1024 цикла
2. Выводим полупрозрачную водичку, 1024 чтение + 1024 запись результата
3. Выводим туман, 1024 + 1024
4. Выводим спрайт, пусть занимает половину 512
5. Выводим полупрозраный передный план 1024+1024

итого 7.5к тактов, + на чтение патернов спрайтов итд, пусть разные 4.5к тактов итого 12 к тактов

теперь если мы обрабатываем эту всю историю в внутренем буфере в 1к байт
4.5к чтение патернов + 1024 запись итого 5.5к профит в раза.

Далее, если патерн повторяющийся к примеру 16х16, профит с буфером еще больше, а если тума и водичка еще и генерятся процом в видяхе ... (хотя тут может быть выгоднее прочитать)