Вот эти горизонтальные блоки, кэшируемо, вычитывать из памяти для всех 8-ми слоёв.
Потом логическая функция скажет нам, какой наименьший слой непрозрачен. Для каждого пикселя читаем 16 бит цвета только этого слоя.
Т.е при записи теперь еще и маску писать нужно? А если каждый слой сдвинут аппаратно относительно друг друга? то внезапно нам нужно в 2 раза больше этих альфа кешей читать?
- - - Добавлено - - -
Сообщение от Nesser
требуются сложные параллельные сумматоры адреса
это кто такой? и с какого перепугу сумматоры стали сложные?