но пока не знаю с какой стороны подступиться даже
изысканий не проводил, но вижу себе так(довольно грубо):
1. чтением занимаются одинаковые модули. их количество устанавливается в соответствии с необходимым разрешением и фактической скоростью доступа к ОЗУ. состав:
а. кольцевой счётчик с возможностью дополнительного инкремента адреса
б. генератор управляющих сигналов для выборки данных и сигнализации о факте чтения
в. регистр удержания данных.

ну и работа этого добра уже понятна: счётчики идут по адресам друг за другом, дают команду генератору управляющих сигналов, затем генератор даёт команду регистру на сохранение полученных данных. тем временем текущий счётчик переходит по адресу следующему после того, по которому сейчас читает второй модуль. в общем банальная предвыборка. соответственно, если память медленная, а скорость нужна большая, то увеличиваем количество модулей чтения.

2. контроллер записи. с этим всё понятно. единственное, что в нём необходимо предусмотреть - это сигнал разрешения записи, которые опирается на текущие адреса, по которым проводится чтение в данный момент. таким образом модуль будет решать когда надо начать запись, чтобы не сбить синхронизацию.
-------------
А, ну да - естественно строки должны храниться не последовательно в ОЗУ. Поэтому плюсуем блок преобразования адресов - ну тут всё совсем просто - регистры...так и просится рифма)))

было бы больше времени, я бы поучаствовал - такие сложные схемки - это интересно.