Проблема в том, что звук и видео синхронизируются от разных источников синхронизации, они асинхронны по отношению друг к другу. Поэтому в том-же ZXMAK2 есть выбор от чего синхронизироваться - от видео, от звука или от системного таймера.
- - - Добавлено - - -
Direct2D - это не про растровую графику, а про векторную. Изображение рисуется векторами, грубо говоря также как в 3D, а Direct2D рендерит картинку по векторному представлению. С точки зрения вычислительных ресурсов это тяжелей чем 3D, т.к. требования к качеству векторной графики выше чем к 3D.
сейчас опасно код без сырцов запускать