Да тут дело даже не в скорости, нужна вся доступная память. задача проста как три копейки, в начальном загрузчике почитать N блоков в адреса M.
Нет документации..