А нельзя ли распечатки отсканировать, почистить и от-OCR-ить? а потом как-нибудь сконвертировать в бинарники, наваяв скриптец.