Reobne, навскидку, - может в процедуре поменять местами запись байта и изменение констант (с корректировкой начальных величин, exx вынести вверх), пара байт лишнего jr loop уже и сэкономится, да и структура процедурки покрасивше станет