Недано последнюю версию смотрел конструкция вида tmp = tmp & 0xF8 | arg & 0x07; заняла 12 команд причем в флаг оптимизировать по размеру до одного места. Он даже один единственный 8 битный параметр передает через стек