А может кто придумать сдвиг на 1 байт куска памяти быстрее LDI?

допустим:
ld hl,#8001
ld de,#8000
dup 200
ldi
edup