dup 4
ldi ;hl+1
ldi ;hl+1
dec de ;регистр hl будет бегать по кругу?
ldd ;hl-1
ldd ;hl-1
inc de
inc d
edup

E=4*(16+16+6+16+16+6+4)=4*80=320ticks

dup 4
pop de ;"hl"+2
ld (hl),e
inc l
ld (hl),d
inc h
pop de ;"hl"+2
ld (hl),d
dec l
ld (hl),e
inc h
edup


Я про то что будет тогда рисоватся не тайл размером 2б(ширина) а первые два байта.
ещё незабудь добавить цикл/проверку на "скопирован весь таил" в подсчёты скорости.