Решил таки выкинуть всю логику где сравнивается c 'x', чтобы спать спокойно. Еще нашел пару своих косяков - теперь стали тарахтеть T1-T4 в цикле M1. А не как было T1-T3 - а никто и не заметил

Особенно доставляет емкостная шина данных, если там поставить "честный" регистр и эмулировать емкость, то получается два весьма разлапистых мультиплексора (отдельные на сброс/установку, ну или один но очень большой), да и данные будут задерживаться на такт, пришлось вникать как оно там по фазам разложено и добавлять расширение строба только в нужных местах, в итоге заработала инструкция LXI, и даже выполняется за оригинальные 10 тактов.

Сейчас нашел Прекрасный ассемблер Онлайн (спасибо автору, IAR-то для Z80 у меня есть, но его на ноуте лениво ставить), буду запускать предварительный тест экзорциста.