Реверс-инжиниринг Z80

Вид для печати

Показывать 40 сообщений этой темы на одной странице

13.09.2024, 20:51
Titus

Цитата:

Сообщение от SegaBoy

Может сначала всё-таки перенести в верилог модель z80 как есть, со всеми защёлками, а потом её уже причесать под один клок?

Нет смысла делать двойную работу.
13.09.2024, 20:54
zebest

Цитата:

Сообщение от Titus

Может и клон амиги сделают наконец)

А что с ним не так??? в ФПГА как бы давно есть
13.09.2024, 21:43
Titus

Цитата:

Сообщение от zebest

А что с ним не так??? в ФПГА как бы давно есть

Потактово точный, основанный исключительно на реверсе всех чипов, от процессора до кастомных чипов.
14.09.2024, 16:56
Titus

Цитата:

Сообщение от Titus

Вот для этого фрагмента (кстати, я его уже переписал на полностью синхронные триггеры):

Разобрался с этим фрагментом, скорректировал, вопросов по нему больше нет)
14.09.2024, 21:49
AlexG

Малость теории.
1) В плисах есть два типа сигналов: дата и тактовый. они разводятся каждый по своим дорожкам. Дата условно "абы кабы". Тактовый по своим "чтоб тактовый был там где надо вовремя" (очень условное описание). Дата - потому что длина цепей относительно мала, а тактовые по всей плисе на тысячи триггеров "одновременно".
2) К примеру асинхронный счётчик на Д-триггере
https://studfile.net/html/2706/245/h...img-7f5rW6.png
его быстродействие равно длительности распространения от первого C до последнего Q. Пока сигнал "бежит" - выход счётчика может принимать все фантастические значения. А если по этим выходам формируются "обратные связи" на эти же триггера - результат вообще не предсказуемый.
Посему делают только синхронные счётчики - это на С поступает только тактовый сигнал. на Д - через "внешнюю логику, описывающую поведение счётчика".
Другой случай когда на тысячу триггеров заводят "тактовый с выхода Q" - а так как он будет разводится абы кабы (однако есть способы как сделать более правильно - но это будет "грязно выглядеть") - то и поведение такой схемы будет "очень волшебным", а быстродействие упадёт на порядок другой...
Сиё максимально упрощённое описание...
ПС: Особый кайф, это когда берут выход условной К155ЛР3 и подают на С-вход. Пока логика устаканится - выход 100500 раз поменяет своё значение - а триггер (или даже синхронный счётчик) всё ЭТО посчитает... 8-0
14.09.2024, 22:29
HardWareMan

AlexG, всё верно. И именно поэтому надо смотреть в условный TimeQuest на Clock Skew или хотя-бы Fmax чтобы понимать, что фиттер положил насинтезированное так, что задержки укладываются в твой такт. Тогда проект будет работать на всех указанных тобой чипах в любых условиях, а не глючить в зависимости от фазы луны и желанию твоей левой пятки.
https://i.postimg.cc/zfkj5k7Q/image.png
Побольше синих и отсутствие красных. И ещё, если попытаешься комбинаторику в такты зарулить без правильного преобразования оно тебе прокричит про ripple clock.
15.09.2024, 01:57
Titus

Цитата:

Сообщение от HardWareMan

И ещё, если попытаешься комбинаторику в такты зарулить без правильного преобразования оно тебе прокричит про ripple clock.

Что такое 'правильное преобразование'?
15.09.2024, 09:38
HardWareMan

Цитата:

Сообщение от Titus

Что такое 'правильное преобразование'?

Есть несколько методов разного рода, когда действительно надо сформировать вторичный тактовый домен. Например, синхронизация через общую тактовую частоту. Но чаще проще просто оставаться в одном тактовом домене используя условия. Тогда при правильном описании синтезатор сам вместо муксов заюзает специальный сигнал ENA.
https://i.postimg.cc/CxPShJpQ/image.png

PS В самом примитивном варианте, такты должны выходить из триггера. Точка.
15.09.2024, 12:54
Titus

В общем, что касается правильного тактирования схемотехнически, мне все более-менее понятно.

В плане реализации этого на Verilo'е могут быть вопросы, но это спрошу, если понадобится.

п.с.: Никто так и не заметил, что я накосячил, и случайно обьединил все 8-битные половинки регистров в 16-битные, из-за чего нельзя записывать половинки) Ну да, кому нужны схемы-то) Всем нужна готовая модель или эмулятор) Или какие-то вскрытые тайны и особенности простым языком)
15.09.2024, 12:57
ZXMAK

такие вещи взглядом не заметишь. Это как программа написанная, но ни разу не скомпилированная. Смотришь вроде все правильно, а начнешь компилировать и дебажить и вылезут ошибки.
15.09.2024, 13:00
Titus

Цитата:

Сообщение от ZXMAK

такие вещи взглядом не заметишь. Это как программа написанная, но ни разу не скомпилированная. Смотришь вроде все правильно, а начнешь компилировать и дебажить и вылезут ошибки.

Да, я думаю, если сконвертировать на верилог текущее состояние логической схемы (не транзисторной, с ней на 99.999% все ок), то это сразу не заработает)
17.09.2024, 21:08
Barmaley_m

Цитата:

Сообщение от Titus

Как поступить в случае, когда какие-то триггеры тактируются фронтом не глобального CLK, а каким-то другим сигналом, например, T1 (им тактируется счетчик фаз M1, M2 и т.д.). Как правильно сделать, вот так:

Код:

always @(posedge T1) begin ... end

Либо же во так:

Код:

always @(posedge clk) begin if (T1 = 1) begin ... end end

Однозначно второй вариант. По возможности надо делать так, чтобы все триггеры схемы тактировались одной частотой. Если какие-то части схемы работают на половине или других долях от этой частоты - то следует использовать вход триггеров Clock Enable (CE), описав его на HDL в виде команды if, наподобие твоего второго варианта, для достижения поставленной цели.

Деление тактовой частоты триггером и использование результата для тактирования какой-то части схемы имеет следующие недостатки:
1) Расходуются глобальные тактовые буферы (в примере Spartan6 - BUFG)
2) Поделенная тактовая частота будет из-за задержек элементов схемы и разводки выхода триггера на тактовый буфер и обратно сдвинута по фазе относительно исходной. Эти сдвиги затронут также все сигналы от триггеров, работающих от половины тактовой частоты. Все эти задержки будут отниматься от "бюджета времени" при переходе сигналов данных от триггеров, тактируемых полной тактовой частотой, на триггеры, тактируемые ее половиной, и обратно. В результате будет труднее обеспечить выполнение Timing constraints, снизится максимальная тактовая частота проекта.
18.09.2024, 03:27
Titus

Цитата:

Сообщение от Barmaley_m

Если какие-то части схемы работают на половине или других долях от этой частоты - то следует использовать вход триггеров Clock Enable (CE),

До того, как Hardwareman про это написал, я не знал, что у триггеров в ПЛИС есть входы разрешения тактирования. Так-то оно конечно, логичнее. Другой вопрос - на всех ли современных ПЛИС у триггеров есть входы CE?

- - - Добавлено - - -

Цитата:

Сообщение от Barmaley_m

1) Расходуются глобальные тактовые буферы (в примере Spartan6 - BUFG)

Сколько их в среднем бывает?
И прям на каждый клок триггера расходуется свой буфер, если клок не совпадает с уже имеющимися?

- - - Добавлено - - -

Вот в этом примере что, на каждый следующий каскад расходуется глобальный тактовый буфер?

https://studfile.net/html/2706/245/h...img-7f5rW6.png
18.09.2024, 11:06
AlexG

1) У всех xilinx ( упоминал ранее UG768 v14.7) есть CE у триггеров.
2) К примеру плиса о 200 выводов 53200 LUT (универсальная логика) + 106400 FF (триггера) имеют всего 32 BUFG (глобального буфера для распределения тактовой).
3) зависит от настроек "компилятора" (наверное - я такое не практикую от слова совсем. посмотрел один раз на результат - ужаснулся, перекрестился, сплюнул три раза и зарёкся ТАК делать).
ПС: не надо заморачиваться специально про СЕ. Достаточно писать
always @(posedge clk) begin
if (T1 == 1) begin
....
синтезатор "сам придумает" схему как сделать лучше (через СЕ или через комбинационную схему или ...). Конечно есть специальные "указания/прагмы/аттрибуты" которые указавают КАК хочется автору (но это надо иметь экспириенс от 58).

----------------------------------------
Триггеры:
FDCE Primitive: D Flip-Flop with Clock Enable and Asynchronous Clear
FDPE Primitive: D Flip-Flop with Clock Enable and Asynchronous Preset
FDRE Primitive: D Flip-Flop with Clock Enable and Synchronous Reset
FDSE Primitive: D Flip-Flop with Clock Enable and Synchronous Set
18.09.2024, 11:13
Titus

Цитата:

Сообщение от AlexG

3) зависит от настроек "компилятора"

Это ответ на какой вопрос?
18.09.2024, 11:26
AlexG

"каждый следующий каскад расходуется глобальный тактовый буфер?" - наверно зависит от настроек "компилятора" .
НО Я ТАК НИКОГДА НЕ ДЕЛАЮ (как на рисунке) - за это пожизненный эцих с гвоздями.
18.09.2024, 13:45
HardWareMan

Цитата:

Сообщение от Barmaley_m

Однозначно второй вариант. По возможности надо делать так, чтобы все триггеры схемы тактировались одной частотой. Если какие-то части схемы работают на половине или других долях от этой частоты - то следует использовать вход триггеров Clock Enable (CE), описав его на HDL в виде команды if, наподобие твоего второго варианта, для достижения поставленной цели.

Деление тактовой частоты триггером и использование результата для тактирования какой-то части схемы имеет следующие недостатки:
1) Расходуются глобальные тактовые буферы (в примере Spartan6 - BUFG)
2) Поделенная тактовая частота будет из-за задержек элементов схемы и разводки выхода триггера на тактовый буфер и обратно сдвинута по фазе относительно исходной. Эти сдвиги затронут также все сигналы от триггеров, работающих от половины тактовой частоты. Все эти задержки будут отниматься от "бюджета времени" при переходе сигналов данных от триггеров, тактируемых полной тактовой частотой, на триггеры, тактируемые ее половиной, и обратно. В результате будет труднее обеспечить выполнение Timing constraints, снизится максимальная тактовая частота проекта.

В общем и целом я полностью согласен - один законченный IP блок должен быть запитан от одной тактовой частоты, чтобы однозначно уложить его в прогнозируемые тайминги. Но бывают случаи, когда просто необходимо разделять тактовые домены. Например, из самого редкого это вот такой, есть у меня в модуле работы с FT245R:
https://i.postimg.cc/TYKcwmTw/image.png
Он собирается вот так:
https://i.postimg.cc/DyRPbZzc/11.png
https://i.postimg.cc/jSNQ6bwY/22.png
Смысл: использование nRD как такты для регистра хранения данных на шине данных гарантирует наличие актуальных данных в самый последний момент, как того гласит датащит. То же самое касается и сэмплирования сигнала TDO у JTAG: его следует синхронизировать именно к результирующему TCK, который по факту выходит наружу.

Ну и в конце концов разные IP могут работать на разных тактовых частотах, чтобы сэкономить несколько регистров и PIA, например. Поэтому, нужно просто подходит с умом и осознанно. С учётом синхронизации сигналов при переходе в другой тактовый домен. Ну а что касается вышеупомянутого асинхронного счётчика то это не для ПЛИС. Забудьте про 555ИЕ5, 555ИЕ10 должен быть ваш выбор.
18.09.2024, 19:50
Barmaley_m

Цитата:

Сообщение от AlexG

имеют всего 32 BUFG (глобального буфера для распределения тактовой).

32 BUFG - это еще много. По-моему вся серия Spartan6 имеет только 16 BUFG. Но это не такое страшное ограничение, как может показаться. Даже в крупных проектах хватает за глаза. Не надо только без серьезной необходимости тактировать триггеры разной частотой.

В моем большом проекте использовались следующие крупные области с разной тактовой частотой:
1) Процессор и основная периферия, а также внутренние шины - 80 МГц
2) Спец интерфейс - 960МГц (самые внешние его блоки ISERDES2), а связанная с ними FPGA-логика - 120МГц
3) Ethernet MAC (та его часть, которая непосредственно связана с интерфейсом GMII) - 125МГц
Если бы я использовал интерфейс HDMI - то там бы была еще область 1080МГц (для ISERDES2/OSERDES2). и 135МГц для "нормальной" связанной с этим FPGA-логики.

В том чипе, с которым я работал, частоту выше 80МГц для основной схемы использовать не удавалось - ругался компилятор из-за расхождения Timing Constraints. На относительно высоких частотах в моем проекте (120 и 125МГц) работали только небольшие части всей схемы, где данные частоты были обусловлены требованиями к интерфейсам ввода-вывода.
18.09.2024, 20:36
Titus

Цитата:

Сообщение от Barmaley_m

Не надо только без серьезной необходимости тактировать триггеры разной частотой.

Что делать, если выход одного триггера является тактовым сигналом для некоторых последующих участков схемы в данном процессоре.
Но я уже понял, что там, где возможно, использовать CE для разрешения CLK.
19.09.2024, 10:00
b2m

Цитата:

Сообщение от Titus

Что делать, если выход одного триггера является тактовым сигналом для некоторых последующих участков схемы в данном процессоре.

По CLK защёлкиваем предыдущее значение и формируем сигнал CE логикой: CE = (Q AND NOT Qprev)
19.09.2024, 13:57
HardWareMan

Перепад ловится обычным синхронизатором:
https://i.postimg.cc/FHL81xsN/image.png
Понятное дело, что CLK должно быть как можно выше, скорости смены уровней на DAT. Фронт или спад ловится соответствующим заданием инверсии у логического И.
22.09.2024, 12:38
Deadly

Цитата:

Сообщение от Titus

Всего в процессоре 14 16-битных регистров.

забыл про SP, два IFF1|2 и ещё момент где храниться какой IM (режим прерывания) вкл?
22.09.2024, 12:57
Titus

Цитата:

Сообщение от Deadly

два IFF1|2 и ещё момент где храниться какой IM (режим прерывания) вкл?

В соответствующих защелках) Все расписано на схеме, если ее открыть)
23.09.2024, 13:12
Deadly

из интересного
23.09.2024, 13:18
Titus

Цитата:

Сообщение от Deadly

из интересного

Да, это известная вещь.
И действительно оно так и работает, судя по схеме.
23.09.2024, 13:52
Deadly

@Titus у тебя есть ТГ, можешь в лс постучаться?
23.09.2024, 14:11
Titus

Цитата:

Сообщение от Deadly

@Titus у тебя есть ТГ, можешь в лс постучаться?

Все вопросы лучше задавать публично, здесь, если они относятся к теме. А если нет, то в личку на форуме.
23.09.2024, 14:32
Deadly

из интересного

- - - Добавлено - - -

форум это очень медленно, мне нужна оперативность общения, по теме но в большей степени, в любом случае печально это видеть
23.09.2024, 15:05
Titus

Цитата:

Сообщение от Deadly

из интересного

Судя по описанию, человек анализировал работу симулятора извне, не понимая логики работы системы изнутри, и не приводя в логическую схему.
23.09.2024, 16:31
Deadly

Цитата:

Сообщение от Titus

Судя по описанию, человек анализировал работу симулятора извне, не понимая логики работы системы изнутри, и не приводя в логическую схему.

это не шибко важно, там достаточно неплохо расписаны команды, что позволит мне опираться на эти знания

- - - Добавлено - - -

всё достаточно неплохо, есть вопросы конечно, но думаю найду и на них ответы из других блок схем и диаграмм сигналов
23.09.2024, 19:51
zebest

про "специальный RESET" лет 10 как известно, даже в эмуле есть. В специальном.
Вот кратенько по годам, что-когда раскопали:

* 2006 - [MEMPTR](https://zxpress.ru/zxnet/zxnet.pc/5909)
* 2012 - [Q: Zilog](https://worldofspectrum.org/forums/discussion/41704)
* 2014 - [Special Reset](https://github.com/redcode/Z80/wiki/Z80-Special-Reset)
* 2018 - [Additional flag changes of the block instructions](https://github.com/hoglet67/Z80Decod...cumented-Flags)
* 2018 - [Q: NEC / ST](https://github.com/hoglet67/Z80Decod...cumented-Flags)
* 2021 - [`reti` and `retn` reject INT when IFF1 != IFF2](https://floooh.github.io/2021/12/17/...n-instructions)
* 2022 - [MEMPTR during the additionaal flag changes of `otir` and `otdr`](https://github.com/hoglet67/Z80Decoder/issues/2)
* 2022 - [NMI rejection](https://spectrumcomputing.co.uk/foru...pic.php?t=7086)
* 2023 - [MEMPTR during the additional flag changes of all I/O block instructions](https://spectrumcomputing.co.uk/foru...ic.php?t=10555)
* 2024 - [Unstable flag behavior of `ccf` / `scf`](https://github.com/hoglet67/Z80Decod...-SCF-Behaviour)
24.09.2024, 10:42
Deadly

Цитата:

Сообщение от Titus

Если в ноере такта присутствует точка (T1.1 или T1.2), это означает, что имеется в виду 1-й или 2-й полутакт.
Номер полутакта может быть больше 2 вследствие прохождения сигналом промежуточных триггеров. Например, T1.3 обозначает третий полутакт от начала такта T1. Не смотря на то, что по времени он может совпадать с T2.1, правильнее обозначать его именно T1.3, т.к. он инициирован тактом T1.

В первом цикле любой команды в такте Т1.1 активны сигналы READ_PCR и SEL_PC, по которым регистр PC читается из регистрового файла и записывается в регистр PCR.

В такте T1.2 регистр PCR записывается в регистр адреса REG_ADR, содержимое которого выставляется на шину адреса AB0..15.
В этом же такте инкрементированное значение PCR записывается в регистр PCR2.

По переднему фронту такта T1.3 (T2.1) устанавливаются сигналы MREQ и RD, выдавая внешней схеме запрос чтения памяти.
Также в такте T1.3 (T2.1) происходит запись регистра PCR2 обратно в регистр PC.

По переднему фронту такта T2.2 устанавливается сигнал DP_DL, по которому данные с DB0..7 через шину DLATCH0..7 записываются в регистр REG_DATA.

По переднему фронту такта Т2.3 (Т3.1) устанавливается сигнал LOAD_IR, по которому данные с шины DBUS0.7 записываются в регистр команды REG_COMMAND. При этом в течение такта T2.3 (T3.1) на шине DBUS0..7 удерживается ноль.
Также в этом такте активны сигналы READ_PCR и SEL_IR, по которым регистр IR читается из регистрового файла и записывается в регистр PCR.

По переднему фронту такта Т3.2 снимается сигнал DP_DL, прекращая запись внешних данных в регистр REG_DATA.
В такте Т3.2 на шине DBUS0..7 появляется значение регистра REG_DATA и остается там до следующего такта T2.2.
Так же в этом такте данные с шины DBUS0..7 продолжают записываться в регистр REG_COMMAND.
Фактически фронт T3.2 - это момент защелкивания данных с шины DB0..7 в регистре REG_COMMAND.
Таким образом, с момента выставления сигнала RD и до момента защелкивания данных в REG_COMMAND отводится чуть менее 1.5 тактов.
В этом же такте регистр PCR записывается в регистр адреса REG_ADR, содержимое которого выставляется на шину адреса AB0..15.
В этом же такте инкрементированное значение PCR (инкрементируются младшие 7 бит) записывается в регистр PCR2.
В этом же такте сбрасывается сигнал MREQ.

По переднему фронту такта T3.3 (T4.1) сбрасывается сигнал LOAD_IR, прекращая запись регистра REG_DATA в REG_COMMAND.
В этом же такте происходит запись регистра PCR2 обратно в регистр IR.
В этом же такте устанавливается сигнал MREQ,

По переднему фронту такта T4.3 (T5.1) сбрасывается сигнал MREQ.

Таким образом, длительность цикла чтения - 1.5 такта (и более, если активен WAIT), длительность цикла регенерации памяти - 1 такт.

почему то RFSH не указан
24.09.2024, 12:50
Titus

Цитата:

Сообщение от Deadly

почему то RFSH не указан

Что значит почему? )
На диаграмме указан)

Все, что интересно, можно посмотреть по схеме. Я рисую графики смотря на схему) И вы так сможете, я верю в вас)
24.09.2024, 13:10
Deadly

Цитата:

Сообщение от Titus

Все, что интересно, можно посмотреть по схеме. Я рисую графики смотря на схему) И вы так сможете, я верю в вас)

назвался груздём, ....
не всегда понимаю твою логику, ты выложил диаграмму, мол смотрите, ок принимается.
дублируешь текстом, но в тексте упущены важные сигналы, о чём упоминул.
реакция, ну типа, смотри туда, а на текст не смотри! так получаетс?
24.09.2024, 13:18
Titus

Цитата:

Сообщение от Deadly

назвался груздём, ....

Никуда я полезать не собираюсь)

- - - Добавлено - - -

Цитата:

Сообщение от Deadly

не всегда понимаю твою логику, ты выложил диаграмму, мол смотрите, ок принимается.

Я выкладываю фрагменты диаграмм и описаний для привлечения внимания интересующихся лиц.
И для того, чтобы люди могли ознакомиться в ОБЩЕМ, как процессор работает.
А диаграммы работы всех команд я составлять не собираюсь)
24.09.2024, 14:55
Deadly

Цитата:

Сообщение от Titus

А диаграммы работы всех команд я составлять не собираюсь)

моё почтение...
27.09.2024, 10:47
org

Основная проблема подобных проектов - это то что автор зачем-то пытается "понять" как оно работает. Это является основным тормозом, в результате чего проект может длиться годами. Так и у нас было.
Но потом оказалось что достаточно получить netlist, а понимать вовсе не обязательно. Ведь полученные результаты рано или поздно захотят практического применения (программный эмулятор / HDL реализация), а если делать точно, то оно и будет работать как исходная схема и то что ты "понял" как оно работает никакой пользы не доставит. Главное понимать как в целом логика работает - основные приёмчики, подходы к реализации (регистры, счётчики, автоматы), а распутывать лапшу комбинаторно-последовательной логики это бессмысленно и беспощадно. Но не могу запретить автору продолжать, читаем с интересом.
27.09.2024, 11:54
Titus

Цитата:

Сообщение от org

Основная проблема подобных проектов - это то что автор зачем-то пытается "понять" как оно работает.

Я люблю понимать суть процессов)
Без точного понимания невозможно с материалом ничего сделать интересного. Только клонировать, да и там можно ошибиться, именно из-за того, что не понимаешь нюансов.
Кроме того, представьте себе программный эмулятор, эмулирующий на уровне вентилей? Это сверхизбыточность.
Также, понимание сути позволяет найти скрытые нюансы, ошибки, неизвестные подводные камни. Это все очень интересно.
Видимо, тут говорит мой дух хакера и оптимизатора)

- - - Добавлено - - -

Цитата:

Сообщение от org

Так и у нас было.

У нас - это у кого, и с каким проектом?

- - - Добавлено - - -

Цитата:

Сообщение от org

в результате чего проект может длиться годами.

Тут могу согласиться)
27.09.2024, 13:31
org

Цитата:

У нас - это у кого, и с каким проектом?

Наши приключения с фамиком:
https://github.com/emu-russia/breaks
https://github.com/emu-russia/breaknes

А вот пример чего можно добиться за месяц, без особого "понимания":
https://github.com/nukeykt/Nuked-MD
https://github.com/nukeykt/Nuked-MD-FPGA

Рекомендую таки сделать нетлист и проект сразу завершится. "Понимать" можно не вдумчиво вглядываясь в вентили, а анализируя вейвы при прогоне модели HDL в том же Icarus Verilog + GTKWave.
27.09.2024, 13:48
Titus

Цитата:

Сообщение от org

Рекомендую таки сделать нетлист и проект сразу завершится. "Понимать" можно не вдумчиво вглядываясь в вентили, а анализируя вейвы при прогоне модели HDL в том же Icarus Verilog + GTKWave.

Это будет опять же наблюдение за последствиями извне, не понимая причин.

Как, например, преобразовать схему в синхронную, избавиться от проходных буферов (обьединяющих две шины) не понимая всех нюансов работы?
Да и чтобы найти какую-то хитрую ошибку во флагах, нужно начинать изнутри, а не 'тупо' перебирать все комбинации, наблюдая за последствиями снаружи, вдруг чего попадется интересного.

- - - Добавлено - - -

Думаю, что K-MOS-овская версия Z80 в этом плане попроще, т.к. посовершеннее.

Показывать 40 сообщений этой темы на одной странице