Компилятор языка Паскаль - планы на будущее

**Kakos_nonos** · 12.03.2015, 18:33

Сообщение от bigral

запуск x86 windows3.0 на mcs-51

Можно по-подробнее про это? Стало интересно.

**esl** · 12.03.2015, 18:39

JFYI
дизассемблед и фиксед версия турбо паскаля

http://www.cirsovius.de/CPM/Projekte.../TURBO-en.html

там вообще у чувака КУЧА разных рабочих дасмов.

**bigral** · 12.03.2015, 22:53

Сообщение от Kakos_nonos

Можно по-подробнее про это? Стало интересно.

http://www.fleasystems.com/flea86.html

**Andrew771** · 13.03.2015, 10:23

Сообщение от Bolt

Можно пояснить что понимается под приемлемым качеством кодогенератора?

Видимо, оптимизированная компиляция. Другое дело, какой уровень оптимизации приемлем для Спека. В моем компиле точно есть (дописываю на днях):
- свёртка констант;
- упрощение выражений перекидыванием операндов из стека в регистры (удаление лишних push/pop);
- быстрое умножение и деление на числа степени 2, а также быстрое умножение на некоторые часто используемые числа;
- удаление повторных присваиваний и чтений переменных;
- удаление повторных расчетов индексов массива.

**Bolt** · 14.03.2015, 11:03

Сообщение от bigral

Как по мне дак самое главное в этом магическом "разные платформы" именно адресуемое пространство, сегодня 99.999% литературы по алгоритмам предпологают бесконечное адресное пространство ...
Короче, отвечая в лоб, если хочется чтобы твой компилер был одинаковый для всех, то сначала уровняй всех. Например напиши для всех 1 виртуальную машину, и компилер пиши для этой машины.

Для меня в этом магическом "разные платформы" главное - переносимость на уровне исходного кода. Язык высокого уровня и есть то, что позволяет писать, не задумываясь о том, на чём это будет запускаться.
Виртуальная машина тоже позволяет абстрагироваться от конкретного процессора. Создать такую виртуальную машину и писать программы на ассемблере для неё я уже пробовал, следующим этапом стал Паскаль. Который в том числе сможет генерировать код для виртуальной машины.

Сообщение от bigral

Отсюда вопрос - не пагубна ли сама идея: "сборка под разные платформы"? смысла практического ведь НЕТУ? Но вот под конкретную платформу сделать хороший инструмент, нужный людям! куда как более востребованное занятие, не зря народ жаждит update-a borland pascal под cp/m

Нет, не пагубна. Практичность/академичность действий понятие относительное. Например, вычисление тройных интегралов и числа Пи до 100-го знака на 8-битных процессорах может использоваться для тестирования процессоров и математических библиотек. Вполне практическое применение.
Мне интересна работа и устройство компиляторов и процессоров, Andrew771 делает инструмент под конкретную платформу, Oleg N. Cher'у нравится Оберон, кто-то запускает ARM Linux на 8-битных процессорах, а кто-то может заняться добавлением функций в дизассемблированную программу или написанием кодогенератора для FPC/GCC/etc.

Сообщение от Andrew771

В моем компиле точно есть (дописываю на днях):
...

Это всё на уровне псевдокода? В момент генерации или отдельным проходом? Где и как при этом хранится псевдокод?

Я тоже при разборе исходника генерировал псевдокод, но на пятом или шестом процессоре понял, что оптимизация получится как-то не очень. Проверка типов данных при попытке добавить все эти "массивы указателей на записи, в которых указатели на массивы" тоже зашла в тупик. Но у псевдокода свои плюсы, и сейчас задумываюсь о возвращении к чему-то подобному.

**Andrew771** · 15.03.2015, 21:11

Сообщение от Bolt

Это всё на уровне псевдокода?

Да.

Сообщение от Bolt

В момент генерации или отдельным проходом?

При первой генерации генерируется псевдокод, а не код ассемблера. А оптимизация происходит при отдельных нескольких проходах.

Сообщение от Bolt

Где и как при этом хранится псевдокод?

Псевдокод состоит из команд вида: мнемоника-число-строка. Хранится в массиве записей. Потом после оптимизации при окончательной генерации кода уже генерируется код ассемблера. Каждая команда псевдокода, как правило, состоит из нескольких ассемблерных команд.
На уровне псевдокода проще проводить оптимизацию, чем на окончательном ассемблере. И из него уже можно генерировать не только под Спектрум, но и под другие процы. Просто задать коды конкретного асма для каждой псевдокоманды.

**Bolt** · 15.03.2015, 23:11

Да, вот именно так у меня и было. Работало. Но таким способом получается хороший код для простых процессоров, а, например, для x86 или ARM с их заковыристыми адресациями такой метод просто не видит операции, они "рассыпаются" в псевдокоде. Или же программу надо писать "простыми словами", а не вот так

Код:

if node^.nodeargs[i]^.resulttype<>nil then
	typ1:=node^.nodeargs[i]^.resulttype^
else begin
	typ1.flags:=node^.nodeargs[i]^.resulttypeflag;
	typ1.size:=4;
end;

Надо что-то изменить в структуре псевдокода, пока не пойму что.

---------- Post added at 00:11 ---------- Previous post was at 00:01 ----------

Кодогенератор FPC вообще жжот, для надёжности проверяет индекс массива два раза

и копирует один байт при помощи movsb:

Код:

# [210] typ1.flags:=node^.nodeargs[i]^.resulttypeflag;

        movzbl  -860(%ebp),%eax
        decl    %eax
        cmpl    $9,%eax
        jbe     .Lj3685
        call    FPC_RANGEERROR
.Lj3685:

        movzbl  -860(%ebp),%eax
        movl    %eax,%edx
        decl    %eax
        cmpl    $9,%eax
        jbe     .Lj3686
        call    FPC_RANGEERROR
.Lj3686:

        movl    -884(%ebp),%ecx
        movl    12(%ecx,%edx,4),%eax
        leal    -40(%ebp),%edi
        leal    69(%eax),%esi
        cld
        movsb

**Andrew771** · 16.03.2015, 10:41

Сообщение от Bolt

Да, вот именно так у меня и было. Работало. Но таким способом получается хороший код для простых процессоров, а, например, для x86 или ARM с их заковыристыми адресациями такой метод просто не видит операции, они "рассыпаются" в псевдокоде.

Про x86 не знаю, не писал никогда на его асме. Возможно, определенные последовательности псевдокоманд можно объединять в одну команду асма x86.
У меня сейчас в выражениях используется только двухбайтовое представление (через регистровую пару HL), даже если действия производятся над однобайтовыми значениями. Только чтение и запись значений производятся соответственно размерности. Здесь нужно делать еще один проход, чтобы определить максимальный используемый тип в сгенерированном выражении. В первой версии компиля пока не буду это оптимизировать.
И еще индуктивность переменных тоже никак не учитываю. Так что, если встретится например:

Код:

for i:=1 to 100 do
a[i]:=i;

то на каждой итерации цикла будет рассчитываться заново адрес в памяти для ячейки a[i], хотя можно было всего лишь прибавить смещение к предыдущей ячейке. Здесь нужно уже анализировать весь поток от начала до конца цикла, а вдруг еще внутри есть другие циклы и ветвления. Пока не стал заморачиваться. А вот если эта же ячейка понадобится еще раз после, то уже возьмется запомненный ее адрес, это я сделал:

Код:

for i:=1 to 100 do
begin
   a[i]:=i;
   b[i]:=i+1;
   if a[i]>b[i] then a[i]:=100;
end;

Ячейка a[i] только один раз будет рассчитываться.

**Bolt** · 16.03.2015, 21:03

Сообщение от Andrew771

Возможно, определенные последовательности псевдокоманд можно объединять в одну команду асма x86.

Да, одной командой x86 можно объединить несколько простых псевдокоманд.

Код:

movswl EAX,[EBP+EDX*2+1200h]

Вот такое чтение элемента массива размером 2 байта, номер которого в EDX, с одновременной конвертацией в longint с учётом знака. Сколько это команд на псевдокоде...?

**Andrew771** · 17.03.2015, 09:26

После оптимизации 4 штуки (два сложения, одно умножение и запись).

User Tag List

Тема: Компилятор языка Паскаль - планы на будущее

Опции темы

Отображение

Информация о теме

Пользователи, просматривающие эту тему

Похожие темы

Пожелания и планы по эмулятору Башкирия-2М

Пожелания и планы по эмулятору MESS

Планы на новые создаваемые игры

Назад в будущее?

Ваши права