vak | Почему бы и не компилятор Си для БЭСМ-6

Есть вариант, как небольшими усилиями соорудить Си компилятор для БЭСМ-6. Есть такой проект ELVM. Это универсальный компилятор Си на основе LLVM, но не для конкретных процессоров, а вообще. Он выдаёт код для некоторой абстрактной машины. И дальше строятся бекэнды для разнообразных от смешных типа Brainfuck или Conway's Life до реальных типа WebAssembly.

Для прикола народ скомпилировал простой компилятор Си на "машину" - скрипт для редактора VI. И оно работает! Хотя нешустро: компиляция "Hello World" в таком VI занимает двадцать минут: "C Compiler exists purely in VIM".

Идея аналогичная древнему компилятору BCPL, который позже превратился в B (предшественник Си). Выдаём код для абстрактной машины, и строим отдельные кодогенераторы, транслирующие абстрактный код в выполняемый бинарник для нужной архитектуры. Такой подход оказался успешным, и немало способствовал распространению BCPL пятьдесят лет назад.

Не вижу проблем повторить это дело для БЭСМ-6. Размер кодогенератора для архитектуры x86, к примеру - всего 309 строк.

Побробуем запустить классический пример "Hello World" через ELVM для архитектуры x86 под Линуксом.

Собираем компилятор:

git clone https://github.com/shinh/elvm.git
cd elvm
git submodule update --init
make

Результатом будут бинарники out/8cc (компилятор) и out/elc (кодогенератор). Возьмем простой вариант "Hello World":

int main() 
{
    const char* p = "Hello, world!\n";
    for (; *p; p++)
        putchar(*p);
    return 0;
}

Компилируем, получаем ассемблерный код абстрактной машины:

$ cd out

$ ./8cc -S hello.c

$ cat hello.s
	.text
main:
	#{push:main}
	mov D, SP
	add D, -1
	store BP, D
	mov SP, D
	mov BP, SP
	sub SP, 1
	.file 1 "hello.c"
	.loc 1 7 0
	# }
	.loc 1 4 0
	#   for (; *p; p++)
	mov A, 0
	mov B, SP
.data
	.L3:
	.string "Hello, world!\n"
.text
	mov A, .L3
	mov B, BP
	add B, 16777215
	store A, B
	.loc 1 5 0
	#     putchar(*p);
	.L0:
	.loc 1 4 0
	#   for (; *p; p++)
	mov B, BP
	add B, 16777215
	load A, B
	mov B, A
	load A, B
	jeq .L4, A, 0
	jmp .L5
	.L4:
	.loc 1 5 0
	#     putchar(*p);
	jmp .L2
	.L5:
	.loc 1 4 0
	#   for (; *p; p++)
	mov B, BP
	add B, 16777215
	load A, B
	mov B, A
	load A, B
	mov D, SP
	add D, -1
	store A, D
	mov SP, D
	putc A
	add SP, 1
	.loc 1 5 0
	#     putchar(*p);
	.L1:
	.loc 1 4 0
	#   for (; *p; p++)
	mov B, BP
	add B, 16777215
	load A, B
	mov D, SP
	add D, -1
	store A, D
	mov SP, D
	add A, 1
	mov B, BP
	add B, 16777215
	store A, B
	load A, SP
	add SP, 1
	.loc 1 5 0
	#     putchar(*p);
	jmp .L0
	.L2:
	.loc 1 7 0
	# }
	mov A, 0
	mov B, A
	#{pop:main}
	exit
	#{pop:main}
	exit

Превращаем в бинарник для x86:

$ ./elc -x86 hello.s > hello.elf
$ file hello.elf 
hello.elf: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), statically linked, no section header

Запускаем:

$ ./hello.elf
Hello, world!

Flat | Top-Level Comments Only

From:

dijifi

Вроде у Цанга кто-то строил Си для СВС. Не сохранилось?

From:

vak

Я строил Си компилятор для Эльбруса-Б. Это был моя дипломная работа на физтехе. Но не у Цанга. Исходники сохранились, но это не 48-битная БЭСМ-6, а уже 64-битная.

Edited Date: 2024-07-09 20:15 (UTC)

From:

dijifi

Цанга уже машина сбила

From:

vak

Цанг это новосибирская команда, что строила ОС "Феликс"? Знаю такую. Они взяли мой компилятор и на нём подняли Unix v6 на БЭСМ-6 в 1989 году. Был я у них в академгородке, видел этот юникс в работе. Душераздирающее было зрелище! 😀 Время жизни ядра до сбоя было около 15 минут. Чтобы минимизировать потери данных, sync запускался не как обычно, два раза в минуту, а каждую секунду. Стоя у пульта БЭСМ-6, можно было наблюдать по лампочкам и звуку динамика, как машина каждую секунду вздрагивала, как в лихорадке. 😀

From:

dijifi

Да, Феликс Рудольфович Цанг, 1942 — 1984, человек талантливый и увлеченный. Си в его группе изучали в 1982. После его гибели всё развалилось, несмотря на мемориальное название ОС.

Edited Date: 2024-07-09 22:02 (UTC)

From:

vak

Был у них в команде Юра Лобачёв. Отвечал за Си компилятор. Он взял у меня исходники PCC для БЭСМ-6 и для Эльбруса-Б, и продолжил развивать дальше. Но к началу 90-х всё быстро умерло, и основные участники команды свалили в Калифорнию.

https://www.nfitmivt.ru/content/people/detail.php?ELEMENT_ID=245

Edited Date: 2024-07-09 23:29 (UTC)

From:

x86128

Вот это поворот!
Затем была запоминающаяся работа в замечательном творческом коллективе первой лаборатории по установке UNIX-ов на отечественные железяки: OS – Основич, Молчанов; Файловая система – Городилов, Райхерт, Семухина; Отладчики – Горр; мы с Вакуленко портировали первую версию С компилятора; Борис Кузнецов – утилиты и librt. Первой жертвой стала старушка БЭСМ, на которой мы установили мировой рекорд – UNIX на самой старой машине в мире.

From:

vak

Андрей Основич и Коля Молчанов были основные по переносу ядра Unix. Нынче здесь в кремниевой долине трудятся. Андрей в NVidia, а Коля в Оракле.

From:

sab123

Код абстрактной машины выглядит подозрительно похожим на i86. Поэтому, небось, для нее и такой маленький кодогенератор.

From:

vak

Там много кодогенераторов, и все маленькие. Для ARM, скажем, 384 строки. Просто хорошая абстрактная машина и должна быть похожа на любую архитектуру.

From:

spamsink

Игрушечный компилятор
No bit operations
No floating point arithmetic
конечно, получится. Ради оптимизации можно взять бэкенд для фортрана и допинать в приемлемый для Форекса, или написать бэкенд в Паскаль.
Но это не то, о чём так долго говорили большевики. :)

From:

vak

Это ограничения их абстрактной машины. Придётся расширить, добавить нужные операции и плавающие типы. Сейчас у них эти места забиты заглушками:

static void emit_data_primtype(Type *ty, Node *val, int depth) {
    switch (ty->kind) {
    case KIND_FLOAT: {
        assert_float();
        break;
    }
    case KIND_DOUBLE:
        assert_float();
        break;

Файл https://github.com/shinh/8cc/blob/master/gen.c

From:

spamsink

Абстрактная машина с каким-то произвольным количеством регистров плохо ложится на БЭСМ-6 - плотность порождаемого кода будет неприемлемая. Впрочем, и пресловутый компилятор в стековую машину, с которым можно было бы поиграться, https://github.com/rswier/c4/ - потребует серьёзной работы, если именно компилировать, а не интерпретировать. Из

int a, b;
exch() {
        a = a ^ (b = b ^ (a = a ^ b));
}

получается

1: int a, b;
2: exch() {
3:  	a = a ^ (b = b ^ (a = a ^ b));
    ENT  0
    IMM  -137158648
    PSH 
    IMM  -137158648
    LI  
    PSH 
    IMM  -137158644
    PSH 
    IMM  -137158644
    LI  
    PSH 
    IMM  -137158648
    PSH 
    IMM  -137158648
    LI  
    PSH 
    IMM  -137158644
    LI  
    XOR 
    SI  
    XOR 
    SI  
    XOR 
    SI  
4: }
    LEV

а хочется, в конце концов, всего-навсего 7 команд

 XTA A
 AEX B
 ATX A
 AEX B
 ATX B
 AEX A
 ATX A

Так что для относительно быстрого результата - только хардкор в виде прихачивания сишного фронтенда к имеющемуся паскалевскому бэкенду.

From:

vak

Ну тогда выкинуть весь ихний gen.c и написать свой бэсмовский. Или, как ты предлагаешь, пришпандорить его к имеющемуся бэкенду паскаль-компилятора.

Flat | Top-Level Comments Only

Профиль

Посетители

Пятнадцать байтов на стек от конца

Почему бы и не компилятор Си для БЭСМ-6

Почему бы и не компилятор Си для БЭСМ-6

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Профиль

Метки

Посетители