vak: (бэсм-6)
Serge Vakulenko ([personal profile] vak) wrote2025-05-18 08:00 pm

Таблица имён в парсере Си

Грамматика языка Си хитро устроена: её невозможно однозначно распознать, не строя таблицу имён. Объясню на примере. Рассмотрим конструкцию:
foo bar : qux;
Как её должен интерпретировать парсер? Выглядит полной бессмыслицей. Однако же представим, что перед этим имелось:
typedef int foo;
enum { qux = 1 };
Тогда конструкция превращается в:
int bar : 1;
Честное определение поля структуры размером один бит.

То есть парсер во время разбора входного потока должен строить таблицу имён. Достаточно различать три категории: тайпдефы, именованные константы enum и всё остальное. Но надо отслеживать область действия. При выходе из блока имена, определённые в нём, следует забывать.

Я уже почти добил самопальный парсер Си, осталось добавить тайпдефы.
malyj_gorgan: (Default)

[personal profile] malyj_gorgan 2025-05-19 04:51 am (UTC)(link)
А парсер -- це в якому місці компайлера?
Бо в Сі ж, крім чисто мовних структур, є мої улюблені precompil'и....

Раптом згадав: 20 з гаком років тому бібліотека для обслуговування MRI сканерів компанії Дженерал Електрік мала свою власну "мову" (ну, не мову, а набір команд для керування всім) у вигляді .h файлів. Сам по собі Сі код обробки картинок був глибоко секретний і стороннім очам не завжди доступний, але оці хедери можна було редагувати, потім воно десь якось компілювалося, ти отримував бінарник з потрібними властивостями....
spamsink: (Default)

[personal profile] spamsink 2025-05-19 03:45 pm (UTC)(link)
Самое забавное, что если написать const int qux = 1;, то получается ошибка bit-field ‘bar’ width not an integer constant.
Как говорится, какое слово из "const" и "int" ты не понимаешь?
Edited 2025-05-19 15:45 (UTC)
x86128: (Default)

[personal profile] x86128 2025-05-19 04:48 pm (UTC)(link)
Хитро, однако