vak: (бэсм-6)
Serge Vakulenko ([personal profile] vak) wrote2025-05-18 08:00 pm

Таблица имён в парсере Си

Грамматика языка Си хитро устроена: её невозможно однозначно распознать, не строя таблицу имён. Объясню на примере. Рассмотрим конструкцию:
foo bar : qux;
Как её должен интерпретировать парсер? Выглядит полной бессмыслицей. Однако же представим, что перед этим имелось:
typedef int foo;
enum { qux = 1 };
Тогда конструкция превращается в:
int bar : 1;
Честное определение поля структуры размером один бит.

То есть парсер во время разбора входного потока должен строить таблицу имён. Достаточно различать три категории: тайпдефы, именованные константы enum и всё остальное. Но надо отслеживать область действия. При выходе из блока имена, определённые в нём, следует забывать.

Я уже почти добил самопальный парсер Си, осталось добавить тайпдефы.

[personal profile] ichthuss 2025-05-19 06:56 am (UTC)(link)
Ого, сек'юріті рівня "бог".
malyj_gorgan: (Default)

[personal profile] malyj_gorgan 2025-05-19 03:35 pm (UTC)(link)
В пост-пост-модерному інтернеті я не розумію, чи це ще серйозно, чи вже сарказм, чи вже знову не сарказм...

[personal profile] ichthuss 2025-05-23 10:09 am (UTC)(link)
А як ще назвати arbitrary code execution?