vak: (бэсм-6)
Serge Vakulenko ([personal profile] vak) wrote2025-05-18 08:00 pm

Таблица имён в парсере Си

Грамматика языка Си хитро устроена: её невозможно однозначно распознать, не строя таблицу имён. Объясню на примере. Рассмотрим конструкцию:
foo bar : qux;
Как её должен интерпретировать парсер? Выглядит полной бессмыслицей. Однако же представим, что перед этим имелось:
typedef int foo;
enum { qux = 1 };
Тогда конструкция превращается в:
int bar : 1;
Честное определение поля структуры размером один бит.

То есть парсер во время разбора входного потока должен строить таблицу имён. Достаточно различать три категории: тайпдефы, именованные константы enum и всё остальное. Но надо отслеживать область действия. При выходе из блока имена, определённые в нём, следует забывать.

Я уже почти добил самопальный парсер Си, осталось добавить тайпдефы.
spamsink: (Default)

[personal profile] spamsink 2025-05-20 03:38 am (UTC)(link)
Си как язык - неортогональный, поэтому должен умереть. В С++ отлично компилируется
const int qux = 1;
typedef int foo;
struct {
        foo bar : qux;
} x;
int baz[qux];
archaicos: Шарж (Default)

[personal profile] archaicos 2025-05-23 06:58 am (UTC)(link)
Надо было разрешить в языке использовать константы в обоих контекстах: как число во время компиляции и как объект во время исполнения (можешь использовать и само значение, и адрес в памяти, где оно лежит). Думаю, можно это сделать, ничего не сломав. Может, сделают когда-нибудь. А то выходит, что если хочешь поименнованную константу, то хорошо, если она лезет в int, что можно enum сделать. А если не лезет, то нужно или расширение языка использовать, или какую-то реализацию супер нового стандарта. Или обратно к дедовским макросам возвращаться.
spamsink: (Default)

[personal profile] spamsink 2025-05-23 03:49 pm (UTC)(link)
нужно или расширение языка использовать

Да, C++ называется.
archaicos: Шарж (Default)

[personal profile] archaicos 2025-05-24 12:11 am (UTC)(link)
Нет, горшочек, не вари. :)