vak | Асинхронные примитивы для Xilinx FPGA

Почему-то считается, что асинхронную логику нельзя засунуть в традиционную FPGA. Я решил поисследовать этот вопрос. Чем дольше разбираюсь, тем яснее становится, что это просто предубеждение. Я взял популярную плату Digilent Basys3 на основе чипа Xilinx Virtex-7, и стал смотреть, что тут можно сделать.

Основа асинхронной логики - несколько базовых примитивов: C-элемент, арбитр, S-элемент, T-элемент. Все их удалось реализовать на имеющейся FPGA. Вот, к примеру, как выглядит двухвходовый С-элемент Мюллера:

Это трёхвходовый С-элемент:

Арбитр штука более сложная. К счастью, нынешние чипы FPGA, так называемое семейство Xilinx 7 Series, в качестве базового элемента имеют логическую таблицу LUT6_2 с двумя независимыми выходами. Это даёт возможность построить асинхронный арбитр со стабильными характеристиками:

S-элемент и T-элемент представляют собой кирпичики для построения так называемых секвенсеров, блоков управления другими компонентами. В принципе, их можно собирать из С-элементов и базовой логики, но через LUT6_2 получается заметно компактнее:

Т-элемент вообще помещается в одну ячейку LUT6_2:

Flat | Top-Level Comments Only

From:

spamsink

Что делает MUTEX_13.f?

From:

vak

Отфильтровывает метастабильное состояние. На реальной плате это хорошо видно.

Edited Date: 2016-09-12 07:17 (UTC)

From:

spamsink

Логично. Интересно, что Xilinx-овские тулы говорят о таком бешеном количестве комбинационных циклов.

From:

vak

Vivado говорит:

ERROR: [DRC 23-20] Rule violation (LUTLP-1) Combinatorial Loop - 1 LUT cells form a combinatorial loop. This can create a race condition. Timing analysis may not be accurate. The preferred resolution is to modify the design to remove combinatorial logic loops. To allow bitstream creation for designs with combinatorial logic loops (not recommended), use this command: set_property SEVERITY {Warning} [get_drc_checks LUTLP-1]. NOTE: When using the Vivado Runs infrastructure (e.g. launch_runs Tcl command), add this command to a .tcl file and add that file as a pre-hook for write_bitstream step for the implementation run. c/lut.

Еще софт любит ругаться, когда не все входы LUT задействованы в формуле: "[DRC 23-20] Rule violation (PDCN-1569) LUT equation term check - Used physical LUT pin ... is not included in the LUT equation". Приходится совсем отключать проверку DRC 23-20.

From:

spamsink

Если LUT equation не зависит от какого-то входа, зачем его вообще заводить? Проще GND к нему присоединить.

From:

vak

Я ставлю ненужные входы в 0. Или их нужно явно к supply0 подключать?

From:

spamsink

Похоже, что инстансы с именами примитивов синтезатор вообще не трогает, и константа превращается в ничто. Значит, нужно явно к GND подключать.

From:

vak

Поставил GND вместо 0 на неиспользуемых входах. Без разницы: ругается ровно так же. Причём ругается только на LUT6_2. Ровно в той же ситуации LUT4 с одним занулённым входом проходит чисто.

WARNING: [DRC 23-20] Rule violation (PDCN-1569) LUT equation term check - Used physical LUT pin 'A5' of cell m9/m/f/LUT6 (in m9/m/f macro) is not included in the LUT equation: 'O6=(A1*(~A2)*(~A6))+((~A1)*A2*A6)'. If this cell is a user instantiated LUT in the design, please remove connectivity to the pin or change the equation and/or INIT string of the LUT to prevent this issue. If the cell is inferred or IP created LUT, please regenerate the IP and/or resynthesize the design to attempt to correct the issue.

From:

spamsink

Выходит, наоборот, если пин не используется, то его вообще отключить надо? В каждой версии у них свои заморочки, бардак какой-то.

From:

vak

Пробовал отключать. Ничего не меняется, всё та же ругань.

From:

andrey-yurin.livejournal.com

А вот насчёт арбитра позволю задать вопрос. Вот как я всегда себе арбитр представлял - это устройство, обеспечивающее совместный доступ нескольким абонентам к одному общему ресурсу. Например, арбитр доступа к памяти. Представляет собой мультиплексор(ы), коммутирующий абонентов в зависимости от сигнала управления и state-machine, которая эти сигналы формирует в зависимости от приоритета каналов. Вполне возможно, что в классическом понятии арбитр - это совсем другая конструкция. Но не суть.

Так вот а как в асинхронной логике с коммутацией шин данных? Там же по разным битам будут совсем разные задержки ведь. И чего тогда будет? Эти задержки нужно учитывать и анализировать, или же там концепция работы совсем другая?

Ну и да. Вы ссылочки часто даёте весьма полезные. Нет ли где-нибудь какого не шибко сложного Reference Design, что бы посмотреть на практическое применение асинхронной логики?

From:

vak

Всё правильно, арбитр именно в этом смысле. Какой сигнал раньше добежит, тот и обслуживаем. На Бальсе конструкция выглядит так:

arbitrate
    reqA then process_request_A()
  | reqB then process_request_B()
end

Шина по определению есть соединение, к которому подключено несколько устройств. Здесь нет шин в этом понимании, только соединения точка-точка, называемые каналами. Задержки по разным проводам в канале будут разные, но это несущественно. Сообщение считается добежавшим, когда фронт пришёл по каждой из пар 0/1. Это называется Dual Rail Logic.

Законченный практический reference design пока не могу показать. Увы, не нашёл еще.

From:

vit-r.livejournal.com

Схема - это хорошо, а на какой тактовой частоте это сможет реально работать?

From:

vak

Так ведь нету тактовой частоты. :)
С какой скоростью - другой вопрос. Но тут нужно сначала определиться, что мы понимаем под скоростью и как её измерять.

From:

vit-r.livejournal.com

Я имел ввиду, с какой максимальной частотой смогут идти сигналы, чтобы это всё ещё работало правильно? Потому как кроме скорости переключения могут быть и другие эффекты.

From:

vak

Входные сигналы буду идти не с частотой, а запрос-ответ. Как показывает опыт, частота не будет сильно отличаться от синхронного дизайна. К примеру, асинхронный процессор 80c51 работал на 10% медленнее синхронного собрата, потребляя при этом четверть энергии.
https://pure.tue.nl/ws/files/1586509/515168.pdf

From:

spamsink

Ну как: делаешь асинхронную схему, которая, скажем, считает сумму квадратов чисел от 1 до 65535, и рядом счетчик 100 МГц тактов. Как вычисление закончилось, показываешь количество тактов N. Эффективная "тактовая" частота будет 100 МГц*65535/N.
Альтернативно, синтезируешь ту же фунциональность синхронно (без DSP, чтобы честно сравнивать) и смотришь, на какой частоте Xilinx скажет, что оно будет работать.

From:

vak

Всё равно получится сферический попугай в вакууме.
Надо будет придумать что-нибудь более убедительное.

Flat | Top-Level Comments Only

Профиль

Посетители

Пятнадцать байтов на стек от конца

Асинхронные примитивы для Xilinx FPGA

Асинхронные примитивы для Xilinx FPGA

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Профиль

Метки

Посетители