vak | Однако

Знаете ли вы, что Интеловские процессоры врут при округлении? Попробуйте умножить 3.00000000000000044 на 1.00000000000000022 - пентиум даёт 3.00000000000000089. А между тем правильный ответ 3.00000000000000133. Компилятор не виноват, он честно включает аппаратное округление к ближайшему числу.

То же самое при делении: 1 / 0.99999999999999989 должно давать 1.00000000000000022, а не 1.

Вывод: покупайте процессоры MIPS. :)

Upd: выяснилось, что баг проявляется только на Intel Xeon (W3520 и W3530) и Pentium 4. Core Duo, Core2 Duo, i5 и AMD Opteron работают правильно.

Flat | Top-Level Comments Only

From:

spamsink.livejournal.com

Правильный ответ, конечно же, 3.0000000000000011000000000000000968.

% perl -e 'printf "%.30f", 3.00000000000000044 * 1.00000000000000022, chr(10);'
3.000000000000001332267629550188

Режимы процессора надо правильно ставить, вот и всё.

From:

lionet.livejournal.com

А что такое %.30f?, это физического смысла не имеет на интеловском дубле.

From:

spamsink.livejournal.com

Это во избежание эффектов округления в printf. Хватило бы и .18 или .19, конечно.

From:

vak

Режимы стоят правильно.
Для простоты можно переформулировать в шестнадцатеричном виде, чтобы все разряды были видны.
Умножаем 0x1.8000000000001p+1 на 0x1.0000000000001p+0.
В терминах эпсилон это 3+2э на 1+э. В идеале должны получить 3+5э+2э². Но в разрядную сетку помещается только 3+4э или 3+6э. Пентиум выдает первый вариант, хотя второй ближе к идеалу.

From:

spamsink.livejournal.com

Пентиум который? У меня Intel(R) Core(TM)2 Duo CPU - в нем, как видишь, правильно.

From:

vak

Это у тебя перловая виртуальная машина правильная.

From:

spamsink.livejournal.com

Ну да, будет перл арифметикой высокой точности сам заниматься.

From:

vak

Чем он хуже питона?

From:

spamsink.livejournal.com

Он не хуже, он другой, и в его описании рассказано, как он работает с числами: держит их в виде double.

From:

vak

Да, проверил на Intel Core Duo - работает правильно.
А на Intel(R) Xeon(R) W3530 безбожно глючит.

From:

spamsink.livejournal.com

Объясняю ~~популярно, для невежд~~. Округление по умолчанию делается tie break to even. Если промежуточные вычисления делаются в long double, то 2*ε² оказываются за пределами разрядной сетки, 5*ε после нормализации выглядит как 2.5*ε, и округление делается вниз, к 2*ε.
Если промежуточные вычисления делаются в quad, то ничьей не оказывается, и получается честное округление к ближайшему, т.е. 3*ε.
И это не баг, а естественное ограничение конкретных реализаций FPU.

Edited Date: 2011-09-07 04:42 (UTC)

From:

vak

В мипсе нет никаких quad, и тем не менее умножитель умудряется сообразить, что это не tie break. Забавно, что на разных интелах оно работает по разному.

From:

spamsink.livejournal.com

Да, пардон, это не quad, это double-double (106 бит мантиссы). IEEE не специфицирует, с какой дополнительной точностью должно делаться умножение.

From:

lionet.livejournal.com

Это не дабл-дабл, а extended precision (64 бит мантиссы).

From:

spamsink.livejournal.com

Объясняю еще раз: 64 бит мантиссы недостаточно для понимания, что ε/2+2*ε² не является tie. Именно поэтому "старые" пентиумы этого и не понимают. А в новых анализируются все биты результата умножения двух double мантисс.

From:

lionet.livejournal.com

double-мантисса — это 53 бита. Я же говорю про extended precision, которые 64-бита мантиссы. double-double нет в интелах.

From:

spamsink.livejournal.com

Я вижу, имеется некоторое непонимание. Результат умножения в процессоре попадает в регистр, имеющий определенную длину мантиссы, которая больше, чем у double. Ненулевые разряды этого результата соответствуют 2*ε(double), ε(double)/2, и, если разрядность мантиссы у этого регистра вдвое больше, чем у double, &2*ε(double)². Если разрядность этого регистра такова, что &2*ε(double)² в нем нет (или в fpucw установлен соответствующий режим), то при сохранении регистра в память в формате double происходит округление по типу tie break to even, т.е. вниз, что мы и наблюдаем на старых версиях процессора. Если же регистр как минимум вдвое длиннее, чем мантисса double (и fpucw не запрещает анализировать его полностью), то происходит округление по типу round to nearest, т.е. вверх.

From:

spamsink.livejournal.com

void 
set_fpu (unsigned int mode)
{
  asm ("fldcw %0" : : "m" (*&mode));
}
int main(int ac, char **av) {
  volatile double a = 3.00000000000000044;
  volatile double b = 1.00000000000000022;
  set_fpu(0x27F);
  printf("%.17f\n", a * b);
}

Результат умножения будет немедленно, до попадания в регистр FPU округляться до double, и будет правильно на всех процессорах.

From:

vak

Так-так, сейчас посмотрим, что за режимы...
Я пробовал fesetround(FE_TONEAREST) - не помогает.

From:

spamsink.livejournal.com

По умолчанию 0x37F (3 - extended precision, 2 - double precision, 1 - reserved, 0 - single precision).

Я вот чего не пойму:

Xeon:
FPU mode 7f: 3.00000000000000000
FPU mode 17f: 3.00000000000000089
FPU mode 27f: 3.00000000000000133
FPU mode 37f: 3.00000000000000089

Core:
FPU mode 7f: 3.00000000000000133
FPU mode 17f: 3.00000000000000133
FPU mode 27f: 3.00000000000000133
FPU mode 37f: 3.00000000000000133

Что у них extended precision разная - понятно, но почему single precision так нагло игнорируется?

Edited Date: 2011-09-08 00:19 (UTC)

From:

vak

Да, помогает. Почему же другие процессоры даже с 0x37F дают правильный результат?

From:

spamsink.livejournal.com

Потому что их extended precision достаточна, чтобы eps*eps туда поместился.

From:

vak

Я слышал раньше, что физики не любят Интел. Теперь понимаю, почему.

From:

vak

На Оптероне эти биты тоже не влияют. Что же они, молча поменяли спецификацию такого важного регистра?

From:

spamsink.livejournal.com

Эти два бита всю жизнь этакие полусекретные были, раз никакого API для них не предусмотрено.

From:

lionet.livejournal.com

[vlm@nala:~]> cc -o c c.c && ./c 3.00000000000000044 1.00000000000000022
3.00000000000000044
3.00000000000000133
[vlm@nala:~]> cat c.c
int main(int ac, char **av) {
    printf("%.17f\n", 3.00000000000000044, 1.00000000000000022);
    printf("%.17f\n",
        atof(av[1]) * atof(av[2]));
}
[vlm@nala:~]>

Понятно теперь, что интеловский процессор не виноват?

From:

vak

Ничего непонятно.


$ cat c.c
#include <stdio.h>
#include <stdlib.h>
int main(int ac, char **av) {
     printf("%.17f\n", atof(av[1]));
     printf("%.17f\n", atof(av[2]));
     printf("%.17f\n", atof(av[1]) * atof(av[2]));
}
$ cc -o c c.c && ./c 3.00000000000000044 1.00000000000000022
3.00000000000000044
1.00000000000000022
3.00000000000000089

Edited Date: 2011-09-07 03:20 (UTC)

From:

lionet.livejournal.com

Значит у нас разные интеловские процессоры. Попробуй -O2?

From:

vak

Да, проверил на Intel Core Duo - работает правильно.
А на Intel(R) Xeon(R) W3530 безбожно глючит.
Вот и верь после этого Интелу.

From:

spamsink.livejournal.com

http://ramlamyammambam.livejournal.com/158379.html?thread=1280427#t1280427

From:

mtve.livejournal.com

printf("%.17f\n", 3.00000000000000044, 1.00000000000000022);

имелось в виду умножение?

From:

lionet.livejournal.com

Да, тормоз.

From:

cema.livejournal.com

У меня Core Duo и i5, работает правильно.

From:

oboguev.livejournal.com

Теперь задача -- научиться образующиеся доли центов откладывать на свой банковский счёт ;-)

Я, кстати, однажды благодаря багу в expedia получил место в business классе на билет в экономическом. Это было вскоре после того как они ввели интерактивный выбор места. Я выбрал место в начале самолёта, меня туда и посадили.

From:

ircicq.livejournal.com

В финансовых расчетах должны использоваться только целые числа, возможно выраженные в сотых долях копейки

From:

tsw.livejournal.com

раз уж зашел разговор про MIPS - а нет ли какого-нибудь форума, где тусуються люди работающие с MIPS ?
меня интересует возможность поговорить с теми, кто asm под MIPS c листа читает =)

From:

alec_v.livejournal.com

А давайте сделаем. "See MIPS run" лежит под подушкой ;)

В QEMU -- linux usermode test и куски монитора Malta - моё поделие.

From:

vak

Хорошая идея. Я поискал - не нашёл подходящего форума именно по архитектуре MIPS, ни русского, ни англоязычного.

Вы не в курсе, нынешний QEMU умеет MIPS64? Типа 5Kf на мальте.

From:

tsw.livejournal.com

просто у меня к MIPS достаточно локальный интерес!
тем более, что надо у автора поста узнать что думает про самостийные форумы сам MIPS!

но сделать свое - почему бы и нет!

Flat | Top-Level Comments Only

Профиль

Посетители