floating_point

Gleitkommazahlen in der Programmierung repräsentieren reelle Zahlen, die Dezimalpunkte oder Exponenten enthalten können. In C gibt es zwei Haupttypen: float und double.

float: Bietet ungefähr 6 Dezimalstellen Genauigkeit und einen Bereich von etwa 10^-38 bis 10^38.
double: Bietet ungefähr 15 Dezimalstellen Genauigkeit und einen viel größeren Bereich von etwa 10^-308 bis 10^308.

Gleitkommazahlen werden anders gespeichert als Ganzzahlen. Sie werden üblicherweise im IEEE 754-Standard dargestellt. Dieser Standard definiert, wie Gleitkommazahlen im Binärformat repräsentiert werden.

Eine Gleitkommazahl im IEEE 754-Format besteht aus drei Teilen

Vorzeichen (Sign-Bit): 1 Bit, das das Vorzeichen der Zahl repräsentiert. 0 für positive Zahlen, 1 für negative Zahlen.
Exponent: Dieser Teil bestimmt die Größenordnung der Zahl. Er ist größer als der Sign-Teil und hat eine bestimmte Anzahl von Bits, die den Exponenten darstellen (meistens 8). Dieser Exponent ist mit einer gewissen Basis verbunden (meistens 2, binär).
Mantisse (auch Fraktion oder Signifikand genannt): Dieser Teil enthält die eigentlichen Ziffern der Zahl. Er repräsentiert den dezimalen Teil der Gleitkommazahl.

Die Berechnung erfolgt nach folgendem Schema. S: Sign Bit, M: Mantissa, E: Exponent

(-1)^S * M * 2^E