UTF-32 ist ein Zeichensatz der Unicode-Zeichen als Folgen von 4-Byte-Einheiten (16 Bit) bei der jedes Zeichen genau 4 Bytes (32 Bit) belegt – unabhängig vom tatsächlichen Codepoint.
Vorteile:
Nachteile:
| Code point range | Encoding Format |
|---|---|
| U+00000000 – U+10FFFF | 32-bit: 1 code unit, zero-padded |
| (e.g., U+0041 → 00000000 00000000 00000000 01000001) |