Benutzer-Werkzeuge

Webseiten-Werkzeuge


utf32

UTF-32 ist eine feste Unicode Kodierung, bei der jedes Zeichen genau 4 Bytes (32 Bit) belegt – unabhängig vom tatsächlichen Codepoint.

  • „á“ (U+00E1) wird als 0x000000E1 gespeichert.
  • „😀“ (U+1F600) wird als 0x0001F600 gespeichert.

Vorteile:

  • Sehr einfach zu verarbeiten (jedes Zeichen = 4 Bytes).
  • Kein Surrogate-Handling notwendig.

Nachteile:

  • Hoher Speicherbedarf (auch für einfache Texte).
  • Wenig effizient in der Praxis.
Code point range Encoding Format
U+00000000 – U+10FFFF 32-bit: 1 code unit, zero-padded
(e.g., U+0041 → 00000000 00000000 00000000 01000001)
utf32.txt · Zuletzt geändert: 2025/05/07 09:19 von admin