Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
utf8 [2025/05/07 09:14] admin |
utf8 [2025/05/07 09:18] (aktuell) admin |
||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | [[https:// | + | UTF-8 ist eine Methode, [[Unicode]]-Zeichen |
+ | |||
+ | Beispiel: | ||
+ | |||
+ | Vorteile: | ||
+ | |||
+ | * Abwärtskompatibel zu ASCII. | ||
+ | * Effizient für englische Texte. | ||
+ | * Weltweit am häufigsten verwendetes Format (z. B. im Web, in JSON, HTML, etc.). | ||
+ | |||
^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^ | ^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^ | ||
Zeile 11: | Zeile 21: | ||
Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes. | Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes. | ||
- | ===== UTF-16 ===== | + | Siehe auch [[utf16]], [[utf32]] |
- | + | ||
- | [[utf16]] | + | |
- | + | ||
- | ^ Code point range ^ Encoding Format ^ | + | |
- | | U+0000 – U+D7FF | 16-bit: 1 code unit (0000000000000000 - 1101101111111111) | | + | |
- | | U+E000 – U+FFFF | 16-bit: 1 code unit (1110000000000000 - 1111111111111111) | | + | |
- | | U+10000 – U+10FFFF | 2×16-bit: surrogate pair: 110110xxxxxxxxxx + 110111xxxxxxxxxx | | + | |
- | + | ||
- | ===== UTF-32 ===== | + | |
- | + | ||
- | [[utf32]] | + | |
- | ^ Code point range ^ Encoding Format ^ | + | |
- | | U+00000000 – U+10FFFF | 32-bit: 1 code unit, zero-padded | | + | |
- | | (e.g., U+0041 → 00000000 00000000 00000000 01000001) | | + | |
=====Links===== | =====Links===== | ||
https:// | https:// |