Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
|
utf8 [2025/05/07 09:12] jango |
utf8 [2025/05/07 09:18] (aktuell) admin |
||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| - | [[https:// | + | UTF-8 ist eine Methode, [[Unicode]]-Zeichen |
| + | |||
| + | Beispiel: | ||
| + | |||
| + | Vorteile: | ||
| + | |||
| + | * Abwärtskompatibel zu ASCII. | ||
| + | * Effizient für englische Texte. | ||
| + | * Weltweit am häufigsten verwendetes Format (z. B. im Web, in JSON, HTML, etc.). | ||
| + | |||
| ^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^ | ^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^ | ||
| Zeile 11: | Zeile 21: | ||
| Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes. | Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes. | ||
| - | ===== UTF-16 ===== | + | Siehe auch [[utf16]], [[utf32]] |
| - | ^ Code point range ^ Encoding Format ^ | + | |
| - | | U+0000 – U+D7FF | 16-bit: 1 code unit (0000000000000000 - 1101101111111111) | | + | |
| - | | U+E000 – U+FFFF | 16-bit: 1 code unit (1110000000000000 - 1111111111111111) | | + | |
| - | | U+10000 – U+10FFFF | 2×16-bit: surrogate pair: 110110xxxxxxxxxx + 110111xxxxxxxxxx | | + | |
| - | + | ||
| - | ===== UTF-32 ===== | + | |
| - | ^ Code point range ^ Encoding Format ^ | + | |
| - | | U+00000000 – U+10FFFF | 32-bit: 1 code unit, zero-padded | | + | |
| - | | (e.g., U+0041 → 00000000 00000000 00000000 01000001) | | + | |
| =====Links===== | =====Links===== | ||
| https:// | https:// | ||