Benutzer-Werkzeuge

Webseiten-Werkzeuge


utf8

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
utf8 [2025/05/07 09:14]
admin
utf8 [2025/05/07 09:18] (aktuell)
admin
Zeile 1: Zeile 1:
-[[https://de.wikipedia.org/wiki/UTF-8|UTF8]] ist eine Methode um [[Unicode]] Zeichen zu kodierenASCII kann 128 Zeichen darstellen, alles darüber ist sogenanntes **Multibyte encoding**Ein "á" wird durch die Zahl 255 repräsentiert. 255 kann aber nicht (ohne Zusatzinformationen) in einem Byte gespeichert werden deshalb werden 2 Byte benutzt.+UTF-8 ist eine Methode[[Unicode]]-Zeichen als Folge von Bytes zu speichernSie ist variabel in der Länge: Ein Zeichen kann aus 1 bis 4 Bytes bestehen. ASCII-Zeichen (0–127) werden wie gewohnt in 1 Byte gespeichert. Zeichen darüber verwenden 2 bis 4 Bytes. 
 + 
 +Beispiel: "á" (U+00E1wird in UTF-8 als zwei Bytes gespeichert: 0xC3 0xA1. 
 + 
 +Vorteile: 
 + 
 +  * Abwärtskompatibel zu ASCII. 
 +  * Effizient für englische Texte. 
 +  * Weltweit am häufigsten verwendetes Format (z. B. im Web, in JSON, HTML, etc.). 
 + 
  
 ^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^ ^ Bits of code point ^ First code point ^ Last code point ^ Bytes in sequence ^ Byte 1 ^ Byte 2 ^ Byte 3 ^ Byte 4 ^ Byte 5 ^ Byte 6 ^
Zeile 11: Zeile 21:
 Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes. Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes.
  
-===== UTF-16 ===== +Siehe auch [[utf16]][[utf32]]
- +
-[[utf16]] +
- +
-^ Code point range ^ Encoding Format ^ +
-| U+0000 – U+D7FF | 16-bit: 1 code unit (0000000000000000 - 1101101111111111) | +
-| U+E000 – U+FFFF | 16-bit: 1 code unit (1110000000000000 - 1111111111111111) | +
-| U+10000 – U+10FFFF | 2×16-bit: surrogate pair: 110110xxxxxxxxxx + 110111xxxxxxxxxx | +
- +
-===== UTF-32 ===== +
- +
-[[utf32]] +
-^ Code point range ^ Encoding Format ^ +
-| U+00000000 – U+10FFFF | 32-bit: 1 code unit, zero-padded | +
-| (e.g., U+0041 → 00000000 00000000 00000000 01000001) |+
  
 =====Links===== =====Links=====
  
 https://www.quora.com/What-is-UTF8 https://www.quora.com/What-is-UTF8
utf8.1746602058.txt.gz · Zuletzt geändert: 2025/05/07 09:14 von admin