Unicode ist ein internationaler Standard zur Kodierung, Darstellung und Handhabung von Text in den meisten modernen Computersystemen und Anwendungen. Er wurde entwickelt, um eine einheitliche und konsistente Möglichkeit zu bieten, Zeichen aus den vielen verschiedenen Schriftsystemen der Welt zu codieren und darzustellen. Unicode ermöglicht es, nahezu jedes Schriftzeichen aus nahezu jeder Sprache und viele andere Symbole in digitalen Systemen zu verwenden.
Unicode selbst ist lediglich ein Zeichensatz, aber um ihn in digitalen Systemen zu speichern oder zu übertragen, wird eine Kodierung benötigt. Die häufigsten Unicode-Kodierungen sind:
Unicode verwendet ein numerisches System, um Zeichen zu kodieren, wobei jedes Zeichen durch eine eindeutige Zahl, den sogenannten Codepunkt, dargestellt wird. Ein Codepunkt wird in der Form U+XXXX angegeben, wobei XXXX eine hexadezimale Zahl ist. Zum Beispiel ist der Codepunkt für das Zeichen „A“ U+0041, und der Codepunkt für das Emoji „😊“ ist U+1F60A.
Unicode ist in verschiedene Bereiche unterteilt, um Zeichen aus verschiedenen Schriftsystemen und Symbolkategorien zu gruppieren. Die wichtigsten Bereiche umfassen: