UTF8 ist eine Methode um Unicode Zeichen zu kodieren. ASCII kann 128 Zeichen darstellen, alles darüber ist sogenanntes Multibyte encoding. Ein „á“ wird durch die Zahl 255 repräsentiert. 255 kann aber nicht (ohne Zusatzinformationen) in einem Byte gespeichert werden - deshalb werden 2 Byte benutzt.

Die auf 1 gesetzten Bits im ersten Byte sind die Anzahl der insgesamt verwendeten Bytes.

https://www.quora.com/What-is-UTF8