Warum wird in MySQL keine UTF-8-Kodierung verwendet?

Warum wird in MySQL keine UTF-8-Kodierung verwendet?

MySQL UTF-8-Kodierung

MySQL unterstützt UTF-8 seit Version 4.1 (im Jahr 2003), der derzeit gängige UTF-8-Standard (RFC 3629) wurde jedoch erst danach spezifiziert. Aus diesem Grund ist das UTF-8 in MySQL nicht konsistent mit dem UTF-8 in unserer täglichen Entwicklung, was zu einigen Problemen führt. MySQLs UTF-8 unterstützt nur bis zu drei Bytes pro Zeichen, während echtes UTF-8 bis zu vier Bytes pro Zeichen unterstützt.

Reproduktion des Problems

Die Datenbanktabelle sieht wie folgt aus: utf8-Kodierung

Fügen Sie der Datenbank einen Datensatz hinzu:

@Prüfen
öffentliche void testInsert() {
 Benutzer Benutzer = neuer Benutzer();
 Benutzer.setUsername("\uD83D\uDE00 ");
 Benutzer.setPassword("123456");
 userRepo.save(Benutzer);
}

Dies ist nur ein Teil des Codes. Es ist nicht schlimm, wenn Sie ihn nicht verstehen. Hier wird ein Datensatz in die Benutzertabelle eingefügt. Wobei der Benutzername \uD83D\uDE00 ist.

Tatsächlich ist \uD83D\uDE00 ein Emoji.

Da der UTF-8-Zeichensatz in MySQL nur den Unicode-Bereich der drei Byte langen UTF-8-Kodierung unterstützt und Emoji-Zeichen zum vier Byte langen Kodierungsteil gehören, meldet das Programm bei der erwartungsgemäßen Ausführung einen Fehler. Führen Sie diesen Code aus:

Wie erwartet wurde ein Fehler gemeldet.

Lösung des Problems

Obwohl MySQLs UTF-8 Mängel aufweist, haben die Verantwortlichen von MySQL (einschließlich MariaDB) diesen Fehler nicht behoben. Stattdessen wurde echtes UTF-8 durch die 2010 neu veröffentlichte Version „utf8mb4“ unterstützt. Wenn Sie dieses Problem lösen möchten, können Sie die MySQL-Datenbank nur auf den Zeichensatz utf8mb4 einstellen.

Zusammenfassen

Dieses Problem wurde entdeckt, weil beim Speichern der Daten ein Emoji-Ausdruck gespeichert wurde. Tatsächlich entdeckte ich utf8mb4, als ich begann, MySQL zu verwenden, verstand aber den Unterschied zwischen UTF8 und UTF8MB4 nicht. Nachdem ich diese Lektion gelernt habe, werde ich bei zukünftiger Verwendung von MySQL den Zeichensatz auf utf8mb4 einstellen.

Das ist alles für diesen Artikel. Ich hoffe, dass der Inhalt dieses Artikels für Ihr Studium oder Ihre Arbeit von gewissem Referenzwert ist. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM.

Das könnte Sie auch interessieren:
  • So legen Sie die UTF-8-Kodierung in einer MySQL-Datenbank fest
  • MySQL GBK → UTF-8-Kodierungskonvertierung
  • Warum wird UTF-8 in MySQL nicht empfohlen?

<<:  So vergessen Sie das Passwort von Jenkins in Linux

>>:  WeChat-Applet-Picker - Mehrspalten-Selektor (Modus = MultiSelector)

Artikel    

Artikel empfehlen

So konfigurieren Sie NAS unter Windows Server 2019

Vorwort Dieses Tutorial installiert die neuste Ve...

Eine ausführliche Diskussion zur Detailanalyse im Webdesign

Bei der Designarbeit höre ich oft, dass an der Übe...

Ubuntu öffnet Port 22

Szenario Sie müssen das Xshell-Tool verwenden, um...

Vollständiger Prozessdatensatz zur Fehlerbehebung bei MySQL DeadLock

【Autor】 Liu Bo: Leitender Datenbankmanager im Ctr...

Kostenloses Tutorial zur Installationskonfiguration der Version MySQL 5.7.18

MySQL wird in eine Installationsversion und eine ...

So zeigen Sie die Erstellungszeit von Dateien in Linux an

1. Einleitung Ob die Erstellungszeit einer Datei ...

Eine kurze Analyse der Verwendung des HTML-Webpack-Plugins

Wenn Sie zum Starten der Seite das Plugin „html-w...

Verlustfreie Erweiterungsmethode unter Linux

Überblick Der Server des Cloud-Plattform-Kunden k...

So überwachen Sie den Linux-Serverstatus

Wir, insbesondere Linux-Ingenieure, haben täglich...

Beispiele für die Verwendung des ES6-Spread-Operators

Inhaltsverzeichnis Was sind Spread- und Rest-Oper...

Eine kurze Diskussion über JS-Verpackungsobjekte

Inhaltsverzeichnis Überblick Definition Instanzme...