Die Kodierung von Webseiten wird im Englischen als „Webseitenkodierung“ übersetzt und ist eine Bibliothek, die das spezifische Zeichenkodierungsformat einer Webseite angibt. GBK ist ein auf Basis des nationalen Standards GB2312 erweiterter Standard, der mit GB2312 kompatibel ist. Die GBK-Textkodierung wird durch Doppelbyte dargestellt, d. h. sowohl chinesische als auch englische Zeichen werden durch Doppelbyte dargestellt. Um Chinesisch zu unterscheiden, wird das höchste Bit auf 1 gesetzt. GBK enthält alle chinesischen Schriftzeichen und ist ein nationaler Code. Er ist weniger universell als UTF8, aber die von UTF8 belegte Datenbank ist größer als die von GBK. UTF-8: Unicode TransformationFormat-8bit, das BOM zulässt, aber normalerweise kein BOM enthält. Es handelt sich um eine Multibyte-Kodierung zur Auflösung internationaler Zeichen. Sie verwendet 8 Bit (also ein Byte) für Englisch und 24 Bit (drei Byte) für Chinesisch. UTF-8 enthält Zeichen, die in allen Ländern der Welt benötigt werden. Es handelt sich um eine internationale Kodierung mit großer Vielseitigkeit. UTF-8-codierter Text kann in Browsern verschiedener Länder angezeigt werden, die den UTF-8-Zeichensatz unterstützen. Wenn es sich um eine UTF8-Kodierung handelt, kann Chinesisch auch im englischen IE von Ausländern angezeigt werden, und sie müssen das Supportpaket für die chinesische Sprache für den IE nicht herunterladen. Obwohl die UTF-8-Version eine gute internationale Kompatibilität aufweist, benötigt die chinesische Version 50 % mehr Datenbankspeicherplatz als die GBK/BIG5-Version. Daher wird sie nicht empfohlen und ist nur für Benutzer gedacht, die besondere Anforderungen an die internationale Kompatibilität haben. Einfach ausgedrückt: Für Websites mit mehr chinesischen Schriftzeichen ist es sinnvoll, die GBK-Kodierung zu verwenden, um Datenbankspeicherplatz zu sparen. Für Websites mit mehr englischen Inhalten ist es sinnvoll, UTF-8 zu verwenden, um Datenbankspeicherplatz zu sparen. Wie konvertiere ich GBK, GB2312 usw. in UTF8? GBK, GB2312 und UTF8 müssen durch Unicode-Kodierung ineinander konvertiert werden: GBK, GB2312-Unicode-UTF8; UTF8-Unicode-GBK, GB2312. Mit „Speichern unter“ im Windows-Editor können Sie zwischen den Kodierungsmethoden GBK, Unicode, Unicode Big Endian und UTF-8 konvertieren. Wie kann man dafür sorgen, dass der Browser die Kodierung einer Webseite richtig erkennt? Im Allgemeinen sollte auf einer Webseite ein Satz wie dieser vorkommen: <meta http-equiv="Content-Type" content="text/html; charset=gb2312">, der angibt, dass die Zeichensatzkodierung dieser Webseite GB2312 ist. (oder UTF-8) Warum werden manchmal verstümmelte Zeichen angezeigt, obwohl auf der Seite die Kodierung angegeben ist? Dies kann daran liegen, dass die angegebene Kodierung der Seite nicht mit der Kodierung der Datei übereinstimmt. Häufiger liegt dies daran, dass die Seite mit der falschen Kodierung geöffnet und dann gespeichert wird oder dass die Datei mithilfe einer FTP-Software wie CuteFTP direkt online geändert wird, wodurch die Datei aufgrund einer falschen Kodierungskonfiguration in die falsche Kodierung konvertiert wird. Öffnen Sie es jetzt mit dem Windows-Editor und speichern Sie es mit „Speichern unter“ in der entsprechenden Kodierung, um das Problem zu lösen. Bei Verwendung von IE als Browser auf einem Windows-Betriebssystem tritt häufig das folgende Problem auf: Beim Durchsuchen einer Webseite, die die UTF-8-Kodierung verwendet, kann der Browser die von der Seite verwendete Kodierung nicht automatisch erkennen, selbst wenn die Webseite das Kodierungsformat deklariert hat: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />. Infolgedessen erzeugen einige Seiten mit chinesischer UTF-8-Kodierung eine leere Ausgabe. Wenn Sie den Browser Firefox oder Sarafi verwenden, tritt dieses Problem nicht auf. Dies liegt daran, dass der Internet Explorer beim Parsen von Webseitencodes zuerst den HTML-Tags und dann den Informationen im HTTP-Header Priorität einräumt, während es bei den Browsern der Mozilla-Reihe genau umgekehrt ist. Weil UTF-8 3 Bytes zur Darstellung eines chinesischen Zeichens verwendet, während gewöhnliches GB2312 oder BIG5 zwei Bytes verwendet. Wenn aus den oben genannten Gründen die Seite ausgegeben wird, analysiert der IE UTF-8 als zwei Bytes, wenn der Browser den Inhalt von <title></title> analysiert und ausgibt und vor </title> eine ungerade Anzahl von Zeichen in voller Breite steht. Dabei wird das halbe chinesische Zeichen mit dem < von </title> kombiniert und bildet ein verstümmeltes Wort. Dadurch kann der IE den Teil <title> nicht lesen und die gesamte Seitenausgabe ist leer. Wenn Sie zu diesem Zeitpunkt die Quelldatei überprüfen, werden Sie feststellen, dass die gesamte Seite tatsächlich ausgegeben wurde, der Browser den Inhalt jedoch nicht anzeigt. Die einfachste Lösung besteht darin, <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> vor <title></title> zu setzen. |
<<: So verwenden Sie @media in mobilen adaptiven Stilen
>>: Problem beim Wechseln der Registerkarten für die Handschrift von React
MySQL-Installation (4, 5, 6 können weggelassen we...
Lassen Sie mich zunächst erklären, dass wir uns o...
Inhaltsverzeichnis 10.000 Daten gingen im Hinterg...
Anhand eines Beispiels habe ich Ihnen die Lösung ...
In diesem Artikel wird ein Nachrichtenfeld mit Sp...
Jeden Tag ein jQuery-Plugin - Schritt-Fortschritt...
Dieser Artikel beschreibt die Linux-Benutzer- und...
Bei täglichen Betriebs- und Wartungsarbeiten werd...
Die Ausführungsreihenfolge der SQL-Abfrageanweisu...
1. Lackübersicht 1. Einführung in Varnish Varnish...
Inhaltsverzeichnis 1. Beginnen wir mit dem Fazit ...
Der Test wird in der Node.JS-Umgebung bestanden. ...
Inhaltsverzeichnis Überblick 1. Funktion Entprell...
Das HTML-Spezifikationsdokument führt das Crossor...
Hintergrund Da die Anzahl der Anwendungssysteme w...