Einführung in die Verwendung von Unicode-Zeichen in Webseiten (&#, \u usw.)

Einführung in die Verwendung von Unicode-Zeichen in Webseiten (&#, \u usw.)

Die ersten Computer konnten nur ASCII-Zeichen verwenden. Mit der zunehmenden Bandbreite an Computeranwendungen entwickelten jedoch viele Länder spezielle Zeichensätze für Computer, sodass Buchstaben und Texte ihrer eigenen Länder und Nationalitäten auf Computern angezeigt und verarbeitet werden konnten. Ein Beispiel hierfür ist der chinesische Code GB2312. Später kam das Internet auf und verband die ganze Welt. Es wurde zu einem praktischen Bedürfnis, die Texte mehrerer Länder und ethnischer Gruppen auf einem einzigen Computer oder sogar einer einzigen Benutzeroberfläche anzuzeigen. Eine internationale Organisation hat ein Zeichenkodierungsschema entwickelt, das alle Texte und Symbole der Welt aufnehmen kann. Es heißt Unicode, die Abkürzung für Universal Character Set. Es wird verwendet, um die Anforderungen der sprach- und plattformübergreifenden Textkonvertierung und -verarbeitung zu erfüllen. Seit seiner Veröffentlichung im Jahr 1994 wurde es kontinuierlich erweitert und hat nun Version 10 erreicht.

Detaillierte Informationen, einschließlich des Downloads der neuesten Version der Codetabelle, finden Sie unter https://www.unicode.org/.

Beim Gestalten von Webseiten können Sie den Unicode-Zeichensatz verwenden. Je nachdem, ob Sie ihn in HTML, CSS oder JavaScript verwenden, gibt es unterschiedliche Einsatzmöglichkeiten.

1) Verwendung in HTML: &#dddd; oder &#xhhhh;

Unter ihnen stellt dddd einen 4-stelligen Dezimalwert dar und hhhh einen 4-stelligen Hexadezimalwert. Den beiden Formaten sind &# bzw. &#x vorangestellt, was einen Dezimalcode bzw. einen hexadezimalen Unicode-Code angibt, und beide müssen mit einem Semikolon angehängt werden. Derzeit werden Unicode-Zeichen mit 4-Bit-Hexadezimalcodes gut unterstützt und die meisten davon können auf Webseiten normal angezeigt werden. Viele andere Unicode-Zeichen können jedoch häufig nicht angezeigt werden. Dies liegt daran, dass auf der verwendeten Computerplattform die entsprechende Unicode-Unterstützung nicht installiert ist. Beispiel:
<p>Unicode-Zeichen anzeigen --∰</p>
Es zeigt ein mathematisches Symbol mit dem Unicode-Code 2230. Mit „&#x2230;“ bzw. „&#8752;“ lässt sich dieses Sonderzeichen ausgeben und anschließend auf der Seite anzeigen.

2) Verwendung in CSS: \hhhh

Unicode-Zeichen werden in CSS selten, aber gelegentlich verwendet. Sie werden im Allgemeinen durch einen 4-stelligen hexadezimalen Unicode-Code mit vorangestelltem Backslash dargestellt.

3) Verwendung in JavaScript: \uhhhh

In JavaScript-Code werden häufig Sonderzeichen verwendet. Um beispielsweise Temperatur- oder Winkelsymbole in einem Element mit griechischen Buchstaben, römischen Ziffern usw. auszugeben, fügen Sie einfach das Präfix "\u" vor den 4-Bit-Unicode-Hexadezimalcode ein. Beispiel:

Dokument.body.innerHTML="\u25D0";

Es wird der Unicode-Code 25D0 verwendet. In der geometrischen Figurentabelle handelt es sich um ein kreisförmiges Muster, das normalerweise weiß und zur Hälfte schwarz gefüllt ist, wie ein Halbmond.

Am häufigsten wird Unicode von Chinesen natürlich für chinesische Schriftzeichen verwendet. Um mehr chinesische Schriftzeichen anzuzeigen, wurde die Bibliothek chinesischer Schriftzeichen zunächst von GB2312 auf GBK und jetzt auf GB18030 erweitert. Die neueste Version von GB18030 umfasst mehr als 70.000 chinesische Schriftzeichen, verschiedene Minderheitensprachen und einige Sonderzeichen. Dieser Standard entspricht der Unicode-Codemethode. Natürlich kann es sein, dass auf manchen Computern keine komplett neue Version der Support-Software installiert ist und deshalb nur einige Zeichen angezeigt werden können.

Um den Unicode-Code eines chinesischen Zeichens zu erhalten, können Sie beispielsweise die JavaScript-Funktion charCodeAt() verwenden:

var ucode="Zu".charCodeAt();

Auf diese Weise wird der Unicode-Code des chinesischen Schriftzeichens „赵“ in der Variablen ucode gespeichert und der erhaltene Unicode-Code ist 36213, ein dezimaler Unicode-Code. Mit der Methode toString(16) können Sie diesen Dezimalcode in einen Hexadezimalcode umwandeln:

var ucode="Code".charCodeAt().toString(16);

Dies gibt uns den hexadezimalen Unicode-Code für das chinesische Schriftzeichen „赵“ und der Wert ist 8d75.

Im Allgemeinen kann bei der Ausgabe chinesischer Schriftzeichen die Zeichenfolge, die chinesische Schriftzeichen enthält, direkt angezeigt werden. Sie können auch den Unicode-Code der chinesischen Schriftzeichen verwenden, um die entsprechenden chinesischen Schriftzeichen oder andere Zeichen auszugeben:

String.vonCharCode(36213);

Dadurch wird das Zeichen mit dem dezimalen Unicode-Code 36213 in eine Zeichenfolge umgewandelt und bei der Ausgabe dieser Zeichenfolge wird das chinesische Zeichen „赵“ angezeigt. Da chinesische Schriftzeichen mithilfe von Eingabemethoden direkt in Zeichenfolgen umgewandelt werden können, wird diese Methode häufig zum Ausgeben einiger Sonderzeichen verwendet.

Konvertieren Sie die &#-Kodierung in Zeichen

Dies ist eine Unicode-Kodierung. Der Kodierungsprozess läuft wie folgt ab:

Wenn wir beispielsweise „杨“ kodieren möchten, können wir einen neuen Editor erstellen, „杨“ eingeben und als Unicode-Kodierung speichern und dann den binären Inhalt der Datei anzeigen. Die ersten beiden Bytes FF FE sind das Unicode-Kodierungsdateikopfflag und die nächsten beiden Bytes 68 67 sind die Unicode-Kodierung von „杨“. Verwenden Sie einen Taschenrechner, um es in eine Dezimalzahl umzuwandeln, die 26472 ergibt. Jetzt können Sie „杨“ in eine HTML-Datei schreiben, und wenn der IE sie öffnet, wird das Wort „杨“ angezeigt.

Natürlich ist bei allgemeinen ASCII-Codes die Unicode-Kodierung mit der ASCII-Kodierung konsistent, sodass A einen Großbuchstaben „A“ anzeigen kann.

Konvertieren Sie die &#-Kodierung in Zeichen

Funktion uncode(str) {
return str.replace(/&#(x)?([^&]{1,5});?/g, Funktion (a, b, c) {
return String.fromCharCode(parseInt(c, b ? 16 : 10));
});
}

Konvertieren Sie Zeichen in die &#-Kodierung

Funktion kodieren(str) {
var a = [], i = 0;
für (; i < str.length ;) a[i] = str.charCodeAt(i++);
return "&#" + a.join(";&#") + ";";
}

Dies ist das Ende dieses Artikels über die Verwendung von Unicode-Zeichen in Webseiten (&#, \u usw.). Weitere relevante Unicode-Inhalte finden Sie in den vorherigen Artikeln von 123WORDPRESS.COM oder in den verwandten Artikeln weiter unten. Ich hoffe, dass jeder 123WORDPRESS.COM in Zukunft unterstützen wird!

<<:  Analysieren Sie CSS, um die Farbfunktion des Bildthemas zu extrahieren (Tipps)

>>:  Beispiel für die Implementierung bidirektionaler Nachrichten zwischen übergeordneten und untergeordneten Seiten in einem HTML-Iframe

Artikel empfehlen

CSS3 realisiert die Mask Barrage-Funktion

Kürzlich habe ich auf der B-Station einen Sperrfe...

Vue implementiert nahtloses Scrollen von Listen

In diesem Artikelbeispiel wird der spezifische Co...

Implementierung zum Zeichnen einer Audio-Wellenform mit wavesurfer.js

1. Sehen Sie sich die Renderings an Weiterleiten ...

Schritte zur Installation von cuda10.1 unter Ubuntu 20.04 (grafisches Tutorial)

Vorbereitung vor der Installation Der Hauptzweck ...

MySQL-Trigger: Erstellen und Verwenden von Triggern

Dieser Artikel beschreibt anhand von Beispielen d...

So konfigurieren Sie den NAT-Modus für virtuelle VMware-Maschinen

In diesem Artikel wird der NAT-Konfigurationsproz...

Der Unterschied zwischen Name und Wert im Eingabe-Tag

Typ ist das Steuerelement, das für die Eingabe und...

So machen Sie React-Komponenten im Vollbildmodus

einführen Dieser Artikel basiert auf React + antd...

CSS3 realisiert den Animationseffekt der Lotusblüte

Schauen wir uns zunächst die Wirkung an: Dieser E...

Lassen Sie uns kurz über die Änderungen im Setup in vue3.0 sfc sprechen

Inhaltsverzeichnis Vorwort Standard-SFC-Schreibme...

Three.js realisiert den dynamischen 3D-Logoeffekt von Facebook Metaverse

Inhaltsverzeichnis Hintergrund Was ist das Metave...