So erkennen Sie, ob es sich beim aktuellen Browser um einen Headless-Browser mit JavaScript handelt

Inhaltsverzeichnis

Was ist ein Headless-Browser?
Warum wird er als „Headless“-Browser bezeichnet?
Warum Headless-Browser erkennen?
Erkennen von Headless-Browsern
Benutzeragent
Plugins
Sprache
WebGL
Browserfunktionen
Bild konnte nicht geladen werden

Was ist ein Headless-Browser?

Ein Headless-Browser ist ein Browser, der mit einer grafischen Benutzeroberfläche ausgeführt werden kann. Ich kann den Headless-Browser programmgesteuert steuern, sodass er automatisch verschiedene Aufgaben ausführt, z. B. Tests durchführt, Screenshots von Webseiten erstellt usw.

Warum wird er als „Headless“-Browser bezeichnet?

Das Wort „headless“ kommt vom ursprünglichen „headless computer“. Wikipedia-Eintrag zum Thema „Headless Computer“:

Ein Headless-System ist ein Computersystem oder -gerät, das für den Betrieb ohne Monitor (d. h. „Kopf“), Tastatur und Maus konfiguriert wurde. Headless-Systeme werden normalerweise über eine Netzwerkverbindung gesteuert, einige Headless-Systemgeräte erfordern für die Geräteverwaltung jedoch auch eine serielle RS-232-Verbindung. Um die Betriebskosten zu senken, werden Server häufig im Headless-Modus ausgeführt.

Warum Headless-Browser erkennen?

Neben den beiden zuvor erwähnten harmlosen Anwendungsfällen können Headless-Browser auch zur Automatisierung bösartiger Aufgaben verwendet werden. Die häufigsten Formen sind Webcrawler, die den Datenverkehr verschleiern oder Schwachstellen auf Websites erkennen.

Ein sehr beliebter Headless-Browser ist Phantomjs. Da er auf dem Qt-Framework basiert, weist er im Vergleich zu unseren üblichen Browsern viele andere Funktionen auf, sodass es viele Möglichkeiten gibt, ihn zu identifizieren.

Ab Chrome 59 hat Google jedoch einen Headless-Browser Google Chrome veröffentlicht. Es unterscheidet sich von Phantomjs. Es wird auf Basis des herkömmlichen Google Chrome entwickelt und nicht auf Basis anderer Frameworks. Dadurch ist es für das Programm schwierig zu unterscheiden, ob es sich um einen normalen Browser oder einen Headless-Browser handelt.

Im Folgenden stellen wir verschiedene Methoden vor, um festzustellen, ob das Programm in einem normalen Browser oder einem Headless-Browser ausgeführt wird.

Erkennen von Headless-Browsern

Hinweis: Diese Methoden wurden nur auf vier Maschinen (2 Linux, 2 Mac) getestet. Allerdings gibt es sicherlich noch viele andere Möglichkeiten, Headless-Browser zu erkennen.

Benutzeragent

Stellen wir zunächst die gängigste Methode zur Bestimmung des Browsertyps vor, nämlich die Überprüfung des Benutzeragenten. Der User-Agent-Wert des Headless-Browsers Chrome Version 59 auf einem Linux-Computer lautet:

„Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (Khtml, wie Gecko) HeadlessChrome/59.0.3071.115 Safari/537.36“

So können wir erkennen, ob es sich um einen Chrome-Browser ohne Header handelt:

wenn (/HeadlessChrome/.test(window.navigator.userAgent)) {
  console.log("Chrome-Headless erkannt");
 }

Der Benutzeragent kann auch aus HTTP-Headern abgerufen werden. Allerdings lassen sich beide Szenarien leicht vortäuschen.

Plugins

navigator.plugins gibt ein Array zurück, das die Plugin-Informationen im aktuellen Browser enthält. Normalerweise verfügen normale Chrome-Browser über einige Standard-Plugins, wie etwa den Chrome PDF Viewer oder den Google Native Client. Im Gegensatz dazu wird im Headless-Modus ohne Plug-ins ein leeres Array zurückgegeben.

wenn (navigator.plugins.length == 0) {
  console.log("Es könnte sich um Chrome ohne Header handeln");
}

Sprache

In Google Chrome gibt es zwei JavaScript-Eigenschaften, mit denen die aktuellen Spracheinstellungen des Browsers abgerufen werden können: navigator.language und navigator.languages. Der erste bezieht sich auf die Sprache der Browseroberfläche und der zweite gibt ein Array zurück, das alle vom Browserbenutzer ausgewählten Sekundärsprachen speichert. Im Headless-Modus gibt navigator.languages jedoch eine leere Zeichenfolge zurück.

if (navigator.sprachen == "") {
  console.log("Chrome-Headless erkannt");
}

WebGL

WebGL bietet eine Reihe von APIs, die 3D-Rendering im HTML-Canvas durchführen können. Über diese APIs können wir den Anbieter und Renderer des Grafiktreibers abfragen.

In einem normalen Google Chrome-Browser unter Linux erhalten wir die Renderer- und Anbieterwerte als: „Google SwiftShader“ und „Google Inc.“.

Und im Headless-Modus erhalten wir „Mesa OffScreen“ – das ist der Name der Rendering-Technologie, die kein Fenstersystem verwendet, und „Brian Paul“ – der ursprüngliche Programmierer der Open-Source-Grafikbibliothek Mesa.

 var Leinwand = Dokument.createElement('Leinwand');
 var gl = canvas.getContext('webgl');
  
 var debugInfo = gl.getExtension('WEBGL_debug_renderer_info');
 var Anbieter = gl.getParameter(debugInfo.UNMASKED_VENDOR_WEBGL);
 var renderer = gl.getParameter(debugInfo.UNMASKED_RENDERER_WEBGL);
  
 if (Anbieter == "Brian Paul" && Renderer == "Mesa OffScreen") {
  console.log("Chrome-Headless erkannt");
 }

Nicht alle Versionen von Headless-Browsern haben für diese beiden die gleichen Werte. Derzeit lauten die Werte in Headless-Browsern jedoch „Mesa Offscreen“ und „Brian Paul“.

Browserfunktionen

Modernizr kann die Unterstützung verschiedener HTML- und CSS-Funktionen durch den aktuellen Browser erkennen. Der einzige Unterschied, den ich zwischen dem normalen Chrome und dem Headless-Chrome festgestellt habe, besteht darin, dass es im Headless-Modus keine Haarlinienfunktion gibt, mit der festgestellt wird, ob Hidpi-/Retina-Haarlinien unterstützt werden.

wenn (!Modernizr["Haarlinie"]) {
  console.log("Es könnte sich um Chrome ohne Header handeln");
}

Bild konnte nicht geladen werden

Die letzte Methode, die ich gefunden habe und die am besten zu funktionieren scheint, besteht darin, die Höhe und Breite des Bildes zu überprüfen, das im Browser nicht richtig geladen wird.

Im normalen Chrome hängt die Größe des Bildes, das nicht erfolgreich geladen werden konnte, mit dem Zoom des Browsers zusammen, ist aber definitiv nicht Null. Im Headless-Chrome-Browser betragen die Breite und Höhe dieses Bildes beide 0.

var body = document.getElementsByTagName("body")[0];
var Bild = Dokument.createElement("img");
image.src = "http://iloveponeydotcom32188.jg";
image.setAttribute("id", "gefälschtes Bild");
body.appendChild(Bild);
Bild.beiFehler = Funktion(){
	wenn(Bild.Breite == 0 && Bild.Höhe == 0) {
		console.log("Chrome-Headless erkannt");
	}
}

Oben finden Sie Einzelheiten dazu, wie Sie mithilfe von JavaScript feststellen können, ob der aktuelle Browser ein Headless-Browser ist. Weitere Informationen zu JavaScript finden Sie in den anderen verwandten Artikeln auf 123WORDPRESS.COM!

Das könnte Sie auch interessieren:

Unterschiede zwischen diesem Schlüsselwort in NodeJS und Browsern
JavaScript ermittelt, ob der Browser IE ist
Beispielcode für JavaScript zur Realisierung des automatischen Scrollens und Klickens von Browser-Webseiten
So verwenden Sie die Webcam in Ihrem Browser mit JavaScript
So verwenden Sie JavaScript zum Bearbeiten der Browserverlauf-API
Detaillierte Erläuterung des JS-Cross-Browser-XML-Anwendungsprozesses
Mobiler Browser ruft WeChat-Sharing auf (JS)
Die JavaScript-Debugging-Funktion des Browsers kann nicht verwendet werden. Lösung
Zusammenfassung häufig verwendeter JavaScript-Toolfunktionen (Browserumgebung)
Beispiel für die Beurteilung des Browsertyps basierend auf js

<<: Schreiben Sie ein MySQL-Datensicherungsskript mithilfe der Shell

>>: So legen Sie in Linux eine feste IP fest (getestet und effektiv)

Der Nginx-Reverseproxy leitet Anfragen von Port 80 an 8080 weiter.

Erste Schritte Tutorial für Neulinge ⑤: Die Registrierung auf der Website ist sehr einfach, Tipps zur schnellen Registrierung

Artikel

Mehrere Möglichkeiten, das Problem des Schwebens zu lösen, das dazu führt, dass die Höhe des übergeordneten Elements in CSS zusammenbricht

Artikel

Prozessanalyse der Bereitstellung von ASP.NET Core-Anwendungen auf dem Linux-System Docker

So erkennen Sie, ob es sich beim aktuellen Browser um einen Headless-Browser mit JavaScript handelt

Inhaltsverzeichnis

Was ist ein Headless-Browser?

Warum wird er als „Headless“-Browser bezeichnet?

Warum Headless-Browser erkennen?

Erkennen von Headless-Browsern

Benutzeragent

Plugins

Sprache

WebGL

Browserfunktionen

Bild konnte nicht geladen werden

Der Nginx-Reverseproxy leitet Anfragen von Port 80 an 8080 weiter.

CSS und JS für eine romantische Meteorschauer-Animation

Lösung für MySQL-Verbindungsausnahme und Fehler 10061

Grundlegendes Tutorial zur Bedienung von Dateien und Berechtigungen in CentOS

Erste Schritte Tutorial für Neulinge ⑤: Die Registrierung auf der Website ist sehr einfach, Tipps zur schnellen Registrierung

Mehrere Möglichkeiten, das Problem des Schwebens zu lösen, das dazu führt, dass die Höhe des übergeordneten Elements in CSS zusammenbricht

Prozessanalyse der Bereitstellung von ASP.NET Core-Anwendungen auf dem Linux-System Docker

Nginx Reverse-Proxy-Konfiguration entfernt Präfix

Führen Sie die Schritte aus, um schnell ein Vue3.0-Projekt zu erstellen

Eine Kurzanleitung zu Docker

Artikel empfehlen

Beispiel für die Installation von Kong Gateway in Docker

Der Unterschied zwischen „where“ und „on“ in MySQL und wann sie verwendet werden

Details zum JavaScript-Abschluss

Lösung für „Keine Eingabedatei angegeben“ in nginx+php

7 native JS-Fehlertypen, die Sie kennen sollten

Anmeldung zur Token-Verifizierung im Vue-Projekt (Front-End-Teil)

Vue realisiert die Funktion zum Hochladen von Fotos auf den PC

Implementierungsschritte für die Docker-Bereitstellung von SpringBoot-Anwendungen

Analyse der Verwendung des Linux-Schwachstellen-Scan-Tools lynis

Analyse des Uniapp-Einsteiger-NVUE-Klettergrubenrekords

Detailliertes Tutorial zur Installation des Jenkins-Containers in einer Docker-Umgebung

vue-element-admin global laden warten

Detaillierte Erläuterung der Verwendung des Linux-Befehls seq

Eine kurze Erläuterung des Datums-/Uhrzeitformats beim Exportieren von Tabellendaten von MySQL nach Excel

Verwenden Sie die Befehle more, less und cat in Linux, um Dateiinhalte anzuzeigen