Einführung in die Bereitstellung des Selenium-Crawler-Programms unter Linux

Einführung in die Bereitstellung des Selenium-Crawler-Programms unter Linux

Vorwort

Ich muss das Selenium-Crawler-Programm für die Arbeit auf dem Linux-Server bereitstellen. Ich möchte dies mit Ihnen teilen. Wenn Sie interessiert sind, können Sie einen Blick darauf werfen.


1. Was ist Selen?

Selenium ist ein Tool zum Testen von Webanwendungen. Selenium-Tests werden direkt im Browser ausgeführt, genau wie bei echten Benutzern, und Crawler verwenden sie, um einige von js dynamisch geladene Daten zu crawlen

2. Nutzungsschritte

1. Bibliothek importieren

Der Code lautet wie folgt

von selenium.webdriver Chrome importieren
von selenium.webdriver.chrome.service importiere Service
from selenium.webdriver.chrome.options import Options # Verwenden Sie einen Headless-Browser from selenium.webdriver import ChromeOptions
chrome_options = Optionen()
Optionen = ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation']) # => Entfernen Sie den Browser, der von der automatisierten Testsoftware gesteuert wird options.add_experimental_option('useAutomationExtension', False)
chrome_options.add_argument("--headless") # => Headless-Modus für Chrome konfigurieren chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--disable-dev-shm-usage')

2. Testcode

Der Code lautet wie folgt:

s = Dienst(r"/home/Treiber/Chromedriver")
Treiber = Chrome(
     Dienst=s, Optionen=Chrome_Optionen
 )
 Treiber.get("https://www.baidu.com")
 drucken(diiver.title)

3. Bereitstellungsverfahren

1. Installieren Sie Chrome

Der Befehl lautet wie folgt:

yum installiere https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm
Überprüfen Sie die Version von Chrome: google-chrome --version

2. Chromedriver installieren

Der Befehl lautet wie folgt:

Laden Sie die Chromedriver-Treiberadresse entsprechend der entsprechenden Chrome-Version herunter: https://npm.taobao.org/mirrors/chromedriver
Meine Versionsnummer ist: 96.0.4664.45
wget https://npm.taobao.org/mirrors/chromedriver/96.0.4664.45/chromedriver_linux64.zip 
yum install -y entpacken zip
unzip chromedriver_linux64.zip # Entpacken Sie die Zip-Datei mkdir driver #Erstellen Sie einen neuen Ordner zum Speichern des Treibers chmod 777 driver/chromedriver # Dies ist die Berechtigung. Ich gebe ihr hier 777

3. Führen Sie den Testcode aus

Erstellen Sie eine neue test.py-Datei

vi test.py 

Bildbeschreibung hier einfügen

Speichern Sie test.py und führen Sie es aus.

Bildbeschreibung hier einfügen

Vor diesem Hintergrund ist meine Anfrage erfolgreich.

Zusammenfassen

Dies ist das Ende dieses Artikels über die Bereitstellung des Selenium-Crawler-Programms unter Linux. Weitere relevante Inhalte zum Linux-Selenium-Crawler-Programm finden Sie in früheren Artikeln von 123WORDPRESS.COM oder in den verwandten Artikeln weiter unten. Ich hoffe, Sie werden 123WORDPRESS.COM auch in Zukunft unterstützen!

Das könnte Sie auch interessieren:
  • Konfigurieren Sie eine Selenium-Umgebung basierend auf Linux und implementieren Sie den Betrieb

<<:  Der Unterschied zwischen Animation und Übergang

>>:  Grundlegende MySQL-Grundlagen: Gruppierungsfunktion, Aggregatfunktion, Gruppierungsabfrage – ausführliche Erklärung

Artikel empfehlen

MySQL-Transaktionskontrollfluss und ACID-Eigenschaften

Inhaltsverzeichnis 1. ACID-Eigenschaften Syntax d...

HTML-Sprachenzyklopädie

123WORDPRESS.COM--HTML超文本标记语言速查手册<!-- --> !D...

Ubuntu öffnet Port 22

Szenario Sie müssen das Xshell-Tool verwenden, um...

Detaillierte Erklärung der Destrukturierungszuweisung in JavaScript

Inhaltsverzeichnis Konzept Array-Destrukturierung...

Gegenfall für die Vue-Implementierung

In diesem Artikelbeispiel wird der spezifische Co...

Analyse des Docker-Compose-Image-Release-Prozesses des Springboot-Projekts

Einführung Das Docker-Compose-Projekt ist ein off...

Analysieren von AB-Leistungstestergebnissen unter Apache

Ich habe immer Loadrunner für Leistungstests verw...

Detaillierte Anwendung des dynamischen Vue-Formulars

Überblick Es gibt viele Formularanforderungen im ...

MySQL-Lösung für die Konfiguration mehrerer Instanzen

1.1 Was ist MySQL Multi-Instance? Einfach ausgedr...

Tutorial zur Änderung des Root-Passworts in MySQL 5.6

1. Nach der Installation von MySQL 5.6 kann es ni...