MySQL Deep Paging (wie man schnell Millionen von Daten paginiert)

Inhaltsverzeichnis

Vorwort
Fall
Optimierung
Zusammenfassung

Vorwort

Um bei der Backend-Entwicklung zu verhindern, dass zu viele Daten gleichzeitig geladen werden, was zu übermäßigem Speicher- und Festplatten-E/A-Overhead führt, ist häufig eine Paging-Anzeige erforderlich. Zu diesem Zeitpunkt wird das Schlüsselwort LIMIT von MySQL benötigt. Aber glauben Sie, dass mit LIMIT-Paging alles gut gehen wird? Es ist zu neu und zu einfach. Bei großen Datenmengen ist Deep Paging wahrscheinlich ein Problem, das LIMIT verursachen kann.

Fall

Hier nehme ich die Anzeige der E-Commerce-Bestelldetails als Beispiel und die neue Tabelle sieht wie folgt aus:

Tabelle „cps_user_order_detail“ erstellen (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT 'Primärschlüssel',
  `user_id` varchar(32) NOT NULL DEFAULT '' KOMMENTAR 'Benutzer-ID',
  `order_id` bigint(20) DEFAULT NULL COMMENT 'Bestell-ID',
  `sku_id` bigint(20) unsigned NOT NULL COMMENT 'Produkt-ID',
  `order_time` datetime DEFAULT NULL COMMENT 'Bestellzeit, Format jjjj-MM-tt HH:mm:ss',
   Primärschlüssel (`id`),
   SCHLÜSSEL `idx_time_user` (`order_time`,`user_id`) MIT BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin COMMENT='Benutzerbestelldetails';

Fügen Sie dann manuell 1,2 Millionen Datensätze in die Tabelle ein.
Jetzt gibt es eine Anforderung: Zeigen Sie die Bestelldetails des Benutzers seitenweise an, und zwar in umgekehrter Reihenfolge der Bestellzeit.
Die Tabellenstruktur ist schlank und die Anforderungen sind einfach. Also habe ich den Code schnell fertig geschrieben und zum Testen online gestellt. Anfangs lief alles normal, doch mit zunehmendem Auftragsvolumen wurde das System zunehmend langsamer und es wurden hin und wieder mehrere慢查詢gemeldet.
An diesem Punkt sollten Sie denken, dass es sich um ein LIMIT-Offset-Problem handelt. Ja, es liegt nicht daran, dass Ihr SQL nicht schön genug ist, sondern am Mechanismus von MySQL selbst.
Hier nehme ich einfach zwei SQL-Anweisungen als Beispiel, wie in der folgenden Abbildung gezeigt, die von dem Positionsoffset 100 bzw. 1 Million aus paginieren. Sie können sehen, dass der Zeitunterschied sehr groß ist. Darin ist die Zeit für andere Datenberechnungen und -verarbeitungen nicht enthalten. Eine einzelne SQL-Abfrage dauert mehr als eine Sekunde, was bei den den Benutzern zur Verfügung gestellten Funktionen nicht tolerierbar ist (im E-Commerce ist es oft erforderlich, dass die Reaktionszeit einer Schnittstelle 200 ms nicht überschreitet).

Hier sehen wir uns den Ausführungsplan an, wie unten dargestellt:

Hier stellen wir zunächst die möglichen Werte und Bedeutungen der Spalte Extra im Ausführungsplan vor:

Die Verwendung von „where:“ gibt an, dass der Optimierer Daten über den Index zurück zur Tabelle abfragen muss.
Index verwenden: Überdeckender Index bedeutet, dass der direkte Zugriff auf den Index ausreicht, um die gewünschten Daten zu erhalten, ohne über den Index wieder zur Tabelle zurückkehren zu müssen. Dies wird in der Regel dadurch erreicht, dass für die abzufragenden Felder ein gemeinsamer Index erstellt wird.
Verwenden der Indexbedingung: Eine neue Funktion, die nach Version 5.6 hinzugefügt wurde, der bekannte Index-Pushdown, ist eine wesentliche Optimierung von MySQL zur減少回表次數.
Verwenden von Filesort: Dateisortierung. Dies wird normalerweise während ORDER BY durchgeführt. Wenn die Datenmenge zu groß ist, ruft MySQL alle Daten zum Sortieren in den Speicher ab, was mehr Ressourcen verbraucht.

Wenn man das Bild oben betrachtet, sieht man, dass dieselbe Anweisung allein aufgrund der unterschiedlichen Offsets (erlauben Sie mir, ein wenig zu übertreiben) sehr unterschiedliche Ausführungspläne hat. In der ersten Anweisung, LIMIT 100,6 ist der Wert der Typspalte range , was auf einen Bereichsscan hinweist. Die Leistung ist eine Stufe niedriger als die ref , aber es wird auch berücksichtigt, dass der Index verwendet wird, und es wird auch Index-Pushdown angewendet: Das heißt, der Index wird zum Bestellzeitpunkt nach WHERE gelöscht und ausgewählt, und das nachfolgende ORDER BY wird ebenfalls basierend auf Index-Pushdown optimiert, das synchron ausgeführt wird, wenn die WHERE-Bedingung gefiltert wird (ohne zur Tabelle zurückzukehren).
Die zweite Anweisung LIMIT 1000000,6 verwendet den Index überhaupt nicht und der Wert der Typspalte ist ALL , was offensichtlich ein vollständiger Tabellenscan ist. In der Spalte „Extra“ gibt „Using where“ an, dass eine Tabellenrückgabe erfolgt, und „Using filesort“ gibt an, dass während ORDER BY eine Dateisortierung erfolgt. Die Langsamkeit hat hier also zwei Gründe: Erstens nimmt das Sortieren der Dateien zu viel Zeit in Anspruch, und zweitens muss nach dem Filtern der relevanten Daten entsprechend den Bedingungen basierend auf dem Offset zur Tabelle zurückgekehrt werden, um alle Werte zu erhalten. Unabhängig von dem oben genannten Punkt liegt die Ursache darin, dass der LIMIT-Offset zu groß ist. Daher besteht in der tatsächlichen Entwicklungsumgebung häufig die Anforderung, dass der nicht statistische Tabellenpegel eine Million nicht überschreiten darf.

Optimierung

Nachdem die Ursache analysiert wurde, wie können wir LIMIT Deep Paging in der tatsächlichen Entwicklung optimieren? Hier gebe ich Ihnen zwei Lösungen.
Eine Möglichkeit ist die Optimierung des Primärschlüsselindex . Was bedeutet das? Ändern Sie einfach die obige Anweisung wie folgt:

AUSWÄHLEN * VON cps_user_order_detail d WO d.id > #{maxId} UND d.order_time>'2020-8-5 00:00:00' BESTELLEN NACH d.order_time LIMIT 6;

Wie im obigen Code gezeigt, ist es auch paginiert, aber es gibt eine maxId-Einschränkung. Was bedeutet das? maxId ist die maximale Primärschlüssel-ID auf der vorherigen Seite. Daher lautet die Voraussetzung für die Verwendung dieser Methode: 1) Der Primärschlüssel muss automatisch inkrementiert werden und darf keine UUID sein. Zusätzlich zur Übergabe der grundlegenden Paging-Parameter pageNo und pageSize muss das Front-End auch die maximale ID jeder vorherigen Seite bereitstellen. 2) Diese Methode unterstützt keine zufälligen Seitensprünge, d. h. sie kann nur nach oben und unten blättern. Die folgende Abbildung zeigt eine tatsächliche Seite eines bekannten E-Commerce-Unternehmens.

Die zweite Möglichkeit besteht in der Suchmaschinenoptimierung durch Elastic Search (basierend auf invertiertem Index). Tatsächlich stellen E-Commerce-Unternehmen wie Taobao grundsätzlich alle ihre Produkte in die ES-Suchmaschine ein (es ist unmöglich, so große Datenmengen in MySQL einzugeben, und es ist nicht realistisch, sie in Redis einzugeben). Aber auch wenn Sie die Suchmaschine ES verwenden, können dennoch Deep-Paging-Probleme auftreten. Was sollten Sie dann tun? Die Antwort erfolgt über das Scrollen des Cursors. Wir werden hier nicht näher auf diesen Punkt eingehen, aber wer interessiert ist, kann selbst recherchieren.

Zusammenfassung

Ich habe diesen Blog geschrieben, weil ich es vor einiger Zeit während der Entwicklung tatsächlich erlebt habe und es während des Byte-Interviews mit dem Interviewer besprochen habe. Wenn Sie die Einschränkungen und Optimierungen von LIMIT kennen, ist das ein Plus, wenn Sie dies im Vorstellungsgespräch erwähnen können. Sagen Sie nicht, dass es bei der MySQL-Optimierung nur um das Erstellen von Indizes und Anpassen von SQL geht (tatsächlich sind die Auswirkungen dieser beiden Optimierungslösungen in der realen Entwicklung minimal). Wenn die MySQL-Optimierung so großartig wäre, gäbe es nicht so viele Middlewares.

Dies ist das Ende dieses Artikels über MySQL Deep Paging (wie man schnell Millionen von Daten paginiert). Weitere Informationen zu MySQL Deep Paging finden Sie in früheren Artikeln auf 123WORDPRESS.COM oder in den folgenden verwandten Artikeln. Ich hoffe, Sie werden 123WORDPRESS.COM auch in Zukunft unterstützen!

Das könnte Sie auch interessieren:

Praktischer Bericht zur Lösung des MySQL Deep Paging-Problems

<<: Verkürzen Sie die Seiten-Rendering-Zeit, damit die Seite schneller läuft

>>: Lernen Sie eine Minute am Tag, den Git-Server zu verwenden, um Debug-Zweige anzuzeigen und zu beheben

Implementierungsschritte zum Erstellen eines lokalen Webservers auf Centos8

Artikel empfehlen

Detailliertes Beispiel für die Statusverwaltung der Hilfsfunktion der Vue-Frontend-Entwicklung

Inhaltsverzeichnis Kartenstaat Kartengetter Karte...

So verwenden Sie fdisk zum Partitionieren der Festplatte in Linux

Häufig verwendete Befehle für Linux-Partitionen: ...

MySQL-Fehler: Beim Versuch, eine Sperre zu erhalten, wurde ein Deadlock festgestellt. Versuchen Sie, die Transaktionslösung neu zu starten.

Finden Sie das Problem Als ich kürzlich die vorhe...

So lösen Sie das Problem, dass absolut positionierte Elemente in IE6/7 auf mysteriöse Weise verschwinden oder blockiert werden

1. Wenn die Breite der angrenzenden schwebenden Eb...

MySQL Deep Paging (wie man schnell Millionen von Daten paginiert)

Inhaltsverzeichnis

Vorwort

Fall

Optimierung

Zusammenfassung

Implementierungsschritte zum Erstellen eines lokalen Webservers auf Centos8

Tutorial zur Installation und Konfiguration von MySQL 5.7

So installieren und implementieren Sie Zabbix 5.0 für Nginx

Konfigurationsmethode für die kostenlose Installationsversion von MySql 5.7.21 unter Win10

Detaillierte Erklärung zur Verwendung struktureller Pseudoklassenselektoren und Pseudoelementselektoren in CSS3

Docker löst das Problem, dass das Terminal kein Chinesisch eingeben kann

Detaillierte Erklärung der dynamischen Komponenten von vue.js

Eine kurze Diskussion über Makrotasks und Mikrotasks in js

Vollständige MySQL-Sicherung und schnelle Wiederherstellungsmethoden

Mehrere Möglichkeiten zum Löschen von Arrays in Vue (Zusammenfassung)

Artikel empfehlen

Detailliertes Beispiel für die Statusverwaltung der Hilfsfunktion der Vue-Frontend-Entwicklung

So verwenden Sie fdisk zum Partitionieren der Festplatte in Linux

MySQL-Fehler: Beim Versuch, eine Sperre zu erhalten, wurde ein Deadlock festgestellt. Versuchen Sie, die Transaktionslösung neu zu starten.

JS realisiert Spezialeffekte der Webseiten-Navigationsleiste

Detaillierter Prozess zum Erstellen von MongoDB und MySQL mit Docker-Compose

Implementierung der Nginx-Routing-Weiterleitung und der Reverse-Proxy-Standortkonfiguration

So lösen Sie das Problem, dass absolut positionierte Elemente in IE6/7 auf mysteriöse Weise verschwinden oder blockiert werden

So erstellen Sie eine automatisierte Bereitstellungsumgebung für Docker, Jenkins und Node.js von Grund auf

Richtige Methode zum Schreiben leerer Links, um Seitensprünge nach dem Klicken auf ein href #-Problem zu verhindern

Mobile Frontend-Anpassungslösung (Zusammenfassung)

Vue realisiert die Palastgitterrotationslotterie

So verwenden Sie eine Karte, um die domänenübergreifende Nutzung mehrerer Domänennamen in Nginx zu ermöglichen

Detaillierte Einführung in das CSS-Prioritätswissen

Welche Eigenschaften sollte eine gute Werbung haben?

Tutorial zur Installation von Odoo14 aus dem Quellcode unter Ubuntu 18.04