MySQL nutzt geschickt Summe, Groß- und Kleinschreibung und Wann, um statistische Abfragen zu optimieren

Ich habe kürzlich in der Firma an einem Projekt gearbeitet, bei dem es um die Entwicklung statistischer Berichte ging. Aufgrund der relativ großen Datenmenge benötigte die Abfrageanweisung, die ich zuvor geschrieben hatte, etwa zehn Sekunden, um 500.000 Daten abzufragen. Später habe ich unter Anleitung meines Chefs die SQL-Anweisungen „sum, case...when...“ verwendet, um sie neu zu schreiben, und die Leistung wurde sofort auf eine Sekunde verbessert. Um das Problem und die Lösung klar und prägnant zu erklären, werde ich hier das Nachfragemodell vereinfachen.

In der Datenbank liegt nun eine Auftragstabelle (eine vereinfachte Zwischentabelle) mit folgendem Aufbau vor:

CREATE TABLE `statistic_order` (
 `oid` bigint(20) NICHT NULL,
 `o_source` varchar(25) DEFAULT NULL COMMENT 'Quellennummer',
 `o_actno` varchar(30) DEFAULT NULL COMMENT 'Aktivitätsnummer',
 `o_actname` varchar(100) DEFAULT NULL COMMENT 'Name der Teilnahmeaktivität',
 `o_n_channel` int(2) DEFAULT NULL COMMENT 'Einkaufszentrum',
 `o_clue` varchar(25) DEFAULT NULL COMMENT 'Hinweiskategorie',
 `o_star_level` varchar(25) DEFAULT NULL COMMENT 'Sternebewertung der Bestellung',
 `o_saledep` varchar(30) DEFAULT NULL COMMENT 'Marketingabteilung',
 `o_style` varchar(30) DEFAULT NULL COMMENT 'Autotyp',
 `o_status` int(2) DEFAULT NULL COMMENT 'Bestellstatus',
 `syctime_day` varchar(15) DEFAULT NULL COMMENT 'Datum nach Tag formatieren',
 PRIMÄRSCHLÜSSEL (`oid`)
) ENGINE=InnoDB STANDARD-CHARSET=utf8

Die Projektanforderungen lauten wie folgt:

Zählen Sie die Anzahl der Quellnummern für jeden Tag innerhalb eines bestimmten Zeitraums. Die Quellnummer entspricht dem Feld o_source in der Datentabelle und der Feldwert kann CDE, SDE, PDE, CSE, SSE sein.

Quellenklassifizierungsflüsse im Laufe der Zeit

Zu Beginn habe ich dieses SQL geschrieben:

wählen Sie S.syctime_day,
 (wählen Sie count(*) aus statistic_order SS, wobei SS.syctime_day = S.syctime_day und SS.o_source = 'CDE') als 'CDE',
 (wählen Sie count(*) aus statistic_order SS, wobei SS.syctime_day = S.syctime_day und SS.o_source = 'CDE') als 'SDE',
 (wählen Sie count(*) aus statistic_order SS, wobei SS.syctime_day = S.syctime_day und SS.o_source = 'CDE') als 'PDE',
 (wählen Sie count(*) aus statistic_order SS, wobei SS.syctime_day = S.syctime_day und SS.o_source = 'CDE') als 'CSE',
 (Wählen Sie count(*) aus statistic_order SS, wobei SS.syctime_day = S.syctime_day und SS.o_source = 'CDE') als 'SSE'
 aus Statistikreihenfolge S, wobei S.syctime_day > '2016-05-01' und S.syctime_day < '2016-08-01' 
 GROUP BY S.syctime_day, sortiert nach S.syctime_day aufsteigend;

Diese Schreibmethode verwendet eine Unterabfrage. Ohne einen Index hinzuzufügen, wurde diese SQL-Anweisung auf 550.000 Daten ausgeführt. Es dauerte fast zehn Minuten, in der Workbench zu warten, und schließlich wurde eine Verbindungsunterbrechung gemeldet. Durch den Erläuterungsinterpreter können Sie sehen, dass der SQL-Ausführungsplan wie folgt aussieht:

Jede Abfrage führt einen vollständigen Tabellenscan durch. Die fünf Unterabfragen DEPENDENT SUBQUERY zeigen an, dass sie von externen Abfragen abhängen. Dieser Abfragemechanismus führt zuerst eine externe Abfrage aus, um die Datumsergebnisse nach Gruppieren zu erhalten, und dann fragen die Unterabfragen die Anzahl der CDEs, SDEs usw. in den entsprechenden Daten ab. Seine Effizienz ist vorstellbar.

Nach dem Hinzufügen von Indizes zu o_source und syctime_day wird die Effizienz erheblich verbessert und die Abfrageergebnisse werden in etwa fünf Sekunden erhalten:

Wenn wir uns den Ausführungsplan ansehen, stellen wir fest, dass die Anzahl der gescannten Zeilen stark reduziert wurde und der vollständige Tabellenscan nicht mehr durchgeführt wird:

Das ist sicherlich nicht schnell genug. Wenn die Datenmenge in die Millionen geht, ist die Abfragegeschwindigkeit definitiv nicht mehr zu tolerieren. Ich habe mich gefragt, ob es eine Möglichkeit gibt, alle Ergebnisse durch einmaliges Durchlaufen direkt abzufragen, ähnlich dem Durchlaufen der Listensammlung in Java, bei dem beim Auftreten einer bestimmten Bedingung einmal gezählt wird, sodass ein vollständiger Tabellenscan durchgeführt werden kann, um den Ergebnissatz und den Ergebnisindex abzufragen. Die Effizienz sollte sehr hoch sein. Unter Anleitung des Chefs haben wir die Summenaggregationsfunktion und die „seltsame“ Verwendung von Fall… wenn… dann… verwendet, um dieses Problem effektiv zu lösen.
Das spezifische SQL lautet wie folgt:

 wählen Sie S.syctime_day,
 Summe (Fall wenn S.o_source = 'CDE', dann 1, sonst 0, Ende) als 'CDE',
 Summe (Fall wenn S.o_source = 'SDE', dann 1, sonst 0, Ende) als 'SDE',
 Summe (Fall wenn S.o_source = 'PDE', dann 1, sonst 0, Ende) als 'PDE',
 Summe (Fall wenn S.o_source = 'CSE', dann 1, sonst 0, Ende) als 'CSE',
 Summe (Fall wenn S.o_source = 'SSE', dann 1, sonst 0, Ende) als 'SSE'
 aus Statistikreihenfolge S, wobei S.syctime_day > '2015-05-01' und S.syctime_day < '2016-08-01' 
 GROUP BY S.syctime_day, sortiert nach S.syctime_day aufsteigend;

Ich werde nicht zu viel über die Verwendung von case...when...then in MySQL erklären. Dieses SQL ist leicht zu verstehen. Zuerst durchlaufen wir die Datensätze einzeln, group by klassifiziert die Daten und die Aggregatfunktion sum summiert die Werte eines bestimmten Datums. Der entscheidende Punkt ist, dass case...when...then der Summe geschickt Bedingungen hinzufügt. Wenn o_source = 'CDE', ist die Anzahl 1, andernfalls 0; wenn o_source = 'SDE'...

Die Ausführung dieser Anweisung dauerte nur etwas mehr als eine Sekunde, was ideal ist, um Statistiken dieser Dimension mit mehr als 500.000 Datenpunkten durchzuführen.

Der Ausführungsplan zeigt, dass zwar die Anzahl der gescannten Zeilen zugenommen hat, aber nur ein vollständiger Tabellenscan durchgeführt wird und es sich um eine EINFACHE Abfrage handelt, sodass die Ausführungseffizienz natürlich hoch ist:

Wenn Sie eine bessere Lösung oder Idee für dieses Problem haben, hinterlassen Sie bitte eine Nachricht.

Zusammenfassen

Dies ist das Ende dieses Artikels über die Verwendung von „sum“, „case“ und „when“ in MySQL zur Optimierung statistischer Abfragen. Weitere Informationen zur Optimierung statistischer Abfragen in MySQL finden Sie in früheren Artikeln auf 123WORDPRESS.COM oder in den folgenden verwandten Artikeln. Ich hoffe, Sie werden 123WORDPRESS.COM auch in Zukunft unterstützen!

Das könnte Sie auch interessieren:

Beispiel für die Verwendung von Urteilsaussagen (IF ELSE/CASE WHEN) in SQL Server
Lösen Sie das Problem des Mybatis-Falls, wenn ein Fehler auftritt
Oracle verwendet die Dekodierungsfunktion oder CASE-WHEN, um benutzerdefinierte Sortierung zu implementieren
MySQL-Fall bei der Verwendungsbeispielanalyse
Dieser Artikel zeigt Ihnen detailliert, wie Sie SQL CASE WHEN verwenden

<<: Erste Schritte mit CSS3-Animation in 10 Minuten

>>: HTML-Tags dl, dt, dd zum Erstellen einer Tabelle vs. Tabellenerstellungstabelle

So implementieren Sie https mit Nginx und OpenSSL

Perfekte Lösung für das Problem, dass Daten abgeschnitten werden, wenn die Funktion „group concat“ in Mysql5.7 verwendet wird

Artikel

Reagiert auf verschiedene Arten, Parameter zu übergeben

Artikel

Natives JS zur Implementierung des Spiels 2048

Artikel

MySQL nutzt geschickt Summe, Groß- und Kleinschreibung und Wann, um statistische Abfragen zu optimieren

So implementieren Sie https mit Nginx und OpenSSL

CSS implementiert die Bottom-Tapbar-Funktion

Tutorial zur Änderung des Root-Passworts in MySQL 5.6

Zusammenfassung der zugehörigen Funktionen für JSON-Ergebnisse von MySQL-Abfragen

Tipps zum Importieren von CSV-, Excel- oder SQL-Dateien in MySQL

Mehrere CSS3-Tag-Abkürzungen (empfohlen)

So lösen Sie das Problem des verstümmelten DOS-Fensters in MySQL

Perfekte Lösung für das Problem, dass Daten abgeschnitten werden, wenn die Funktion „group concat“ in Mysql5.7 verwendet wird

Reagiert auf verschiedene Arten, Parameter zu übergeben

Natives JS zur Implementierung des Spiels 2048

Artikel empfehlen

jQuery implementiert den Tabellen-Paging-Effekt

Grafisches Tutorial zur Konfigurationsmethode für die kostenlose Installationsversion von MySQL 8.0.21

Detaillierte Erklärung der Funktionen IFNULL() und COALESCE() zum Ersetzen von Null in MySQL

So löschen Sie schnell alle Tabellen in MySQL, ohne die Datenbank zu löschen

Tipps zum Mischen von OR und AND in SQL-Anweisungen

Ein netter HTML-Druckcode unterstützt das Umblättern

So isolieren Sie Benutzer in Docker-Containern

Grundlegende Syntax und Funktionsweise der MySQL-Datenbank

Überblick und Einführung in das Linux-Betriebssystem

Designtheorie: Menschenorientiertes Green Design

Lösungen für MySql-Abstürze und Dienststartfehler

Detaillierte Erklärung zur Verwendung von Vue Smooth DnD, einer verschiebbaren Komponente von Vue

So stellen Sie mit VScode in einer Windows-Umgebung eine Verbindung zur virtuellen MySQL-Maschine her

So installieren Sie Oracle Java 14 auf Ubuntu Linux

Lösung für das Problem, dass die MySQL-Konfigurationsdatei nicht geändert werden kann (Win10)