Lösen Sie das Problem, dass IN-Unterabfragen in MySQL dazu führen, dass der Index unbrauchbar wird

Heute habe ich eine Fallstudie zur MySQL IN-Unterabfrageoptimierung gesehen.

Ich war zunächst etwas skeptisch (das wäre in SQL Server unmöglich, aber ich werde später einen einfachen Test durchführen).

Dann habe ich eine Tabelle erstellt, um sie entsprechend seinen Angaben zu testen und zu überprüfen, und festgestellt, dass die IN-Unterabfrage von MySQL nicht gut ausgeführt wurde, was tatsächlich dazu führen würde, dass der Index nicht verwendet werden konnte (die IN-Unterabfrage konnte nicht verwendet werden, daher war das Szenario MySQL und die Endversion war 5.7.18).

MySQL-Testumgebung

Die Testtabelle sieht wie folgt aus

Tabelle test_table2 erstellen
(
  id int auto_increment Primärschlüssel,
  pay_id int,
  Zahlungszeitpunkt Datum/Uhrzeit,
  andere_Spalte varchar(100)
)

Erstellen Sie eine gespeicherte Prozedur zum Einfügen von Testdaten. Das Merkmal der Testdaten ist, dass pay_id wiederholbar ist. Hier wird in der gespeicherten Prozedur während der Schleifeneinfügung von 3 Millionen Datenelementen alle 100 Datenelemente eine wiederholte pay_id eingefügt. Das Zeitfeld ist innerhalb eines bestimmten Bereichs zufällig.

DEFINER ERSTELLEN=`root`@`%` VERFAHREN `test_insert`(IN `loopcount` INT)
  SPRACHE SQL
  NICHT DETERMINISTISCH
  ENTHÄLT SQL
  SQL-SICHERHEITSDEFINIERER
  KOMMENTAR ''
BEGINNEN
  Deklariere cnt int;
  setze cnt = 0;
  während cnt< Schleifenanzahl do
    in test_table2 einfügen (pay_id,pay_time,other_col) Werte (cnt,date_add(now(), interval floor(300*rand()) day),uuid());
    wenn (cnt mod 100 = 0) dann
      in test_table2 einfügen (pay_id,pay_time,other_col) Werte (cnt,date_add(now(), interval floor(300*rand()) day),uuid());
    Ende wenn;
    setze cnt = cnt + 1;  
  Ende während;
ENDE

Führen Sie den Aufruf test_insert(3000000) aus und fügen Sie 303000 Datenzeilen ein.

Zwei Möglichkeiten zum Schreiben von Unterabfragen

Die Abfrage bedeutet im Wesentlichen, die Daten mit einer Geschäfts-ID größer als 1 innerhalb eines bestimmten Zeitraums abzufragen. Es gibt daher zwei Schreibweisen.

Die erste Schreibweise ist wie folgt: Die IN-Unterabfrage enthält die Geschäfts-ID, deren Geschäftsstatistiken innerhalb eines bestimmten Zeitraums größer als 1 sind. Die äußere Schicht fragt entsprechend dem Ergebnis der IN-Unterabfrage ab. Die Spalte pay_id der Geschäfts-ID hat einen Index und die Logik ist relativ einfach. Diese Schreibweise ist tatsächlich ineffizient, wenn die Datenmenge groß ist und kein Index benötigt wird.

wähle * aus test_table2, erzwinge Index(idx_pay_id)
wobei pay_id in (
  Wählen Sie Pay_ID aus Test_Tabelle2 
  wobei pay_time>="01.06.2016 00:00:00" 
    UND pay_time<="2017-07-03 12:59:59" 
  Gruppieren nach Pay_ID 
  mit count(pay_id) > 1
);

Ausführungsergebnis: 2,23 Sekunden

Die zweite Schreibweise ist die Verknüpfung mit der Unterabfrage. Diese Schreibweise entspricht der obigen IN-Unterabfrage. Der folgende Test ergab, dass die Effizienz tatsächlich erheblich verbessert wurde.

wähle tpp1.* aus test_table2 tpp1, 
(
   Wählen Sie die Zahlungs-ID aus 
   von test_table2 
   WO pay_time>="2016-07-01 00:00:00" 
   UND pay_time<="2017-07-03 12:59:59" 
   Gruppieren nach Pay_ID 
   mit count(pay_id) > 1
) tpp2 
wobei tpp1.pay_id=tpp2.pay_id

Ausführungsergebnis: 0,48 Sekunden

Im Ausführungsplan der Unterabfrage wird festgestellt, dass es sich bei der äußeren Abfrage um einen vollständigen Tabellenscan handelt und der Index auf pay_id nicht verwendet wird.

Im Ausführungsplan des Join-Self-Checks verwendet die äußere Schicht (Abfrage des tpp1-Alias) den Index auf pay_id.

Später wollte ich für die erste Abfragemethode einen erzwungenen Index verwenden. Obwohl kein Fehler auftrat, stellte ich fest, dass es nutzlos war.

Wenn die Unterabfrage ein direkter Wert ist, kann der Index normal verwendet werden.

Es ist ersichtlich, dass die MySQL-Unterstützung für IN-Unterabfragen wirklich nicht sehr gut ist.

Außerdem: Wenn wir einen Fall hinzufügen, in dem eine temporäre Tabelle verwendet wird, ist dies zwar effizienter als viele Join-Abfragen, aber auch effizienter als die direkte Verwendung der IN-Unterabfrage. In diesem Fall kann auch der Index verwendet werden, aber in diesem einfachen Fall ist die Verwendung einer temporären Tabelle nicht erforderlich.

Nachfolgend sehen Sie einen ähnlichen Testfall in SQL Server 2014. Die Struktur und Anzahl der Testtabellen sind genau gleich. Es ist ersichtlich, dass in diesem Fall die beiden Schreibmethoden in SQL Server als genau gleich angesehen werden können (Ausführungsplan + Effizienz). In dieser Hinsicht ist SQL Server viel besser als MySQL.

Unten finden Sie das Testumgebungsskript im SQLServer.

Tabelle test_table2 erstellen
(
  id int identity(1,1) Primärschlüssel,
  pay_id int,
  Zahlungszeitpunkt Datum/Uhrzeit,
  andere_Spalte varchar(100)
)
beginne mit der Übertragung
deklarieren Sie @i int = 0
während @i<300000
beginnen
  in test_table2 Werte einfügen (@i,getdate()-rand()*300,newid());
  wenn(@i%1000=0)
  beginnen
    in test_table2 Werte einfügen (@i,getdate()-rand()*300,newid());
  Ende
  setze @i = @i + 1
Ende
BEGEHEN
GEHEN
Erstellen Sie den Index idx_pay_id auf test_table2(pay_id);
Erstellen Sie den Index idx_time auf test_table2(pay_time);
GEHEN
Wählen Sie * aus Testtabelle2 
wobei pay_id in (
          Wählen Sie Pay_ID aus Test_Tabelle2 
          wobei pay_time>='2017-01-21 00:00:00' 
          UND pay_time<='2017-07-03 12:59:59' 
          Gruppieren nach Pay_ID 
          mit count(pay_id) > 1
        );
wähle tpp1.* aus test_table2 tpp1, 
(
   Wählen Sie die Zahlungs-ID aus. 
   von test_table2 
   WO Zahlzeit>='2017-01-21 00:00:00'
   UND pay_time<='2017-07-30 12:59:59' 
   Gruppieren nach Pay_ID mit 
   Anzahl(Zahlungs-ID) > 1
) tpp2 
wobei tpp1.pay_id=tpp2.pay_id

Zusammenfassung: In MySQL-Daten sollten IN-Unterabfragen ab Version 5.7.18 immer noch mit Vorsicht verwendet werden

Das könnte Sie auch interessieren:

Unterabfragebeispiele in MySQL
Detaillierte Beschreibung der Unterabfrageoperationen in MySQL
Detaillierte Erläuterung von MySQL-Unterabfragen (verschachtelte Abfragen), Verknüpfungstabellen und kombinierten Abfragen
Beispiele für Optimierungstechniken zur Verbesserung der Effizienz langsamer Abfragen in MySQL IN-Anweisungen
MySQL-Optimierung: Join statt Unterabfrage verwenden
Mysql-Unterabfrage IN mit LIMIT-Anwendungsbeispiel
Beispielanalyse zur Optimierung von MySQL-Unterabfragen und verschachtelten Abfragen
MySQL implementiert Multi-Table-Assoziationsstatistiken (Unterabfragestatistiken) Beispiel
MySQL-Hinweise: Einführung in die Verwendung von Unterabfragen
Lösung für das Problem, dass „order by“ in MySQL-Unterabfragen nicht wirksam ist

<<: WeChat-Applet + MQTT, ESP8266-Implementierungsmethode zum Ablesen von Temperatur und Luftfeuchtigkeit

>>: Detaillierte Schritte zur Yum-Konfiguration des Nginx-Reverse-Proxys

Implementierung interaktiver Daten zwischen QT und Javascript

Artikel empfehlen

Node.js fügt den aktuellen Kampfdatensatz der MySQL-Datenbank hinzu, löscht ihn, ändert ihn und überprüft ihn

Inhaltsverzeichnis Drei Schritte zum Betrieb der ...

Verwenden Sie Meta, um den Traffic-Cache zu löschen und die Seite bei jedem Besuch zu aktualisieren, um das Debuggen zu vereinfachen

Code kopieren Der Code lautet wie folgt: <!-- ...

Verwenden einer Falle zum Durchführen einer Umgebungsbereinigung vor dem ordnungsgemäßen Herunterfahren des Docker-Containers

Wie können wir beim Beenden eines laufenden Conta...

Lösen Sie das Problem, dass IN-Unterabfragen in MySQL dazu führen, dass der Index unbrauchbar wird

Implementierung interaktiver Daten zwischen QT und Javascript

MySQL-Trigger: ausführliche Erklärung und einfaches Beispiel

Grafisches Tutorial zur Installation einer virtuellen VMware-Maschine unter Linux

Docker-Einstellung für den Windows-Speicherpfadvorgang

Teilen Sie die von Webdesign-Meistern häufig verwendeten responsiven Frameworks (Zusammenfassung)

Webdesign-Tutorial (2): Über Nachahmung und Plagiat

Analyse der vernachlässigten DOCTYPE-Beschreibung

Spezifische Verwendung von MySQL-Fensterfunktionen

Analyse der Verwendung von Schleifenanweisungen (WHILE, REPEAT und LOOP) in gespeicherten MySQL-Prozeduren

Detaillierte Schritte zur Installation des CentOS7-Systems auf einer virtuellen VMWare-Maschine

Artikel empfehlen

Node.js fügt den aktuellen Kampfdatensatz der MySQL-Datenbank hinzu, löscht ihn, ändert ihn und überprüft ihn

Verwenden Sie Meta, um den Traffic-Cache zu löschen und die Seite bei jedem Besuch zu aktualisieren, um das Debuggen zu vereinfachen

Detaillierte Erklärung der Rolle des Schlüssels in React

Detaillierte Erklärung der Lösung zum Vergessen des Passworts in MySQL 5.7

Implementierung mehrerer Tomcat-Instanzen auf einer einzigen Maschine

Ein auf Vue-cli basierender Codesatz unterstützt mehrere Projekte

Virtuelle Maschinen zwischen VMware Workstation und vSphere migrieren (Bild und Text)

Verwenden einer Falle zum Durchführen einer Umgebungsbereinigung vor dem ordnungsgemäßen Herunterfahren des Docker-Containers

Detaillierte Erklärung der nmcli-Verwendung in CentOS8

Zehn Erfahrungen bei der Präsentation chinesischer Webinhalte

Beheben Sie den 1251-Fehler beim Herstellen einer Verbindung zwischen MySQL und Navicat

Legen Sie in der HTML-Tabelle für jede Zelle unterschiedliche Farben und Breiten fest

Das Problem, dass beim Verbinden mit der MySQL-Datenbank in Idea chinesische Zeichen verstümmelt erscheinen

Detaillierte Erläuterung des Lese-Commits der MySQL-Transaktionsisolationsebene

Beschreiben Sie kurz die vier Transaktionsisolationsebenen von MySql