MySQL-Deduplizierungsmethoden

MySQL-Deduplizierungsmethoden

【Anfänger】 Es gibt sehr wenige wiederholte Zeilen

Verwenden Sie distinct, um sie herauszufinden, und löschen Sie sie dann manuell einzeln.

[Mittelstufe] Duplikate basierend auf einem einzelnen Feld entfernen

Beispiel: Duplikate aus dem ID-Feld entfernen

Verwendung: Rufen Sie den Wert des wiederholten ID-Felds ab, vergleichen Sie die Felder mit unterschiedlichen Daten in den Zeilen mit demselben ID-Feld und löschen Sie alle wiederholten Zeilen außer der Zeile mit dem kleinsten (oder größten) Feld. Im Allgemeinen wird der Primärschlüssel zum Vergleich verwendet, da der Wert des Primärschlüssels eindeutig und absolut unterschiedlich sein muss.

ID-Name

1 ein

1 b

2 c

2 ein

3 c

Ergebnis:

ID-Name

1 ein 

2 ein

arbeiten:

aus a_tmp löschen 

wobei id in (select * from (select b.id from a_tmp b group by b.id having count(b.id) >1) bb) 

und Name nicht in (select * from (select min(a.name) from a_tmp a GROUP BY a.id having count(a.id) >1) aa);

Beachten:

Die fettgedruckten und grünen Wörter oben müssen mit einem Alias versehen sein und das Format „select * from (……)“ verwenden, andernfalls wird ein Fehler gemeldet:

[Err] 1093 - Sie können die Zieltabelle „a_tmp“ für die Aktualisierung nicht in der FROM-Klausel angeben

[Erweitert] Entfernen Sie Duplikate durch Wiederholung mehrerer Felder

Beispielsweise um Duplikate mit derselben ID und demselben Namen zu entfernen, d. h. um dieselbe ID und denselben Namen als doppelte Zeilen zu zählen und um dieselbe ID, aber unterschiedliche Namen als nicht doppelte Zeilen zu zählen

Verwendung: Ähnlich wie bei einem einzelnen Feld wird der Primärschlüssel im Allgemeinen zum Vergleich verwendet, da der Wert des Primärschlüssels eindeutig sein muss.

ID Name Zeilen-ID

1a1

1 bis 2

1 b 3

2 b 4

2 b 5

3 c 6

3d7

Ergebnis:

ID Name Zeilen-ID

1a1 

1 b 3

2 b 4

3 c 6

3d7

arbeiten:

Der Erste:

aus a_tmp löschen 

wobei (id,name) in (select * from (select b.id,b.name from a_tmp b group by b.id,b.name having count(b.id) >1) bb) 

und rowid nicht in (select * from (select min(a.rowid) from a_tmp eine Gruppe nach a.id,a.name mit count(a.id) >1) aa);

Zweiter Typ:

Verbinden Sie die Werte der ID- und Namensfelder und fügen Sie sie in die temporäre Tabelle b_tmp ein. Anschließend können Sie die [Mittelstufe] Methode zur Beurteilung und Löschung einzelner Felder verwenden.

#Fügen Sie den Wert der beiden verbundenen Felder und das Feld mit dem eindeutigen Wert in der Tabelle a_tmp in die Tabelle b_tmp ein

in b_tmp einfügen 

 wähle concat(id,name),rowid aus a_tmp;

#Finden Sie die Zeilen, die beibehalten werden müssen select id_name,max(rowid)

 von b_tmp 

 Gruppieren nach ID_Name

 mit Anzahl(ID_Name)>1;

#Verwenden Sie die Methode [Zwischenstufe] oder die gespeicherte Prozedur, um die Deduplizierungsarbeit abzuschließen

[Ultimate] Jede Zeile hat zwei Kopien der gleichen Daten

Zum Beispiel:

Verwendung: Wenn die Daten in der gesamten Zeile identisch sind, können sie nicht mit SQL-Anweisungen gelöscht werden, da es keine bedingte Einschränkung gibt, mit der eine Zeile behalten und alle identischen Zeilen gelöscht werden können. Es gibt keine unterschiedlichen Felder, die Sie selbst erstellen können, d. h.: Fügen Sie ein Feld hinzu, stellen Sie es auf Auto-Inkrement ein und legen Sie es als Primärschlüssel fest. Dann werden automatisch Werte hinzugefügt.

ID-Name

1 ein

1 ein

1 b

1 b

2 c

2 c

3 c

3 c

Ergebnis:

ID Name Zeilen-ID

1a1

1 b 3

2 c 5

3 c 7

arbeiten:

Fügen Sie ein Auto-Inkrement-Feld hinzu und legen Sie es vorübergehend als Primärschlüssel fest.

Verwenden Sie die oben beschriebenen Methoden [Mittelschwer] und [Fortgeschritten].

Vielen Dank fürs Lesen, ich hoffe, es kann Ihnen helfen, danke für Ihre Unterstützung dieser Site!

Das könnte Sie auch interessieren:

MySQL-Entwicklungskenntnisse: JOIN-Update und Datenduplikationsprüfung/Deduplizierung
Implementierungsanweisungen zur Duplikatsprüfung und Deduplizierung von MySQL-Daten
Eine SQL-Anweisung schließt die MySQL-Deduplizierung ab und behält eine
Eine kurze Diskussion zur Deduplizierung in SQL-Datenbanken
Ein kleines Beispiel für SQL-Gruppierung und -Sortierung zum Entfernen von Duplikaten
Detaillierte Erklärung zweier Methoden zur Deduplizierung in MySQL und Beispielcode
Eine praktische Anleitung zum Prüfen und Entfernen doppelter SQL-Befehle

<<: CentOS7-Bereitstellung Flask (Apache, mod_wsgi, Python36, venv)

>>: Detaillierte Erläuterung der Anwendungsbereitstellungspraxis für Docker + Jenkins + Gitlab + Django

Schritte zum Aktivieren des MySQL-Datenbanküberwachungs-Binlogs

MySQL-Deduplizierungsmethoden

Schritte zum Aktivieren des MySQL-Datenbanküberwachungs-Binlogs

Lösung für die lange Verzögerung der MySQL-Datenbank-Master-Slave-Replikation

Grafisches Tutorial zur Installation und Konfiguration von MySQL 5.7.24

VMWare15 installiert Mac OS-System (grafisches Tutorial)

Lernen Sie die MySQL-Zeichensatzeinstellungen in 5 Minuten kennen

Beispiel für die Implementierung der Hochverfügbarkeit von Keepalived+Nginx

MySQL 5.6 Installationsschritte mit Bildern und Text

Detaillierte Erklärung des Unterschieds zwischen MySQL null und nicht null und null und leerem Wert ''''

Die umfassendste Sammlung von Front-End-Interviewfragen

Detaillierte Anweisungen zum Download und Installationsprozess von MySQL 5.7.18

Artikel empfehlen

Perfekte Lösung für das Problem, unter Windows 10 nicht auf den Port des Docker-Containers zugreifen zu können

MySQL Series 11-Protokollierung

Detaillierte Erläuterung der Clientkonfiguration für die Entwicklung von vue3 + electron12 + dll

Linux weist eine Sicherheitslücke bei der Rechteausweitung bei Sudo auf, jeder Benutzer kann auch Root-Befehle ausführen

Ausführliche Erläuterung der Stilfunktion in Vue3-Einzeldateikomponenten

Beispielcode für HTML-Layered-Box-Shadow-Effekt

Der grundlegendste Code für Webseiten

Zusammenfassung der Probleme bei der Speicherplatzfreigabe unter Linux

6 praktische Tipps für die TypeScript-Entwicklung

Installation von Docker CE auf Ubuntu

6 Tipps für Webdesign

Analyse und Lösung der Gründe, warum HTML-externe Referenz-CSS-Dateien nicht effektiv sind

Einführung in gängige XHTML-Tags

CSS realisiert den Maskeneffekt, wenn die Maus über das Bild bewegt wird

So installieren Sie RabbitMQ schnell in Docker