1. Datendeduplizierung Bei der täglichen Arbeit kann es zu Datenduplizierung kommen, wenn Sie Hive oder Impala zum Abfragen und Exportieren verwenden, Sie die Abfrage aber nicht erneut ausführen möchten (die Abfragezeit ist etwas lang und der exportierte Dateiinhalt ist groß). Daher denken Sie darüber nach, Linux-Befehle zu verwenden, um doppelte Daten aus dem Dateiinhalt zu entfernen. Nachfolgend sehen Sie ein Beispiel: Sie können sehen, dass aaa.txx 3 doppelte Daten hat Ich möchte die redundanten Daten entfernen und nur eine behalten sortiere aaa.txt | uniq > bbb.txt Entfernen Sie doppelte Daten aus der Datei aaa.txt und geben Sie sie in bbb.txt aus. Sie können sehen, dass in der Datei bbb.txt nur ein Datenelement gespeichert ist 2. Datenschnittmenge, -vereinigung und -differenz 1) Schnittmenge (entspricht user_2019 inner join user_2020 on user_2019.user_no=user_2020.user_no) 2) Union (entspricht user_2019.user_no union user_2020.user_no) 3) Unterschied
Das Obige ist der vollständige Inhalt dieses Artikels. Ich hoffe, er wird für jedermanns Studium hilfreich sein. Ich hoffe auch, dass jeder 123WORDPRESS.COM unterstützen wird. Das könnte Sie auch interessieren:
|
<<: Tiefgreifendes Verständnis langer MySQL-Transaktionen
>>: js zur Realisierung einer einfachen Scheibenuhr
Die spezifische Methode zur Installation von Cent...
Quelle: http://www.ruoyi.vip/ Vue von „vue“ impor...
Swiper ist ein mit reinem JavaScript erstelltes P...
CSS3 kann die Farbe von Bildern ändern. Ab sofort...
Heute ist das Springboot-Projekt des Unternehmens...
In diesem Artikel erfahren Sie die Lösung für das...
MySQL-Tuning: Detaillierte Erläuterung und prakti...
GitHub bietet alle möglichen magischen Tools. Heu...
Deaktivieren Sie SeLinux setenforce 0 Dauerhaft g...
Karussell Die Grundidee ist: Im großen Container ...
Fast-Linux-Projektadresse: https://gitee.com/uitc...
Als ich MySQL konfiguriert habe, habe ich die Sta...
Wenn Sie die Größe und Anzahl der InnoDB-Redo-Log...
Die Vue-Routing-Seite this.route.push wird nicht ...
Mysql konvertiert Abfrageergebnissatz in JSON-Dat...