Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Wir alle kennen den Befehl tr, mit dem Ersetzungen gelöscht und Zeichenfolgen gelöscht werden können. Im Englischen müssen wir oft die Häufigkeit von Wörtern zählen, die im Englischen vorkommen. Wenn wir die herkömmliche Methode verwenden und einen Rechner einrichten, um sie einzeln zu zählen, ist dies ziemlich zeitaufwändig. Verwenden Sie zu diesem Zeitpunkt den Befehl tr, um das Leerzeichen durch ein Zeilenumbruchzeichen zu ersetzen, und verwenden Sie dann den Befehl tr, um den Punkt, das Komma und das Ausrufezeichen nach einigen Wörtern zu löschen. Schauen Sie sich zunächst die zu ersetzende Datei this.txt an

Das Zen von Python, von Tim Peters
Schön ist besser als hässlich.
Explizit ist besser als implizit.
Einfach ist besser als komplex.
Komplex ist besser als kompliziert.
Flach ist besser als verschachtelt.
Spärlich ist besser als dicht.
Auf die Lesbarkeit kommt es an.
Sonderfälle sind nicht speziell genug, um die Regeln zu brechen.
Obwohl Zweckmäßigkeit wichtiger ist als Reinheit.
Fehler sollten niemals unbemerkt bleiben.
Sofern nicht ausdrücklich zum Schweigen gebracht.
Widerstehen Sie bei Unklarheiten der Versuchung, zu raten.
Es sollte einen – und vorzugsweise nur einen – offensichtlichen Weg geben, dies zu tun.
Obwohl dieser Weg möglicherweise nicht auf den ersten Blick offensichtlich ist, es sei denn, Sie sind Niederländer.
Jetzt ist besser als nie.
Obwohl „nie“ oft besser ist als „jetzt sofort“.
Wenn die Implementierung schwer zu erklären ist, ist es eine schlechte Idee.
Wenn die Implementierung leicht zu erklären ist, kann es eine gute Idee sein.
Namespaces sind eine wirklich tolle Idee – lasst uns mehr davon machen!

Wenn Sie für die obige Textdatei die 10 Wörter zählen möchten, die am häufigsten im Text vorkommen, können Sie den folgenden Befehl verwenden

[root@linux ~]# cat this.txt | tr ' ' '\n' | tr -d '[.,!]' | sortieren | uniq -c | sortieren -nr | head -10
10 ist
8 besser
8 als
5 bis
5 die
3 von
3 Obwohl
3 nie
3 sein
3 eins

Es ist sehr praktisch!

Zusammenfassen

Das Obige ist der vollständige Inhalt dieses Artikels. Ich hoffe, dass der Inhalt dieses Artikels einen gewissen Lernwert für Ihr Studium oder Ihre Arbeit hat. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM. Wenn Sie mehr darüber erfahren möchten, schauen Sie sich bitte die folgenden Links an

Das könnte Sie auch interessieren:
  • So gehen Sie mit der Meldung „Vorgang nicht zulässig“ beim Löschen von Dateien in Linux um
  • Linux-Shell-Befehl zählt den Wert einer Spalte nach der Deduplizierung
  • Tipps zum Anzeigen von Verlaufsdatensätzen und Hinzufügen von Zeitstempeln in Linux
  • Mehrere Möglichkeiten, Python-Programme im Linux-Hintergrund auszuführen
  • Erstellen und Ausführen von Linux-Shell-Skripten
  • Python verwendet Paramiko zum Betrieb von Linux
  • Schritte zum Übertragen von Dateien und Ordnern zwischen zwei Linux-Servern
  • Lösungen für Dateien/Ordner, die unter Linux nicht gelöscht werden können
  • Implementierungsmethode von Android zum Ausführen von Shell-Skripten im Linux-Terminal, um das Protokoll der aktuell ausgeführten App direkt auszudrucken
  • Verwendung der Zabbix-API in einer Linux-Shell-Umgebung

<<:  Detaillierte Erläuterung der Implementierungsmethode für die Datenbank-Mehrtabellenverbindungsabfrage

>>:  Detaillierte Erklärung des Sandbox-Mechanismus von Vue3

Artikel empfehlen

Docker-Konfiguration Alibaba Cloud Image Acceleration Pull-Implementierung

Heute habe ich Docker verwendet, um das Image abz...

Saubere XHTML-Syntax

Das Schreiben von XHTML erfordert eine saubere HTM...

js, um einen Ein- und Ausblendeffekt des Bildes zu erzielen

In diesem Artikel wird der spezifische Code von j...

Detaillierte Erklärung zu Drag-Time und Drag-Case in JavaScript

Inhaltsverzeichnis DragEvent-Schnittstelle Übersi...

So erstellen Sie eine my.ini-Datei im MySQL 5.7.19-Installationsverzeichnis

Im vorherigen Artikel habe ich das ausführliche T...

border-radius ist eine Methode zum Hinzufügen abgerundeter Ränder zu Elementen

border-radius:10px; /* Alle Ecken sind mit einem ...

Detaillierte Erklärung der Vue-Filter

<Text> <div id="Wurzel"> &l...

Probleme bei der Installation von Python3 und Pip in Ubuntu in Docker

Text 1) Laden Sie das Ubuntu-Image herunter Docke...

Vollständiges Installationstutorial zum Ubuntu 16.04-Image unter VMware

In diesem Artikel finden Sie das Installations-Tu...