Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Die Magie des tr-Befehls beim Zählen der Häufigkeit englischer Wörter

Wir alle kennen den Befehl tr, mit dem Ersetzungen gelöscht und Zeichenfolgen gelöscht werden können. Im Englischen müssen wir oft die Häufigkeit von Wörtern zählen, die im Englischen vorkommen. Wenn wir die herkömmliche Methode verwenden und einen Rechner einrichten, um sie einzeln zu zählen, ist dies ziemlich zeitaufwändig. Verwenden Sie zu diesem Zeitpunkt den Befehl tr, um das Leerzeichen durch ein Zeilenumbruchzeichen zu ersetzen, und verwenden Sie dann den Befehl tr, um den Punkt, das Komma und das Ausrufezeichen nach einigen Wörtern zu löschen. Schauen Sie sich zunächst die zu ersetzende Datei this.txt an

Das Zen von Python, von Tim Peters
Schön ist besser als hässlich.
Explizit ist besser als implizit.
Einfach ist besser als komplex.
Komplex ist besser als kompliziert.
Flach ist besser als verschachtelt.
Spärlich ist besser als dicht.
Auf die Lesbarkeit kommt es an.
Sonderfälle sind nicht speziell genug, um die Regeln zu brechen.
Obwohl Zweckmäßigkeit wichtiger ist als Reinheit.
Fehler sollten niemals unbemerkt bleiben.
Sofern nicht ausdrücklich zum Schweigen gebracht.
Widerstehen Sie bei Unklarheiten der Versuchung, zu raten.
Es sollte einen – und vorzugsweise nur einen – offensichtlichen Weg geben, dies zu tun.
Obwohl dieser Weg möglicherweise nicht auf den ersten Blick offensichtlich ist, es sei denn, Sie sind Niederländer.
Jetzt ist besser als nie.
Obwohl „nie“ oft besser ist als „jetzt sofort“.
Wenn die Implementierung schwer zu erklären ist, ist es eine schlechte Idee.
Wenn die Implementierung leicht zu erklären ist, kann es eine gute Idee sein.
Namespaces sind eine wirklich tolle Idee – lasst uns mehr davon machen!

Wenn Sie für die obige Textdatei die 10 Wörter zählen möchten, die am häufigsten im Text vorkommen, können Sie den folgenden Befehl verwenden

[root@linux ~]# cat this.txt | tr ' ' '\n' | tr -d '[.,!]' | sortieren | uniq -c | sortieren -nr | head -10
10 ist
8 besser
8 als
5 bis
5 die
3 von
3 Obwohl
3 nie
3 sein
3 eins

Es ist sehr praktisch!

Zusammenfassen

Das Obige ist der vollständige Inhalt dieses Artikels. Ich hoffe, dass der Inhalt dieses Artikels einen gewissen Lernwert für Ihr Studium oder Ihre Arbeit hat. Vielen Dank für Ihre Unterstützung von 123WORDPRESS.COM. Wenn Sie mehr darüber erfahren möchten, schauen Sie sich bitte die folgenden Links an

Das könnte Sie auch interessieren:
  • So gehen Sie mit der Meldung „Vorgang nicht zulässig“ beim Löschen von Dateien in Linux um
  • Linux-Shell-Befehl zählt den Wert einer Spalte nach der Deduplizierung
  • Tipps zum Anzeigen von Verlaufsdatensätzen und Hinzufügen von Zeitstempeln in Linux
  • Mehrere Möglichkeiten, Python-Programme im Linux-Hintergrund auszuführen
  • Erstellen und Ausführen von Linux-Shell-Skripten
  • Python verwendet Paramiko zum Betrieb von Linux
  • Schritte zum Übertragen von Dateien und Ordnern zwischen zwei Linux-Servern
  • Lösungen für Dateien/Ordner, die unter Linux nicht gelöscht werden können
  • Implementierungsmethode von Android zum Ausführen von Shell-Skripten im Linux-Terminal, um das Protokoll der aktuell ausgeführten App direkt auszudrucken
  • Verwendung der Zabbix-API in einer Linux-Shell-Umgebung

<<:  Detaillierte Erläuterung der Implementierungsmethode für die Datenbank-Mehrtabellenverbindungsabfrage

>>:  Detaillierte Erklärung des Sandbox-Mechanismus von Vue3

Artikel empfehlen

Beispielcode zur Implementierung eines gepunkteten Rahmen-Scrolleffekts mit CSS

Wir sehen oft einen coolen Effekt, wenn die Maus ...

Detaillierte Schritte zur Installation von MySQL in Win

In diesem Artikel werden die detaillierten Schrit...

3 Möglichkeiten zum Erstellen von JavaScript-Objekten

Inhaltsverzeichnis 1. Objektliterale 2. Das neue ...

Detaillierte Analyse des MySQL 8.0-Speicherverbrauchs

Inhaltsverzeichnis 1. innodb_buffer_pool_size 2. ...

Der eigentliche Prozess der Einbindung von Axios in das Projekt

Inhaltsverzeichnis Vorwort Vorteile der Axios-Kap...

Über die Fallstricke bei der Implementierung der angegebenen Kodierung in MySQL

Vorne geschrieben Umgebung: MySQL 5.7+, MySQL-Dat...

Lassen Sie uns über das v-on-Parameterproblem in Vue sprechen

Verwendung von v-on:clock in Vue Ich lerne derzei...