Was sind die neuen Funktionen von Apache Spark 2.4, das 2018 veröffentlicht wird?

Was sind die neuen Funktionen von Apache Spark 2.4, das 2018 veröffentlicht wird?

Dieser Artikel stammt vom Apache Spark Meetup, das am 19. September 2018 bei Adobe Systems Inc. stattfand.

Die kommende Version von Apache Spark 2.4 ist die fünfte in der 2.x-Reihe. Dieser Artikel bietet einen Überblick über die wichtigsten Funktionen und Verbesserungen in Apache Spark 2.4.

  • Das neue Planungsmodell (Barrier Scheduling) ermöglicht es Benutzern, verteiltes Deep-Learning-Training ordnungsgemäß in Spark-Phasen einzubetten, um den verteilten Trainings-Workflow zu vereinfachen.
  • 35 höherwertige Funktionen für Array-/Map-Operationen in Spark SQL hinzugefügt.
  • Eine neue native AVRO-Datenquelle basierend auf dem Spark-Avro-Modul von Databricks wurde hinzugefügt.
  • PySpark führt außerdem einen Eager-Evaluation-Modus für alle Vorgänge zum Lehren und Debuggen ein.
  • Spark auf K8S unterstützt PySpark und R und unterstützt den Client-Modus.
  • Verschiedene Verbesserungen für strukturiertes Streaming. Beispielsweise zustandsbehaftete Operatoren bei kontinuierlicher Verarbeitung.
  • Verschiedene Leistungsverbesserungen an integrierten Datenquellen. Beispielsweise das Beschneiden verschachtelter Schemata in Parquet.
  • Unterstützung für Scala 2.12.

Klicken Sie auf Shishuo.com, um diese PPT herunterzuladen.

Zusammenfassen

Oben habe ich Ihnen die neuen Funktionen von Apache Spark 2.4 vorgestellt, das 2018 auf den Markt kommt. Ich hoffe, es wird Ihnen helfen. Wenn Sie Fragen haben, hinterlassen Sie mir bitte eine Nachricht und ich werde Ihnen rechtzeitig antworten. Ich möchte auch allen für ihre Unterstützung der Website 123WORDPRESS.COM danken!

Das könnte Sie auch interessieren:
  • So verwenden Sie Spark und Scala zum Analysieren von Apache-Zugriffsprotokollen
  • Apache Spark 2.0-Jobs brauchen lange, bis sie abgeschlossen sind

<<:  Hinweise zur Verwendung von $refs in Vue-Instanzen

>>:  So ändern Sie das MySQL-Passwort unter Centos

Artikel empfehlen

Mehrere Möglichkeiten zum einfachen Durchlaufen von Objekteigenschaften in JS

Inhaltsverzeichnis 1. Selbstaufzählbare Eigenscha...

Das Implementierungsprinzip der MySQL-Master-Slave-Synchronisation

1. Was ist MySQL Master-Slave-Synchronisierung? W...

Eine kurze Diskussion über die Platzierung von Skripten in HTML

Früher dachte ich, dass Skripte überall in HTML p...

5 Möglichkeiten, Ihre JavaScript-Codebasis sauberer zu machen

Inhaltsverzeichnis 1. Verwenden Sie Standardparam...

Praktische Methode zum Upgrade von PHP auf 5.6 unter Linux

1: Überprüfen Sie die PHP-Version nach dem Aufruf...

So zeigen Sie MySql-Indizes an und optimieren sie

MySQL unterstützt Hash- und B-Tree-Indizes. InnoD...

Manuelle Implementierung der Instanceof-Methode in JavaScript

1. Verwendung von instanceof Mit instanceof wird ...

Docker-Compose erstellt schnell Schritte für ein privates Docker-Warehouse

Erstellen Sie docker-compose.yml und füllen Sie d...

Webdesign: Wenn der Titel nicht vollständig angezeigt werden kann

<br />Ich habe mir heute die neu gestaltete ...