Inhaltsverzeichnis- 1. Grundlegende Konzepte
- 2. Entwicklung der Datenbankverwaltungstechnologie
- 3. Konzept der relationalen Datenbank (RDBMS)
- 4. RDBMS-Design-Paradigma
1. Grundlegende Konzepte Daten sind symbolische Aufzeichnungen, die Dinge beschreiben. Sie beziehen sich auf identifizierbare Informationen, die mithilfe physischer Symbole aufgezeichnet wurden. 1. Eine Datenbank (DB) ist eine organisierte und gemeinsam nutzbare Sammlung von Daten, die über einen langen Zeitraum auf einem Computer gespeichert sind. Daten sollten nach einem bestimmten Datenmodell organisiert, beschrieben und gespeichert werden, mit geringer Redundanz und hoher Datenunabhängigkeit. Das System sollte leicht erweiterbar sein und von mehreren Benutzern gemeinsam genutzt werden können. Drei grundlegende Eigenschaften von Daten: - Dauerhafter Speicher
- Organisiert
- Teilbar
2. Ein Datenbankverwaltungssystem (DBMS) ist eine Softwarereihe, die speziell zum Erstellen und Verwalten von Datenbanken verwendet wird und zwischen Anwendungsprogrammen und Betriebssystemen angesiedelt ist. Es implementiert verschiedene Funktionen des Datenbanksystems. Es ist der Kern des Datenbanksystems. - Datendefinitionsfunktion
- Datenmanipulationsfunktionen
- Datenbankbetriebsverwaltungsfunktion
- Funktionen zur Datenbankerstellung und -wartung
- Datenorganisations-, Speicher- und Verwaltungsfunktionen
- Gewährleistung der Datensicherheit
- Datensicherungsfunktion
3. Das Datenbanksystem besteht aus: - Benutzer (Endbenutzer)
- Programm (API)
- Anwendung: bezieht sich auf datenbankbasierte Anwendungen
- Datenbankverwaltungssystem
- Datenbankadministrator (DBA): Verantwortlich für die Planung, Gestaltung, Koordination, Wartung und Verwaltung der Datenbank
- Datenbank
4. Datenbanksystemarchitektur: - Standalone-Architektur
- Mainframe/Terminal-Architektur
- Master-Slave-Architektur c/s: In der Client/Server-Struktur (Client/Server, C/S) erledigt der „Client“, die „Front-End“- oder „Präsentationsschicht“ hauptsächlich die Interaktionsaufgaben mit Datenbankbenutzern; der „Server“, das „Back-End“ oder die „Datenschicht“ ist hauptsächlich für die Datenverwaltung verantwortlich.
- Verteilte Architektur
5. Aufbau des Datenbanksystems - Modus: Wird auch konzeptioneller Modus oder logischer Modus genannt. Dies ist die logische Ansicht von Daten, d. h. die konzeptionelle Ansicht
- Externer Modus: Wird auch als Untermodus oder Benutzermodus-Datenansicht bezeichnet, d. h. Benutzeransicht
- Interner Modus: Wird auch Speichermodus genannt. Es handelt sich um eine interne Ansicht oder Speicheransicht.
Externer Modus/Modus-Image gewährleistet die logische Unabhängigkeit von Daten und Programm Interner Modus/Modus-Image sorgt für physikalische Unabhängigkeit von Daten und Programmen 6. Modell Ein Modell ist eine Simulation und ein abstrakter Ausdruck realer Eigenschaften. Das Datenmodell ist eine Abstraktion der Eigenschaften realer Daten und beschreibt den gemeinsamen Inhalt der Daten. 2. Entwicklung der Datenbankverwaltungstechnologie- Embryonales Stadium ----- Das Dateisystem verwendet Festplattendateien zum Speichern von Daten
- Primärphase: Die erste Generation von Datenbanken erschien in Form von Netzwerkmodellen und hierarchischen Modellen.
- Zwischenstufe - relationale Datenbank der zweiten Generation und strukturierte Abfragesprache
- Fortgeschrittene Stufe - die neue Generation der Datenbank "Relational-Object"-Datenbank
1. Nachteile der Dateisystemverwaltung - Das Schreiben von Bewerbungen ist umständlich
- Datenredundanz ist unvermeidlich
- Anwendungsabhängigkeiten
- Gleichzeitiger Zugriff auf Dateien wird nicht unterstützt
- Schwache Verbindung zwischen Daten
- Schwierigkeiten bei der Darstellung von Daten durch die Benutzeransicht
- Keine Sicherheitskontrollfunktion
2. Vorteile des Datenbankverwaltungssystems - Eine Sammlung miteinander verbundener Daten
- Weniger Datenredundanz
- Programme und Daten sind voneinander unabhängig
- Gewährleistung der Datensicherheit und Zuverlässigkeit
- Maximieren Sie die Genauigkeit der Daten
- Daten können gleichzeitig verwendet werden, wobei die Konsistenz gewährleistet bleibt
3. Konzept der relationalen Datenbank (RDBMS) Eine relationale Datenbank ist eine Sammlung aller Relationen, die eine relationale Datenbank ausmachen. Ein Datenbanktyp, der das relationale Modell als logisches Datenmodell und Beziehungen zur Datenorganisation verwendet. Seine Datenbankoperationen basieren auf relationaler Algebra. - Eine Tabelle ist eine zweidimensionale Datenstruktur, die aus einem Tabellennamen, Spalten und mehreren Datenzeilen besteht.
- Relation: Eine Relation ist eine zweidimensionale Tabelle. Und erfüllen die folgenden Eigenschaften: Die Reihenfolge der Zeilen und Spalten in der Tabelle ist nicht wichtig
- Zeile: Jede Zeile in der Tabelle wird auch als Datensatz oder Tupel bezeichnet. Daten in einer Tabelle werden in Zeilen gespeichert.
- Spalte: Jede Spalte in der Tabelle wird als Attribut und ein Feld als Feld bezeichnet.
- Komponente: Ein Attributwert in einem Tupel (Zeile) wird als Komponente bezeichnet.
- Schlüssel: Die Werte eines Attributs (oder einer Attributgruppe) können verwendet werden, um das Tupel der Relation eindeutig zu identifizieren, und diese Attribute (oder Attributgruppen) werden als Schlüssel der Relation bezeichnet.
- Primärschlüssel: Ein Feld zur eindeutigen Identifizierung eines Datensatzes.
- Fremdschlüssel: Ein Attribut (oder eine Attributgruppe) ist nicht der Primärschlüssel oder Kandidatenschlüssel dieser Relation, sondern der Primärschlüssel einer anderen Relation.
- Referenzierende Relation und referenzierte Relation: Referenzierende Relationen werden auch Slave-Beziehungen genannt, referenzierte Beziehungen auch Master-Beziehungen. Sie beziehen sich auf zwei Beziehungen, die mit Fremdschlüsseln verknüpft sind.
- Domäne: Der Wertebereich des Attributs, beispielsweise „Geschlecht“, kann nur zwei Werte haben: „männlich“ und „weiblich“.
- Datentyp: Jede Spalte hat einen entsprechenden Datentyp, der verwendet wird, um die in der Spalte gespeicherten Daten zu begrenzen (oder zuzulassen).
1. Transaktion Mehrere Operationen werden als Ganzes behandelt Transaktionen folgen ACID-Eigenschaften: - AAtomizität: Unteilbarkeit, alle Aktionen müssen ausgeführt werden, oder keine davon
- C-Konsistenz: Datenkonsistenz aufrechterhalten
- Isolation: Die endgültigen Daten können erst angezeigt werden, wenn die Transaktion abgeschlossen ist
- Schmutzige Daten: Daten, die durch die Transaktion nicht vervollständigt wurden
- D Haltbarkeit: dauerhafte Wirkung, permanent
2. ER-Modell (Entity-Relationship) Entität: Als Entitäten werden objektive Dinge oder abstrakte Ereignisse bezeichnet, die objektiv existieren und voneinander unterschieden werden können. Im ER-Diagramm werden Entitäten durch rechteckige Kästen dargestellt und die Entitätsnamen werden in die Kästen geschrieben. Attribut: Eine Eigenschaft oder Eigenschaft, die eine Entität besitzt Beziehung: Eine Beziehung ist eine Sammlung von Assoziationen zwischen Daten und stellt eine objektiv existierende semantische Anwendungskette dar. Es gibt Verbindungen innerhalb von Entitäten und Verbindungen zwischen Entitäten. Die Verbindungen zwischen Entitäten werden durch rautenförmige Kästchen dargestellt. Art der Kontaktaufnahme: - Persönlicher Kontakt (1:1)
- Eins-zu-viele-Beziehung (1:n)
- Viele-zu-viele-Beziehung (m:n)
3. Geschichte relationaler Datenbanken - 1970 schlug E. F. Codd von IBM das relationale Modell vor, das die theoretische Grundlage für relationale Datenbanken legte.
- Ende der 1970er Jahre gelang ein entscheidender Durchbruch in der theoretischen Erforschung relationaler Methoden und der Entwicklung von Softwaresystemen.
- Im Jahr 1981 kam eine relativ ausgereifte Technologie zur relationalen Datenbankverwaltung auf, die die Vorteile relationaler Datenbanken bestätigte: erweiterte nichtprozedurale Sprachschnittstelle und bessere Datenunabhängigkeit.
- Nach den 1980er Jahren wurden das Netzwerkmodell und das hierarchische Modell eng mit der zugrunde liegenden Implementierung integriert, und das relationale Modell verfügte über eine solide theoretische Grundlage und wurde zum gängigen Datenmodell.
4. Elemente des relationalen Datenmodells Zu den Elementen des Datenmodells gehören: - Relationale Datenstrukturen
- Relationaler Operationssatz
- Einschränkungen der relationalen Integrität
5. Drei Elemente von Daten - Datenstruktur: Sie umfasst zwei Kategorien. Eine Kategorie sind Objekte, die sich auf Datentyp, Inhalt und Eigenschaften beziehen, wie Domänen, Attribute und Beziehungen im relationalen Modell; die andere Kategorie sind Objekte, die sich auf die Verbindung zwischen Daten beziehen und die Struktur von Datensätzen und Feldern aus der Datenorganisationsschicht ausdrücken.
- Datenoperationen:
Datenextraktion, Extrahieren interessanter Inhalte aus einem Datensatz. Datenaktualisierung: Ändern der Daten in der Datenbank. - Datenbeschränkungen: eine Reihe von Integritätsregeln
Entitätsintegrität Domänenintegrität Referenzielle Integrität 6. Einschränkung - Primärschlüsseleinschränkung: Eine Kombination aus einem oder mehreren Feldern. Die eingegebenen Daten müssen die Zeile in dieser Tabelle eindeutig identifizieren können. Daten müssen angegeben werden, d. h. NICHT NULL. Eine Tabelle kann nur eines haben.
- Eindeutige Schlüsseleinschränkung: Eine Kombination aus einem oder mehreren Feldern. Die eingegebenen Daten müssen die Zeile in dieser Tabelle eindeutig identifizieren können. NULL ist zulässig. In einer Tabelle können mehrere Schlüssel vorhanden sein.
- Fremdschlüsseleinschränkung: Die Daten, die in ein Feld einer Tabelle eingetragen werden können, hängen von den Daten ab, die bereits im Primärschlüssel oder eindeutigen Schlüssel einer anderen Tabelle enthalten sind.
- Prüfbedingung: Der Feldwert liegt innerhalb eines bestimmten Bereichs.
7. Stichwortverzeichnis Die Daten eines oder mehrerer Felder einer Tabelle müssen separat kopiert und in einer bestimmten Reihenfolge gespeichert werden. 8. Relationale Operationen - Auswählen: Wählen Sie die Zeilen aus, die die Bedingungen erfüllen
- Projektion: Wählen Sie die erforderlichen Felder aus
- Join: Verknüpfung zwischen Feldern in Tabellen
9. Datenmodell Physikalische Schicht: Datenspeicherformat, d. h. wie RDBMS Dateien auf der Festplatte organisiert Logische Schicht: beschreibt aus Sicht des DBA, welche Daten gespeichert sind und welche Art von Beziehung zwischen den Daten besteht Ansichtsschicht: beschreibt aus Sicht des Benutzers einige Daten in der Datenbank - Klassifizierung relationaler Modelle:
Objektbasiertes relationales Modell Semistrukturiertes relationales Modell
4. RDBMS-Design-Paradigma Beim Entwurf einer relationalen Datenbank müssen wir verschiedene Spezifikationen befolgen und eine sinnvolle relationale Datenbank entwerfen. Diese verschiedenen Spezifikationen werden als verschiedene Paradigmen bezeichnet. Verschiedene Paradigmen stellen Unterspezifikationen dar. Je höher das Paradigma, desto weniger Redundanz hat die Datenbank. Derzeit gibt es sechs Paradigmen für relationale Datenbanken: das erste Paradigma (1NF), das zweite Paradigma (2NF), das dritte Paradigma (3NF), das Badesco-Paradigma (BCNF), das vierte Paradigma (4NF) und das fünfte Paradigma (5NF, auch bekannt als das perfekte Paradigma). Die mindestens erforderliche Normalform ist die erste Normalform (1NF). Die erste Normalform, die mehr Spezifikationsanforderungen erfüllt, wird als zweite Normalform (2NF) bezeichnet und die verbleibenden Normalformen sind ähnlich. Im Allgemeinen muss eine Datenbank nur die dritte Normalform (3NF) erfüllen. - 1NF: Es gibt keine wiederholten Spalten. Jede Spalte ist ein unteilbares Basisdatenelement. In derselben Spalte können nicht mehrere Werte vorhanden sein. Das heißt, ein Attribut in der Entität kann nicht mehrere Werte oder wiederholte Attribute haben. Mit Ausnahme der Felder desselben Typs gibt es keine doppelten Spalten.
Hinweis: Die erste Normalform (1NF) ist die Grundvoraussetzung für das relationale Modell. Eine Datenbank, die die erste Normalform (1NF) nicht erfüllt, ist keine relationale Datenbank. - 2NF: Die Attribute sind vollständig vom Primärschlüssel abhängig. Die zweite Normalform muss zunächst die erste Normalform erfüllen, was bedeutet, dass jede Zeile in der Tabelle eindeutig unterscheidbar sein muss. Normalerweise wird der Tabelle eine Spalte hinzugefügt, um den eindeutigen Identifikator PK jeder Instanz zu speichern. Nicht-PK-Felder müssen direkt mit dem gesamten PK verknüpft sein.
- 3NF: Attribute hängen nicht von anderen nicht-primären Attributen ab. Um die dritte Normalform zu erfüllen, muss zuerst die zweite Normalform erfüllt sein. Die dritte Normalform erfordert, dass eine Datenbanktabelle keine nicht-primären Schlüsselwortinformationen enthält, die bereits in anderen Tabellen enthalten sind, und dass zwischen Nicht-PK-Feldern keine untergeordnete Beziehung bestehen kann.
Damit ist dieser Artikel über die Grundkonzepte relationaler MySQL-Datenbanken abgeschlossen, das erste Kapitel der MySQL-Reihe. Weitere Informationen zu relationalen MySQL-Datenbanken finden Sie in früheren Artikeln auf 123WORDPRESS.COM oder in den folgenden verwandten Artikeln. Ich hoffe, Sie werden 123WORDPRESS.COM auch in Zukunft unterstützen! Das könnte Sie auch interessieren:- Interviewfragen zu grundlegenden Datenbankkonzepten
- Ein Überblick über Datenbanksysteme
|