Was ist Online-Transaktionsverarbeitung (OLTP)?

OLTP, oder Online-Transaktionsverarbeitung, ist eine Art der Datenverarbeitung, die eine große Anzahl kurzer, schneller Transaktionen mit geringer Latenz effizient verarbeiten kann. Im Wesentlichen ist OLTP darauf ausgelegt, Daten schnell zu speichern und abzurufen. Es konzentriert sich auf tägliche, wesentliche operative Arbeitslasten, die typischerweise Transaktionen wie das Einfügen, Aktualisieren oder Löschen kleiner Datenmengen umfassen. Beispiele hierfür sind die Erfassung einer Bankeinzahlung, die Buchung eines Flugtickets oder die Abwicklung eines Online-Kaufs.

Ähnliche Themen erkunden

Das Big Book der GenAI

Best Practices für die Entwicklung produktionsreifer GenAI-Anwendungen.

Jetzt lesen

eb big book of data engineering 4th ed ty tn

Das Big Book of Data Engineering

Ihr unverzichtbarer Leitfaden für Best Practices im Data Engineering.

Jetzt lesen

Databricks Free Edition

Erforschen und erlernen Sie die neuesten Daten- und KI-Technologien

Registrieren

Wichtige Merkmale von OLTP-Systemen

OLTP ist für Geschwindigkeit, Zuverlässigkeit und Gleichzeitigkeit optimiert. So wird sichergestellt, dass viele Nutzer gleichzeitig Transaktionen ohne Fehler oder Datenkonflikte durchführen können und dass Organisationen jederzeit auf die Informationen zugreifen können.

Diese Systeme müssen die Daten bei einem hohen Volumen an Echtzeit-Geschäftstransaktionen korrekt und konsistent halten. OLTP-Systeme basieren in der Regel auf relationalen Datenbanken, die ACID -Eigenschaften (Atomarität, Konsistenz, Isolation und Dauerhaftigkeit) erzwingen, um sicherzustellen, dass nur gültige, vollständige Transaktionen gespeichert werden, wodurch die Datenintegrität gewahrt wird. OLTP-Systeme verwenden außerdem Constraints, Trigger, Validierungsprüfungen und Regeln für die referentielle Integrität, um die Datenintegrität zu schützen und eine solide Grundlage für die unternehmerische Entscheidungsfindung zu schaffen. Moderne OLTP-Engines können je nach Anforderungen auch verteilte Key-Value- oder Dokumentenspeicher verwenden.

Die Gleichzeitigkeitssteuerung – die sicherstellt, dass mehrere Nutzer gleichzeitig, in der richtigen Reihenfolge und ohne Konflikte oder Datenanomalien auf Daten zugreifen und diese ändern können – ist ebenfalls entscheidend für OLTP. Systeme verwenden Sperralgorithmen, um sicherzustellen, dass keine zwei Nutzer gleichzeitig dieselben Daten ändern können und dass alle Transaktionen in der richtigen Reihenfolge ausgeführt werden. Eine effektive Gleichzeitigkeitssteuerung ermöglicht es OLTP-Systemen, selbst bei hoher Transaktionslast eine hohe Verfügbarkeit, Reaktionsfähigkeit und Zuverlässigkeit zu bieten.

OLTP-Systeme müssen mit einem hohen Durchsatz arbeiten, was bedeutet, dass sie in der Lage sind, ein hohes Transaktionsvolumen schnell und effizient zu bewältigen. Gleichzeitig müssen sie auch eine geringe Latenz bzw. eine minimale Verarbeitungsverzögerung aufweisen, um Verlangsamungen zu vermeiden, während das System ein hohes Volumen an gleichzeitigen Echtzeit-Geschäftsvorgängen verarbeitet.

Kernkomponenten

OLTP basiert auf einer Reihe von Komponenten, die zusammenarbeiten, um eine schnelle, präzise und skalierbare Transaktionsverarbeitung für geschäftskritische Anwendungen zu ermöglichen. Dazu gehören:

Datenbank: OLTP stützt sich in der Regel auf relationale Datenbanken, die für eine schnelle Performance ausgelegt sind. Sie gewährleisten Nebenläufigkeit und ACID-Compliance, sodass die Daten korrekt, stets verfügbar und leicht zugänglich sind. Relationale Datenbanken organisieren Daten in miteinander verbundenen Tabellen, wobei jede Information nur einmal gespeichert wird. Dies verhindert Redundanz und hilft, häufige kleine Aktualisierungen effizient zu verarbeiten. Die Daten können von jeder Anwendung genutzt werden, was eine einzige Quelle der Wahrheit gewährleistet.
Query-Engine: Diese liegt über der Datenbank und verwaltet die Ausführung von Operationen unter Einhaltung der ACID-Prinzipien. Es koordiniert Tasks wie Transaktionsprotokollierung, Parallelitätssteuerung und Commit- oder Rollback-Betrieb.
Unterstützende Infrastruktur: Dazu gehören Anwendungsserver, Middleware, Netzwerkschnittstellen und Speichersysteme, die die Kommunikation, den Datenzugriff und die Performance-Optimierung erleichtern.

Typischer Transaktionsablauf

OLTP führt Transaktionen in mehreren Schritten aus, die darauf ausgelegt sind, Tausende von Transaktionen pro Sekunde zu verarbeiten und dabei die Datenintegrität und das Nutzervertrauen zu wahren.

Dateneingabe: Ein Benutzer initiiert eine Aktion, z. B. einen Kauf, eine Zahlung oder eine Aktualisierung, über eine Client-Anwendung, wodurch eine Transaktionsanfrage generiert wird.
Übertragung der Transaktionsanfrage: Die Anfrage wird an den Anwendungsserver gesendet, der die Geschäftslogik anwendet, um den Datenbankbetrieb zu bestimmen.
Transaktionsverarbeitung: Der Server führt Operationen – Insert, Update, Delete oder Select – in der OLTP-Datenbank aus.
Commit oder Rollback: Wenn alle Vorgänge erfolgreich sind, committet das System die Transaktion und speichert die Änderungen dauerhaft. Wenn ein Schritt fehlschlägt, führt das System einen Rollback für alle Aktionen durch, um den vorherigen Zustand der Datenbank wiederherzustellen. Nach dem Commit sind die Änderungen dauerhaft.
Ausgabe und Protokollierung: Das System gibt eine Bestätigung an den Nutzer zurück (z. B. in Form einer Quittung oder Nachricht) und zeichnet die Transaktion in logs auf.
Nachgelagerte Datenverarbeitung: Transaktionsprotokolle und -tabellen dienen als Quelle für nachgelagerte Datenpipelines, wie z. B. ETL-Prozesse (Extrahieren, Transformieren und Laden). Diese übertragen Daten vom OLTP-System auf Analyse- oder Verarbeitungsplattformen wie Data Warehouses, Data Lakes und Echtzeit-Streamingsysteme für Reporting-, Analytics- oder Machine-Learning-Anwendungen.

Performanceaspekte

Eine hohe Performance ist für OLTP entscheidend, um die Geschwindigkeit und Stabilität zu liefern, die Nutzer bei wichtigen Transaktionen erwarten. Es werden verschiedene Techniken verwendet, um die Performance von OLTP-Systemen zu optimieren. Zu diesen Strategien gehören:

Indizierung: Dies ermöglicht es dem System, Datensätze schnell zu finden, um den Datenabruf zu beschleunigen.
Partitionierung: Die Partitionierung unterteilt große Tabellen in kleinere Teile, um Performance, Skalierbarkeit und Verwaltbarkeit zu verbessern.
Verbindungspooling: Dies verbessert die Effizienz, da bestehende Datenbankverbindungen wiederverwendet werden, anstatt neue zu erstellen.
Caching: Bei dieser Technik werden häufig abgerufene Daten vorübergehend im Speicher abgelegt, um Operationen zu beschleunigen.
Skalierung: Strategien wie vertikale Skalierung (Hinzufügen weiterer physischer Ressourcen wie CPU, RAM oder schnellerer Speicher) oder horizontale Skalierung (Verteilen der Arbeitslast auf mehrere Maschinen) werden verwendet, um steigende Transaktionsvolumina zu bewältigen.

Diese Methoden werden verwendet, um sicherzustellen, dass OLTP-Datenbanken auch bei hohem Transaktionsvolumen Zuverlässigkeit und niedrige Antwortzeiten im Millisekundenbereich bieten. Dies gewährleistet eine schnelle und reibungslose Performance für die Benutzer und ermöglicht es Unternehmen, bei Bedarf zu skalieren und gleichzeitig die Kosten niedrig zu halten.

Praxisbeispiele für OLTP

OLTP ist branchenübergreifend für eine Vielzahl Key Geschäftsfunktionen entscheidend. Beispiele hierfür sind:

E-Commerce-Bestellabwicklung
Banktransaktionen wie Bargeldabhebungen am Geldautomaten und Überweisungen
Elektronische Zahlungsabwicklung
Finanzdienstleistungen wie der Börsenhandel
Online-Buchungen für Tickets und Reservierungen
Kundendienst-Interaktionen
Sitzungs-/Zustandsspeicherung für KI-Konversationsagenten oder Chatbots
Verwaltung von Krankenakten
Instandhaltung in der Fertigung
Zustandsverfolgung von Geräten oder IoT

OLTP im Datenökosystem

OLTP-Systeme sind die vorderste Schicht des Datenökosystems zur Verwaltung und Erfassung von täglichen Geschäftsabläufen in Echtzeit. OLTP-Datenbanken speichern aktuelle, granulare Daten, die durch diese Transaktionen generiert werden. Diese Daten werden später extrahiert, transformiert und in nachgelagerte Systeme wie Data Lakes, Data Warehouses oder Analyseplattformen geladen, wo sie aggregiert und analysiert werden, um die Entscheidungsfindung zu unterstützen.

OLTP vs. OLAP

Viele Unternehmen verwenden OLTP zusammen mit Online Analytical Processing (OLAP). Beide Systeme sind für die Verwaltung und Analyse großer Datenmengen unerlässlich, sind aber für unterschiedliche Tasks konzipiert und haben unterschiedliche Funktionen. Während sich OLTP auf das effiziente und zuverlässige Speichern und Aktualisieren von Transaktionsdaten in Echtzeit für den Live-Betrieb konzentriert, kombiniert und gruppiert OLAP Daten, damit sie für Dateneinblicke aus verschiedenen Perspektiven analysiert werden können.

Wie sich OLTP und OLAP gegenseitig ergänzen

Unternehmen verwenden häufig sowohl die OLAP- als auch die OLTP-Datenverarbeitung für eine umfassende Business Intelligence. OLTP ist für Live-Transaktionen und Echtzeit-Updates für Workloads wie die Verarbeitung von Bestellungen, die Aktualisierung des Lagerbestands oder die Verwaltung von Kundenkonten konzipiert. OLAP unterstützt Einblicke in historische oder aggregierte Daten, einschließlich Tasks wie Reporting, Trenderkennung und komplexe Datenanalysen. OLAP-Systeme können Quelldaten aus mehreren OLTP-Systemen für komplexere Analysen verwenden.

Workload-Muster

OLTP ist für schreibintensive Workloads konzipiert, wobei der Schwerpunkt auf der Verarbeitung eines hohen Volumens kleiner, gleichzeitiger Transaktionen bei gleichzeitiger Wahrung von Geschwindigkeit und Datenintegrität liegt. Im Gegensatz dazu sind OLAP-Systeme für leselastigen Betrieb wie Aggregation und Analysen konzipiert. Sie sind so optimiert, dass Benutzer komplexe Abfragen für große Datenmengen schnell und effizient durchführen können, anstatt Daten zu ändern.

Auswahl und Optimierung von OLTP-Lösungen

Bei der Auswahl einer OLTP-Lösung sollten Unternehmen prüfen, wie gut das System ihre individuellen betrieblichen Anforderungen erfüllt, einschließlich Aspekten wie Transaktionstyp und -volumen, Datenstruktur, Leistungsanforderungen, Skalierbarkeit und Anforderungen an die Echtzeit-Reaktionsfähigkeit. Die richtige Lösung ist auf die langfristige Datenstrategie, die Anwendungsfälle und die Ressourcen eines Unternehmens abgestimmt.

Bewertungskriterien

Ein entscheidender Faktor bei der Auswahl einer OLTP-Lösung ist die Wahl zwischen SQL- und NoSQL-Datenbanken. SQL-Datenbanken wie Postgres (der führende Open-Source-Standard für Datenbanken), MySQL oder Oracle zeichnen sich durch eine strikte ACID-Compliance aus, die die Datenintegrität unterstützt. Sie bieten außerdem Transaktionssicherheit und komplexe Abfragen für strukturierte Daten. NoSQL-Datenbanken bieten eine größere Skalierbarkeit, Geschwindigkeit und Flexibilität für unstrukturierte Daten.

Weitere Key-Bewertungskriterien von OLTP-Lösungen sind:

Skalierbarkeit: Das System sollte in der Lage sein, sofort hoch- oder herunterzuskalieren, um schwankende Transaktionsvolumen unter gleichzeitigen Workloads zu bewältigen.
Konsistenz: Die Lösung sollte in der Lage sein, die Konsistenz zu wahren, ohne die Performance zu beeinträchtigen.
Geeignet für geschäftskritische Workloads: Die Lösung muss wesentliche Funktionen unterstützen. Zum Beispiel sind in Bereichen wie E-Commerce, Gesundheitswesen oder Finanzsystemen Transaktionsgenauigkeit und Betriebszeit für den Betrieb entscheidend.
Sicherheit: Eine hohe Sicherheit ist für den Schutz sensibler Kundentransaktionsdaten unerlässlich.
Kosten: Organisationen müssen die Gesamtbetriebskosten berücksichtigen, einschließlich Lizenzierung, Infrastruktur und Verwaltung.
Integration: In herkömmlichen Architekturen sind operative Datenbanken und Analysesysteme vollständig voneinander getrennt. Die Lakebase-Architektur integriert OLTP-Datenbanken nativ in das Lakehouse, um operative Daten-Workflows zu vereinfachen.

Optimierungstipps

Um OLTP-Systeme zu optimieren, müssen sich Teams auf die Maximierung von Effizienz, Reaktionsfähigkeit und Datenintegrität konzentrieren. Dazu können verschiedene Strategien verwendet werden, darunter:

Kleine Transaktionen: Wenn Transaktionen klein und schnell gehalten werden, wird die Menge der zu einem beliebigen Zeitpunkt gesperrten Daten minimiert und Konflikte zwischen gleichzeitigen Nutzern werden reduziert.
Indexoptimierung: Gut konzipierte Indizes können die Abfrage-Performance erheblich beschleunigen.
Caching: Das Speichern häufig abgerufener Daten im Arbeitsspeicher kann die Antwortzeiten von Abfragen reduzieren.
Lesereplikate: Diese verteilen die Abfragelasten weiter, ohne den Transaktionsdurchsatz zu verlangsamen.
Lastausgleich: Die Verteilung von Workloads auf mehrere Server verhindert Engpässe, sodass Abfragen schnell verarbeitet werden können.

Fazit

OLTP ist das Rückgrat der operativen Datenverarbeitung. Es ermöglicht geschäftskritische Transaktionen und erfasst die Daten aus diesen Transaktionen als Grundlage für weitere Analysen und Erkenntnisse. Das Verständnis der Rolle von OLTP-Systemen und ihrer Kernfunktionen ist für Unternehmen, die ihre Systeme für ihre einzigartigen Workloads optimieren und das Beste aus ihren Daten machen möchten, ist Key.

Integration von OLTP in Databricks

Lakebase ist eine vollständig verwaltete Postgres-OLTP-Datenbank-Engine, die direkt in die Databricks Data Intelligence Platform integriert ist. Lakebase bringt OLTP mit Funktionen wie serverlosem Autoscaling, Scale-to-Zero, Database Branching und sofortiger Wiederherstellung ins Lakehouse und gewährleistet dabei die Kompatibilität mit standardmäßigen Postgres-Tools und die Unterstützung für Postgres-Erweiterungen. Typische Anwendungsfälle sind:

Erstellen von Standalone-Anwendungen, die einen schnellen und zuverlässigen operativen Speicher erfordern
Bereitstellung von Analysedaten aus dem Lakehouse direkt in einer Anwendung ohne zusätzliche Pipelines
Bereitstellung von Features und Modellen in einer Anwendung für Anwendungsfälle wie Produktempfehlungen oder Kundensegmentierung
Aufrechterhaltung des Sitzungs- und Anwendungszustands für Konversations-Chatbots und agentenbasierte Anwendungen

Die Verwendung einer nativ in die Databricks Platform integrierten OLTP-Datenbank reduziert die Komplexität von Anwendungen, vereinfacht die Verwaltung und erweitert die KI-Funktionen, indem operative Daten, Datenanalysen, KI, Apps und Governance auf einer einzigen Plattform vereinheitlicht werden.

Zurück zum Glossar