Konvertieren Sie von externen UC-Tabellen zu von UC verwalteten Tabellen, um Abfragen zu beschleunigen und Kosten zu sparen.
von Elizabeth Bowman und Amit Vaswani
• Erfahren Sie, wie Sie externe Unity Catalog (UC)-Tabellen nahtlos in von UC verwaltete Tabellen konvertieren, Ausfallzeiten minimieren, Tabellenkonfigurationen beibehalten und die Tabellenhistorie bewahren.
• Steigern Sie die Abfrageleistung um das 20-fache, senken Sie die Kosten um über 50 % und schalten Sie erweiterte Funktionen mit von Unity Catalog verwalteten Tabellen frei.
• Erfahren Sie, wie Sie die Kontrolle über den physischen Speicherort Ihrer Daten behalten, Massenkonvertierungen durchführen, Rollbacks handhaben und Ihre Migration planen.
Der neue Befehl SET MANAGED bietet einen nahtlosen Mechanismus, um UC externe Tabellen in UC verwaltete Tabellen umzuwandeln, während Ausfallzeiten minimiert, gleichzeitige Schreibvorgänge verarbeitet, Tabellenkonfigurationen beibehalten und, wo möglich, die Tabellenhistorie bewahrt werden. Dieser Artikel teilt Best Practices und bietet eine Schritt-für-Schritt-Anleitung zur Verwendung dieses allgemein verfügbaren (GA) Befehls:
Mit Unity Catalog als Quelle der Wahrheit erschließen verwaltete Tabellen einzigartige Funktionen, die Leistung, Governance und Benutzerfreundlichkeit verbessern – bei gleichzeitiger Wahrung von Interoperabilität und Portabilität.
Die wichtigsten Vorteile sind:
Der SET MANAGED Befehl vereinfacht die Konvertierung von externen zu verwalteten Tabellen
Funktion | Vorteil des SET MANAGED Befehls |
|---|---|
Ausfallzeiten minimieren | Halten Sie die Tabelle online und für Lesevorgänge mit Databricks Runtime 16.1 oder höher verfügbar und minimieren Sie Ausfallzeiten für Schreibvorgänge (oder für Lesevorgänge mit Databricks Runtime 15.4 oder niedriger) auf nur wenige Minuten. |
Identität bewahren | Der Name, die Berechtigungen, Tags und Einstellungen der Tabelle für alle Tabellen sowie die Tabellenhistorie (für Delta-Tabellen) bleiben alle erhalten. |
Gleichzeitigkeit handhaben | Der SET MANAGED Befehl verarbeitet sicher gleichzeitige Schreibvorgänge, die während der Konvertierung auftreten können. |
"Rückgängig" als Sicherheitsnetz | Ein weiterer Befehl namens UNSET MANAGED ermöglicht das Zurücksetzen einer konvertierten Tabelle auf UC extern innerhalb von 14 Tagen, als Sicherheitsnetz. |
Der SET MANAGED Befehl macht die Tabellenkonvertierung unkompliziert. In einer Schritt-für-Schritt-Anleitung haben wir wichtige Tipps skizziert, um einen reibungslosen Übergang von externen zu verwalteten Tabellen zu gewährleisten.
Beginnen Sie damit, einige Unity Catalog externe Tabellen auszuwählen, die zuerst in UC verwaltete Tabellen konvertiert werden sollen, um Ihr Team mit dem Prozess, den Voraussetzungen und den Schritten nach der Konvertierung vertraut zu machen.
Sie können diesen Befehl beispielsweise zuerst an einigen Tabellen ausprobieren, die ausschließlich von Databricks-Clients gelesen und beschrieben werden (siehe den Abschnitt „Planung einer gestuften Migration“ weiter unten).
Stellen Sie sicher, dass Ihr Ökosystem von Tabellenlesern und -schreibern bereit für die Änderung ist. Für jede ausgewählte UC externe Tabelle und die damit verbundenen Workloads sollten Sie Folgendes tun:
Führen Sie die Konvertierung mit dem folgenden Konvertierungsbefehl aus:
Hinweis: Für Tabellen, bei denen UniForm aktiviert ist, verwenden Sie SET MANAGED TRUNCATE UNIFORM HISTORY.
Nachdem der Befehl abgeschlossen ist, bestätigen Sie, dass die Konvertierung erfolgreich war, indem Sie die Metadaten der Tabelle überprüfen.
In der Ausgabe dieses Befehls sollte die Eigenschaft „Type“ nun als „MANAGED“ angezeigt werden. Dieselben Informationen finden Sie auch im Abschnitt „Über diese Tabelle“ des Catalog Explorers.

Nach einer erfolgreichen Konvertierung führen Sie diese letzten Schritte aus, um einen reibungslosen Übergang zu gewährleisten:
Eine erfolgreiche Umstellung aller Tabellen auf UC-verwaltete Tabellen ist ein Prozess – ein phasenweiser Ansatz und vorausschauende Planung können einen reibungslosen Übergang gewährleisten:
Die folgenden Details zum Konvertierungsbefehl könnten im Voraus nützlich sein:
Um Hunderte oder Tausende von Unity Catalog externen Tabellen in einem bestimmten Schema in großen Mengen zu konvertieren, können Sie das folgende einfache SQL-Skript verwenden.
Hinweis: Dieses Skript führt Live-Modifikationen durch. Es wird dringend empfohlen, es in einer Entwicklungsumgebung gründlich zu testen, bevor es in der Produktion ausgeführt wird.
Unified Catalog (UC) verwaltete Tabellen befinden sich in kundenverwaltetem Speicher und sind über offene Katalog-APIs zugänglich. Wenn Sie mehr Kontrolle darüber wünschen, wie Ihre Daten physisch gespeichert werden oder Ihre Daten trennen möchten, können Sie einen verwalteten Speicherort definieren auf Katalog- oder Schemaebene – alle neuen verwalteten Tabellen, die in diesem Katalog oder Schema erstellt werden, werden automatisch an diesem angegebenen Speicherort organisiert.
Für bereits bestehende externe Tabellen können Sie einen verwalteten Speicherort festlegen und dann den Befehl SET MANAGED verwenden, um sie in UC-verwaltete Tabellen zu konvertieren. Während der Konvertierung berücksichtigt das System den von Ihnen definierten verwalteten Speicherort, wodurch Sie die Kontrolle über das physische Layout Ihrer Daten im Cloud-Speicher erhalten. Bitte kontaktieren Sie Ihr Account-Team, um noch heute Zugang zu dieser Funktion in der Private Preview zu erhalten.
In nur wenigen Monaten seit der Public Preview haben Hunderte von Kunden erfolgreich Tausende von Tabellen mit SET MANAGED konvertiert.
Alles hier Beschriebene ist jetzt GA – probieren Sie es noch heute aus und nutzen Sie die Leistung, Governance und Einfachheit von Unity Catalog Managed Tables.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.