Converti da Tabelle Esterne UC a Tabelle Gestite UC per Accelerare le Query e Risparmiare sui Costi
• Impara a convertire senza problemi le tabelle esterne di Unity Catalog (UC) in tabelle gestite da UC riducendo al minimo i tempi di inattività, mantenendo le configurazioni delle tabelle e preservando la cronologia delle tabelle
• Aumenta le prestazioni delle query di 20 volte, riduci i costi di oltre il 50% e sblocca funzionalità avanzate con le tabelle gestite da Unity Catalog
• Scopri come mantenere il controllo sulla posizione fisica dei tuoi dati, eseguire conversioni in blocco, gestire i rollback e pianificare il tuo percorso
Il nuovo comando SET MANAGED fornisce un meccanismo semplice per convertire tabelle esterne UC in tabelle UC managed minimizzando i tempi di inattività, gestendo scritture concorrenti, mantenendo le configurazioni delle tabelle e, ove possibile, preservando la cronologia delle tabelle. Questo articolo condivide le best practice e fornisce una guida passo passo per l'utilizzo di questo comando generalmente disponibile (GA):
Con Unity Catalog come fonte di verità, le tabelle gestite sbloccano funzionalità uniche che migliorano le prestazioni, governance e facilità d'uso, mantenendo l'interoperabilità e la portabilità.
I vantaggi principali includono:
Il comando SET MANAGED rende più facile la conversione da tabelle esterne a gestite
Funzionalità | Vantaggio del comando SET MANAGED |
|---|---|
Minimizza i tempi di inattività | Mantieni la tabella online e disponibile per le letture utilizzando Databricks Runtime 16.1 o versioni successive e minimizza i tempi di inattività a pochi minuti per le scritture (o, per le letture su Databricks Runtime 15.4 o versioni precedenti). |
Preserva l'identità | Il nome della tabella, i permessi, i tag e le impostazioni per tutte le tabelle, e la cronologia delle tabelle (per le tabelle Delta) vengono mantenuti. |
Gestisce la concorrenza | Il comando SET MANAGED gestisce in modo sicuro le scritture concorrenti che possono verificarsi durante la conversione. |
"Annulla" come misura di sicurezza | Un altro comando chiamato UNSET MANAGED consente di ripristinare una tabella convertita a UC esterna entro 14 giorni, come rete di sicurezza. |
Il comando SET MANAGED rende la conversione delle tabelle semplice. In una guida passo passo, abbiamo delineato suggerimenti chiave per garantire una transizione fluida da tabelle esterne a gestite.
Inizia selezionando un paio di tabelle esterne di Unity Catalog da convertire prima in UC managed, per familiarizzare il tuo team con il processo, i prerequisiti e i passaggi post-conversione.
Ad esempio, puoi provare prima questo comando su un paio di tabelle che vengono lette e scritte esclusivamente da client Databricks (vedi la sezione "Pianificazione di un percorso graduale" più avanti).
Verifica che il tuo ecosistema di lettori e scrittori di tabelle sia pronto al cambiamento. Per ogni tabella esterna UC selezionata e i relativi workload, dovrai:
Esegui la conversione utilizzando il seguente comando di conversione:
Nota: Per le tabelle con UniForm abilitato, usa SET MANAGED TRUNCATE UNIFORM HISTORY.
Dopo che il comando è stato completato, conferma che la conversione sia avvenuta con successo controllando i metadati della tabella.
Nell'output di questo comando, la proprietà "Type" dovrebbe ora visualizzare "MANAGED". Puoi anche vedere queste stesse informazioni nella sezione "Informazioni su questa tabella" di Catalog Explorer.

Dopo una conversione riuscita, completa questi passaggi finali per garantire una transizione fluida:
Una conversione di successo di tutte le tabelle in UC managed è un percorso: adottare un approccio graduale e pianificare in anticipo può aiutare a garantire una transizione agevole:
I seguenti dettagli relativi al comando di conversione potrebbero essere utili da conoscere in anticipo:
Per convertire centinaia o migliaia di tabelle esterne di Unity Catalog in blocco all'interno di uno schema specifico, è possibile utilizzare il seguente semplice script SQL.
Nota: Questo script esegue modifiche in tempo reale. Si consiglia vivamente di testarlo a fondo in un ambiente di sviluppo prima di eseguirlo in produzione.
Tabelle gestite da Unified Catalog (UC) risiedono nello storage gestito dal cliente e sono accessibili tramite API di catalogo aperte. Se desideri un maggiore controllo su come i tuoi dati vengono archiviati fisicamente o segregare i tuoi dati, puoi definire una posizione di archiviazione gestita a livello di catalogo o schema – qualsiasi nuova tabella gestita creata in quel catalogo o schema sarà automaticamente organizzata in quella posizione specificata.
Per le tabelle esterne preesistenti, è possibile impostare una posizione di archiviazione gestita, quindi utilizzare il comando SET MANAGED per convertirle in tabelle gestite da UC. Durante la conversione, il sistema rispetta la posizione gestita che hai definito, dandoti il controllo sulla disposizione fisica dei tuoi dati nell'archiviazione cloud. Contatta il tuo team di account per accedere a questa funzionalità in anteprima privata oggi stesso.
In pochi mesi dalla anteprima pubblica, centinaia di clienti hanno convertito con successo migliaia di tabelle con SET MANAGED.
Tutto ciò che è descritto qui è ora GA – provalo oggi stesso e sblocca le prestazioni, la governance e la semplicità delle tabelle gestite da Unity Catalog.
(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale
Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.