Passa al contenuto principale
Soluzioni

Prontezza dell'IA nelle telecomunicazioni

Colmare il divario tra dati e intelligenza

di Stephen Hage, Keerthi Josyula e Michael Zhang

  • Il paradosso dell'IA nelle Telco: il 97% dei dirigenti delle telco adotta l'IA, ma le iniziative si bloccano prima della produzione su larga scala a causa del "debito di dati"—dati frammentati, non governati e semanticamente opachi—non per una mancanza di qualità del modello. Un agente IA potrebbe eccellere nella fisica a livello di laurea, ma fallire ancora nel comprendere termini specifici del settore come "sito" o "CDR" nel tuo contesto operativo.
  • Il ponte semantico: la soluzione consiste nell'istituire Databricks Unity Catalog come fonte autorevole di verità. Implementa un livello semantico unificato sul Lakehouse, unificando sistemi disparati tramite Lakehouse Federation e fornendo agli agenti IA il ricco contesto (Metric Views, lineage, glossari aziendali) necessario per passare da "demo impressionante" a produzione affidabile.
  • La governance come catalizzatore: questo livello di metadati unificato consente una governance coerente, end-to-end—dai dati grezzi all'output dell'IA—utilizzando Attribute-Based Access Control (ABAC) e mascheramento dinamico. Ciò è fondamentale per mantenere la conformità con le rigide normative CPNI, GDPR e CALEA e garantire che gli agenti IA eseguano accuratamente compiti operativi complessi.

La sfida dell'adozione dell'IA nelle telco

Secondo il report "State of AI in Telecommunications 2025" di NVIDIA, il 97% dei dirigenti delle telecomunicazioni valuta o adotta l'IA per migliorare l'esperienza del cliente, ottimizzare le operazioni di rete e ridurre i costi. Molti hanno superato le fasi pilota e stanno generando un ROI positivo. Tuttavia, la promessa dell'IA continua a superare la sua realizzazione.

Ecco il paradosso: le telco non hanno mai avuto così tanti dati, eppure le loro iniziative di IA si bloccano costantemente prima di raggiungere la scala di produzione. La tecnologia mobile si evolve da 3G a 4G, a 5G e oltre. Le innovazioni a banda larga estraggono più throughput dalla fibra esistente. Gli MVNO rivendono capacità, le società di torri coordinano migliaia di siti e gli operatori regionali modernizzano le infrastrutture legacy. I volumi di dati crescono esponenzialmente per tutti loro, e questi sforzi non mantengono le loro promesse.

Perché? Mentre i modelli foundation fanno notizia per aver superato "Humanity's Last Exam", un benchmark di 2.500 domande che spazia dalla matematica alle lingue antiche e a sottocampi altamente specializzati, la tua azienda deve prevedere il churn, personalizzare i messaggi, supportare l'analisi delle cause principali per le interruzioni di rete e risolvere mille altre sfide operative. Un modello che eccelle nella fisica a livello di laurea potrebbe comunque fallire clamorosamente nel comprendere cosa significano "sito", "torre" o "CDR" nel tuo contesto operativo.

Il collo di bottiglia non è la qualità del modello, l'accesso ai chip o la potenza di elaborazione. Secondo il World Economic Forum's AI Governance Alliance, la sfida più grande all'implementazione dell'IA su larga scala è la mancanza di "dati puliti, di qualità e utilizzabili", esacerbata da una qualità, accessibilità e validità inaffidabili. Lo definiscono debito di dati: il gemello invisibile del debito tecnico, che rappresenta vasti pool di dati che non possono generare valore perché sono frammentati, non governati o semanticamente opachi.

Ecco la scomoda verità: se la tua organizzazione non riesce a navigare in modo efficiente nel proprio panorama di dati, se gli analisti trascorrono giorni a cercare fonti autorevoli o a riconciliare definizioni contrastanti, allora un agente di IA erediterà le stesse frizioni. L'IA non aggira magicamente la complessità organizzativa; amplifica qualsiasi struttura (o mancanza di struttura) già esistente.

I modelli foundation non differenziano la tua azienda. Né lo fanno i chip o gli strumenti. I tuoi dati aziendali e il contesto che li circonda creano un vantaggio competitivo; le piattaforme esistono per aiutarti a utilizzare tali dati in modo efficace. L'accesso unificato ai dati e alla semantica che li circonda colma il divario verso la prontezza all'IA.

Colmare il divario di prontezza dei dati con un livello semantico

La maggior parte delle telco oggi ha implementato un lakehouse, anche se potrebbe non gestire la stragrande maggioranza dei loro dati, in particolare contenuti non strutturati come log di telemetria di rete, ticket di servizio o contratti PDF. Ciò spiega sia il loro parziale successo nell'IA sia le loro continue difficoltà.

Carica un CSV in un'interfaccia di chat e vedrai quanto rapidamente risponde a domande superficiali. Quell'impressione crolla nel momento in cui poni una domanda complessa o provi a navigare anni di debito tecnico accumulato. Un livello semantico ben progettato sopra i tuoi dati colma il divario tra "demo impressionante" e "IA in produzione".

Questo livello semantico richiede tre unificazioni chiave:

1. Unificare dataset disparati e la loro semantica

I dati risiedono in decine di sistemi: Amdocs, Oracle, Teradata, Snowflake, Salesforce, ServiceNow. Ognuno utilizza le proprie convenzioni di schema, modelli di denominazione e logica di business. Senza un meta-livello che federi e armonizzi queste fonti, gli agenti di IA fanno ipotesi informate su quale "customer_id" in quale sistema rappresenti effettivamente lo stesso cliente. Queste ipotesi falliscono in produzione quando instradano un ticket di supporto all'account sbagliato o consigliano un prodotto che il cliente ha già acquistato.

2. Garantire una governance coerente dai dati ai processi di IA

Secondo la ricerca di Google del 2025 sugli agenti di IA nelle telecomunicazioni, il 35% dei dirigenti delle telco cita la privacy e la sicurezza dei dati come loro principale considerazione nella scelta di un provider LLM. Ciò ha senso dati i requisiti normativi come GDPR, CMMC e la gestione dei dati CUI, oltre ai mandati specifici delle telco: le regole CPNI disciplinano come gli operatori proteggono i record di chiamata e i dati di localizzazione, mentre CALEA richiede agli operatori di proteggere le loro reti da accessi non autorizzati.

La maggiore fonte di paralisi analitica deriva spesso dall'incertezza sui requisiti di sicurezza. Registri amministrativi, contratti, dati dei clienti, documenti di autorizzazione e configurazioni di rete portano ciascuno diversi criteri di conformità, dall'autorizzazione zero-trust alla trasparenza analitica tra i domini. La governance frammentata tra diversi dipartimenti e strumenti crea lacune in cui la conformità fallisce e i progetti si bloccano. Un agente di IA addestrato sui tuoi dati cliente deve rispettare le regole di mascheramento CPNI quando presenta informazioni a un addetto al supporto, anche se interroga cinque diversi sistemi backend.

3. Unificare catalogazione e semantica

Il World Economic Forum osserva che "il successo dei modelli di IA dipende da una solida base di dati in grado di ingerire, correlare e analizzare dati da più fonti, consentendo al contempo un accesso integrato e decentralizzato per diversi casi d'uso". Questa base comprende metadati, lineage, definizioni di business e modelli di utilizzo. Quando un agente di IA interroga i tuoi dati, sa quale delle tre tabelle denominate "network_performance" è autorevole? Comprende che "FTTH" e "fiber to the home" rappresentano lo stesso concetto? È in grado di determinare la qualità e l'attualità dei dati prima di fare una raccomandazione?

Queste non sono domande ipotetiche. Spiegano perché i progetti di IA falliscono in produzione.

Unity Catalog come soluzione unificante

Databricks Unity Catalog affronta queste sfide fornendo un livello unificato di governance e metadati in tutto il tuo lakehouse. Ma la tecnologia da sola non risolve i problemi organizzativi. L'esecuzione richiede chiari standard architetturali attorno ai dati, al deployment e alla governance, e un mandato autorevole che Unity Catalog serva come fonte di verità dell'organizzazione.

A. Unificazione di sistemi disparati

I tuoi dati sono sparsi tra sistemi on-premises, piattaforme cloud come Snowflake, vari strumenti SaaS e più workspace Databricks. Unity Catalog abilita un'architettura lakehouse attraverso molteplici pattern di integrazione, ciascuno adatto a diversi scenari:

  • Delta Sharing per lo scambio di dati cross-organizzazione e cross-cloud senza replicazione
  • Lakeflow Connectors per l'ingestione gestita da sistemi enterprise con freschezza mantenuta
  • Lakehouse Federation per interrogare sistemi esterni in loco senza spostare i dati

Delta Sharing elimina il costo della replica dei dati abilitando la condivisione sicura dei dati, zero-copy, tra organizzazioni e piattaforme; i destinatari interrogano gli stessi file di dati sottostanti nel tuo cloud storage. Le integrazioni native con Salesforce Data Cloud e SAP estendono questo pattern ai dati CRM ed ERP.

I Lakeflow Connectors forniscono un'ingestione gestita da sistemi enterprise, mantenendo la freschezza e preservando il lineage. Questo approccio supera la pura federazione per i dataset interrogati frequentemente ottimizzando lo storage e i pattern di accesso.

Lakehouse Federation utilizza connessioni per leggere e unire dati da sistemi esterni direttamente in Databricks senza replicare tutto. I tuoi agenti di IA possono interrogare tabelle di fatturazione Oracle, analisi Snowflake e lakehouse Databricks in un unico workflow.

Questa architettura garantisce che gli agenti di IA accedano ai dati al livello di aggregazione appropriato. Quando un agente di controversie di fatturazione indaga su un reclamo del cliente, interroga il riepilogo del livello Gold che è stato validato, deduplicato e arricchito con il contesto del cliente, piuttosto che scansionare log di telemetria grezzi con milioni di eventi al secondo. Ciò previene le allucinazioni causate dall'eccessivo sovraccarico dell'agente con dettagli irrilevanti.

B. Interoperabilità dei formati di file

Storicamente, l'attrito tra Delta Lake e Apache Iceberg ha creato divisioni organizzative, con team diversi che si standardizzavano su formati diversi. Ciò ha creato isole di dati che non potevano interagire facilmente, ma la scelta del formato non è il vero ostacolo. Capire cosa deve essere fatto e determinare chi fa il lavoro pesante è molto più importante.

Unity Catalog fornisce supporto di prima classe sia per i formati Delta che Iceberg. Leggi e scrivi su entrambi i formati tramite un'unica interfaccia; le tue tabelle Iceberg esistenti coesistono con le nuove tabelle Delta nello stesso catalogo, interrogate dagli stessi agenti di IA, governate dalle stesse policy. Il dibattito sui formati svanisce quando entrambi i formati partecipano equamente a un livello di governance unificato.

Oltre ai formati di tabella, Unity Catalog mantiene descrizioni complete di tabelle e colonne. Governa i dati non strutturati in Volumi: PDF, log, flussi di telemetria, immagini e file audio ricevono lo stesso tagging e applicazione delle policy delle tabelle strutturate. Ciò consente agli agenti AI di recuperare tabelle strutturate e contesto non strutturato in modo coerente.

C. Organizzazione, rilevabilità e sicurezza

Unity Catalog fornisce governance unificata in tutto il tuo lakehouse. Le descrizioni di tabelle e colonne hanno un duplice scopo: aiutano gli analisti a trovare e comprendere i dati e forniscono ai sistemi AI il contesto semantico per selezionare le tabelle giuste, interpretare il significato delle colonne e applicare le trasformazioni corrette. Senza descrizioni ricche, un agente AI che indovina se "cust_id" corrisponde a "customer_identifier" tra i sistemi commetterà errori che si accumuleranno a valle.

Le principali funzionalità di governance includono:

Il controllo degli accessi basato sugli attributi (ABAC) applica il filtraggio dinamico di righe e colonne in base a tag come pii=true, region=EU o data_owner=finance. Queste policy codificano regole di sensibilità e residenza che vincolano i prompt degli agenti e limitano le decisioni di pianificazione.

Le associazioni di workspace limitano quali workspace possono accedere a cataloghi specifici, riflettendo la semantica dell'ambiente (dev/stage/prod) senza duplicare gli asset. Ciò controlla i contesti di esecuzione degli agenti e previene perdite tra ambienti.

Il mascheramento dinamico mostra viste diverse degli stessi dati in base al ruolo dell'utente. Gli agenti di supporto vedono numeri di previdenza sociale e dettagli di carte di credito mascherati; i team di conformità vedono i valori completi; gli agenti AI ereditano i permessi dell'utente che li ha invocati.

Information Schema fornisce metadati consapevoli dei privilegi, consentendo agli agenti di enumerare gli asset consentiti in modo sicuro in fase di runtime e costruire il contesto dinamicamente.

La registrazione degli audit tramite le tabelle di sistema traccia ogni query, ogni accesso ai dati, ogni inferenza di modello per la conformità alle normative GDPR, CMMC, CPNI e CALEA.

D. Contesto semantico per le prestazioni AI

Qui è dove Unity Catalog trasforma le prestazioni AI. Fornisce un ricco contesto semantico attraverso metadati completi: tag, descrizioni, schemi, grafi di lineage, pattern di utilizzo e Viste Metriche che definiscono KPI canonici.

Le Viste Metriche sono particolarmente importanti. Quando il NOC riporta la disponibilità della rete al 90% e il mazzo esecutivo mostra l'85%, il consiglio chiede quale numero sia corretto. La risposta di solito comporta diverse metodologie di calcolo, diverse finestre temporali, diverse definizioni di "disponibilità" e diverse regole di esclusione per la manutenzione pianificata. Le Viste Metriche dichiarano metriche di business di prima classe, dimensioni e misure. Tutto governato da Unity Catalog, in modo che tutti facciano riferimento allo stesso calcolo. Gli agenti che interrogano "Entrate", "ARPU" o "Utente Attivo" recuperano la definizione autorevole anziché ri-derivare logiche che possono differire tra i team.

Quando chiedi a uno spazio Genie, l'interfaccia di query in linguaggio naturale di Databricks, una domanda come "Qual è il costo medio di implementazione FTTH per regione?", l'AI va oltre il semplice abbinamento di parole chiave. Comprende:

  • Quali tabelle contengono dati di costo autorevoli, tracciati tramite lineage dai sistemi finanziari alle aggregazioni analitiche
  • Che "FTTH" e "fiber to the home" rappresentano lo stesso concetto, codificato in tag semantici e glossari aziendali
  • Quali definizioni regionali utilizza la Finanza rispetto alle Operazioni
  • Se i dati sono sufficientemente aggiornati per la domanda posta

Secondo la ricerca di NVIDIA, il 39% degli intervistati nel settore delle telecomunicazioni cita l'accuratezza dei risultati come il fattore più importante quando si inferiscono modelli AI generativi. Il livello semantico di Unity Catalog affronta direttamente questo problema fornendo all'AI il contesto necessario per fornire risposte accurate all'interno del tuo specifico dominio aziendale.

Ciò si rivela particolarmente critico per gli agenti che eseguono operazioni, non solo rispondono a domande. Per qualsiasi azienda che aspiri al Livello 5 di Rete Autonoma del TM Forum, gli agenti devono essere affidabili. Ciò richiede controlli, guardrail, valutazioni e supervisione degli esperti. Tutto ciò dipende dalla capacità dell'agente di comprendere non solo "quali dati esistono", ma "cosa significano questi dati nel nostro contesto aziendale".

Considera un agente di ottimizzazione della rete che consiglia di spostare il traffico per ridurre la congestione. Senza comprensione semantica, potrebbe proporre una modifica della configurazione che migliora il throughput ma viola gli impegni SLA nei confronti dei clienti aziendali. Con i metadati di Unity Catalog, l'agente sa quali circuiti hanno SLA premium, quali segmenti di clienti tollerano il degrado e quali segmenti di rete alimentano infrastrutture critiche.

Il risultato finale

L'adozione dell'AI significa tradurre le tue funzioni aziendali in un linguaggio funzionante e attuabile che possa essere comunicato ad altri team, a sistemi a valle e ad agenti AI che devono agire per tuo conto.

Non hai bisogno di modelli di base più potenti per far funzionare l'AI. Hai bisogno che i tuoi dati siano pronti per l'AI:

  • Accesso unificato ai dati che possono essere distribuiti in sistemi disparati e isolati.
  • Governance coerente dai dati grezzi agli output AI.
  • Semantica coerente che informa sia gli agenti AI che gli esseri umani.

Unity Catalog fornisce la base di metadati e governance che trasforma i dati frammentati e opachi in una piattaforma pronta per l'AI. Nelle telecomunicazioni, dove il 97% adotta l'AI ma la maggior parte lotta con la qualità dei dati, la strategia vincente non riguarda l'avere il miglior modello. Si tratta di avere la migliore base di dati e l'impegno organizzativo per utilizzarla. Accelera la tua roadmap AI definendo oggi il tuo percorso verso una base di dati pronta per l'AI: Contatta Databricks.

(Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

Ricevi gli ultimi articoli nella tua casella di posta

Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.