Ir al contenido principal
Soluciones

Preparación de IA en telecomunicaciones

Cerrando la brecha entre datos e inteligencia

por Stephen Hage, Keerthi Josyula y Michael Zhang

  • La paradoja de la IA en las telecomunicaciones: el 97% de los ejecutivos de telecomunicaciones adoptan la IA, pero las iniciativas se estancan antes de la producción a escala debido a la "deuda de datos" —datos fragmentados, no gobernados y semánticamente opacos—, no a la falta de calidad del modelo. Un agente de IA podría aprobar física de nivel de posgrado, pero aún así fallar en la comprensión de términos específicos de la industria como "sitio" o "CDR" en su contexto operativo.
  • El puente semántico: la solución es establecer Databricks Unity Catalog como la fuente de verdad autorizada. Implementa una capa semántica unificada sobre el Lakehouse, unificando sistemas dispares a través de Lakehouse Federation y proporcionando a los agentes de IA el rico contexto (Vistas de Métricas, linaje, glosarios de negocios) necesario para pasar de "demostración impresionante" a producción confiable.
  • Gobernanza como catalizador: esta capa de metadatos unificada permite una gobernanza consistente de extremo a extremo —desde los datos sin procesar hasta la salida de IA— utilizando el Control de Acceso Basado en Atributos (ABAC) y el enmascaramiento dinámico. Esto es fundamental para mantener el cumplimiento de las estrictas regulaciones CPNI, GDPR y CALEA y garantizar que los agentes de IA realicen tareas operativas complejas con precisión.

El desafío de la adopción de IA en las telcos

Según el informe "State of AI in Telecommunications 2025" de NVIDIA, el 97% de los ejecutivos de telecomunicaciones evalúan o adoptan la IA para mejorar la experiencia del cliente, optimizar las operaciones de red y reducir costos. Muchos han superado las fases piloto y ya obtienen un ROI positivo. Sin embargo, la promesa de la IA sigue superando su entrega.

Aquí radica la paradoja: las empresas de telecomunicaciones nunca han tenido tantos datos, pero sus iniciativas de IA se estancan constantemente antes de alcanzar la escala de producción. La tecnología móvil evoluciona de 3G a 4G, 5G y más allá. Las innovaciones de banda ancha extraen más rendimiento de la fibra existente. Los MVNO revenden capacidad, las empresas de torres coordinan miles de sitios y los operadores regionales modernizan la infraestructura heredada. El volumen de datos crece exponencialmente en todos ellos, y estos esfuerzos no cumplen sus promesas.

¿Por qué? Si bien los modelos fundacionales acaparan los titulares por aprobar el "Humanity's Last Exam", un punto de referencia de 2.500 preguntas que abarca matemáticas, lenguas antiguas y subcampos altamente especializados, su negocio necesita predecir la rotación de clientes (churn), personalizar mensajes, respaldar el análisis de causa raíz para interrupciones de red y resolver mil desafíos operativos más. Un modelo que sobresale en física de nivel de posgrado aún podría fallar espectacularmente al comprender qué significan "sitio", "torre" o "CDR" en su contexto operativo.

El cuello de botella no es la calidad del modelo, el acceso a los chips o la potencia de procesamiento. Según la Alianza de Gobernanza de IA del Foro Económico Mundial, el mayor desafío para implementar la IA a escala es la falta de "datos limpios, de calidad y utilizables", exacerbada por la calidad, accesibilidad y validez poco fiables. Lo llaman deuda de datos: el gemelo invisible de la deuda técnica, que representa vastos conjuntos de datos que no pueden generar valor porque están fragmentados, no están gobernados o son semánticamente opacos.

Aquí está la verdad incómoda: si su organización no puede navegar eficientemente por su propio panorama de datos, si los analistas pasan días buscando fuentes autorizadas o reconciliando definiciones contradictorias, entonces un agente de IA heredará esas mismas fricciones. La IA no evita mágicamente la complejidad organizacional; amplifica la estructura (o la falta de ella) que ya existe.

Los modelos fundacionales no diferencian su negocio. Tampoco lo hacen los chips o las herramientas. Sus datos empresariales y el contexto que los rodea crean una ventaja competitiva; existen plataformas para ayudarle a utilizar esos datos de manera eficaz. El acceso unificado a los datos y la semántica que los rodea cierra la brecha hacia la preparación para la IA.

Cerrando la brecha de preparación de datos con una capa semántica

La mayoría de las empresas de telecomunicaciones han implementado hoy un lakehouse, aunque es posible que no contenga la gran mayoría de sus datos, en particular contenido no estructurado como registros de telemetría de red, tickets de servicio o contratos en PDF. Eso explica tanto su éxito parcial en IA como sus continuos obstáculos.

Suba un CSV a una interfaz de chat y verá qué tan rápido responde a preguntas superficiales. Esa impresión se desmorona en el momento en que pregunta algo complicado o intenta navegar por años de deuda técnica acumulada. Una capa semántica bien elaborada sobre sus datos cierra la brecha entre la "demostración impresionante" y la "IA en producción".

Esta capa semántica requiere tres unificaciones clave:

1. Unificación de conjuntos de datos dispares y su semántica

Los datos residen en docenas de sistemas: Amdocs, Oracle, Teradata, Snowflake, Salesforce, ServiceNow. Cada uno utiliza sus propias convenciones de esquema, patrones de nomenclatura y lógica de negocio. Sin una meta-capa que federé y armonice estas fuentes, los agentes de IA hacen conjeturas educadas sobre qué "customer_id" en qué sistema representa realmente al mismo cliente. Estas conjeturas fallan en producción cuando dirigen un ticket de soporte a la cuenta incorrecta o recomiendan un producto que el cliente ya compró.

2. Garantizar una gobernanza coherente desde los datos hasta los procesos de IA

Según la investigación de Google de 2025 sobre agentes de IA en telecomunicaciones, el 35% de los ejecutivos de telecomunicaciones citan la privacidad y seguridad de los datos como su principal consideración al elegir un proveedor de LLM. Esto tiene sentido dadas las exigencias regulatorias como GDPR, CMMC y el manejo de datos CUI, además de los mandatos específicos de las telcos: las reglas CPNI rigen cómo los operadores protegen los registros de llamadas y los datos de ubicación, mientras que CALEA exige a los operadores proteger sus redes contra el acceso no autorizado.

La mayor fuente de parálisis de análisis a menudo proviene de la incertidumbre sobre los requisitos de seguridad. Los registros administrativos, los contratos, los datos de los clientes, los documentos de permisos y las configuraciones de red conllevan diferentes criterios de cumplimiento, desde la autorización de confianza cero hasta la transparencia analítica entre dominios. La gobernanza fragmentada entre diferentes departamentos y herramientas crea brechas donde el cumplimiento falla y los proyectos se estancan. Un agente de IA entrenado con sus datos de clientes debe respetar las reglas de enmascaramiento CPNI al presentar información a un representante de soporte, incluso si consulta a través de cinco sistemas backend diferentes.

3. Unificación de catalogación y semántica

El Foro Económico Mundial señala que "el éxito de los modelos de IA depende de una base de datos sólida que pueda ingerir, correlacionar y analizar datos de múltiples fuentes, al tiempo que permite un acceso integrado y descentralizado para diversos casos de uso". Esta base incluye metadatos, linaje, definiciones de negocio y patrones de uso. Cuando un agente de IA consulta sus datos, ¿sabe cuál de las tres tablas llamadas "network_performance" es la autorizada? ¿Entiende que "FTTH" y "fiber to the home" representan el mismo concepto? ¿Puede determinar la calidad y actualidad de los datos antes de hacer una recomendación?

Estas no son preguntas hipotéticas. Explican por qué los proyectos de IA fallan en producción.

Unity Catalog como la solución unificadora

Databricks Unity Catalog aborda estos desafíos al proporcionar una capa unificada de gobernanza y metadatos en todo su lakehouse. Pero la tecnología por sí sola no resuelve los problemas organizacionales. La ejecución requiere estándares arquitectónicos claros en torno a los datos, la implementación y la gobernanza, y un mandato autoritativo de que Unity Catalog sirva como la fuente de verdad de la organización.

A. Unificación de sistemas dispares

Sus datos están dispersos en sistemas locales (on-premises), plataformas en la nube como Snowflake, varias herramientas SaaS y múltiples espacios de trabajo de Databricks. Unity Catalog habilita una arquitectura de lakehouse a través de múltiples patrones de integración, cada uno adecuado para diferentes escenarios:

  • Delta Sharing para el intercambio de datos entre organizaciones y entre nubes sin replicación
  • Lakeflow Connectors para la ingesta administrada desde sistemas empresariales con frescura mantenida
  • Lakehouse Federation para consultar sistemas externos en su lugar sin mover datos

Delta Sharing elimina el costo de la replicación de datos al permitir el intercambio de datos seguro y sin copias entre organizaciones y plataformas; los destinatarios consultan los mismos archivos de datos subyacentes en su almacenamiento en la nube. Las integraciones nativas con Salesforce Data Cloud y SAP extienden este patrón a datos de CRM y ERP.

Lakeflow Connectors proporciona ingesta administrada desde sistemas empresariales, manteniendo la frescura y preservando el linaje. Este enfoque supera a la federación pura para conjuntos de datos consultados con frecuencia al optimizar los patrones de almacenamiento y acceso.

Lakehouse Federation utiliza conexiones para leer y unir datos de sistemas externos directamente en Databricks sin replicar todo. Sus agentes de IA pueden consultar tablas de facturación de Oracle, análisis de Snowflake y lakehouses de Databricks en un solo flujo de trabajo.

Esta arquitectura garantiza que los agentes de IA accedan a los datos en el nivel de agregación apropiado. Cuando un agente de disputas de facturación investiga una queja de un cliente, consulta el resumen de la capa Gold que ha sido validado, deduplicado y enriquecido con el contexto del cliente, en lugar de escanear registros de telemetría brutos con millones de eventos por segundo. Esto previene las alucinaciones causadas por abrumar al agente con detalles irrelevantes.

B. Interoperabilidad de formatos de archivo

Históricamente, la fricción entre Delta Lake y Apache Iceberg creó divisiones organizacionales, con diferentes equipos estandarizando en diferentes formatos. Esto creó islas de datos que no podían interactuar fácilmente, pero la elección del formato no es el verdadero obstáculo. Descubrir qué se necesita hacer y determinar quién realiza el trabajo pesado importa mucho más.

Unity Catalog proporciona soporte de primera clase para ambos formatos, Delta e Iceberg. Lee y escribe en cualquiera de los formatos a través de una única interfaz; sus tablas Iceberg existentes coexisten con nuevas tablas Delta en el mismo catálogo, consultadas por los mismos agentes de IA, gobernadas por las mismas políticas. El debate sobre el formato se desvanece cuando ambos formatos participan por igual en una capa de gobernanza unificada.

Además de los formatos de tabla, Unity Catalog mantiene descripciones completas de tablas y columnas. Gobierna datos no estructurados en Volúmenes: los archivos PDF, registros, flujos de telemetría, imágenes y audio reciben el mismo etiquetado y aplicación de políticas que las tablas estructuradas. Esto permite a los agentes de IA recuperar tablas estructuradas y contexto no estructurado de manera coherente.

C. Organización, descubribilidad y seguridad

Unity Catalog proporciona gobernanza unificada en todo su lakehouse. Las descripciones de tablas y columnas tienen un doble propósito: ayudan a los analistas a encontrar y comprender los datos, y proporcionan a los sistemas de IA el contexto semántico para seleccionar las tablas correctas, interpretar el significado de las columnas y aplicar las transformaciones adecuadas. Sin descripciones enriquecidas, un agente de IA que adivine si "cust_id" coincide con "customer_identifier" en diferentes sistemas cometerá errores que se acumularán aguas abajo.

Las capacidades clave de gobernanza incluyen:

El Control de Acceso Basado en Atributos (ABAC) aplica el filtrado dinámico de filas y columnas basado en etiquetas como pii=true, region=EU, o data_owner=finance. Estas políticas codifican reglas de sensibilidad y residencia que vinculan las indicaciones del agente y restringen las decisiones de planificación.

Las Vinculaciones de Espacios de Trabajo restringen qué espacios de trabajo pueden acceder a catálogos específicos, reflejando la semántica del entorno (dev/stage/prod) sin duplicar activos. Esto controla los contextos de ejecución del agente y previene fugas entre entornos.

El Enmascaramiento Dinámico muestra diferentes vistas de los mismos datos según el rol del usuario. Los agentes de soporte ven números de Seguridad Social y detalles de tarjetas de crédito enmascarados; los equipos de cumplimiento ven los valores completos; los agentes de IA heredan los permisos del usuario que los invocó.

Information Schema proporciona metadatos conscientes de los privilegios, lo que permite a los agentes enumerar activos permitidos de forma segura en tiempo de ejecución y construir contexto dinámicamente.

El Registro de Auditoría a través de tablas del sistema rastrea cada consulta, cada acceso a datos, cada inferencia de modelo para cumplir con las regulaciones GDPR, CMMC, CPNI y CALEA.

D. Contexto semántico para el rendimiento de la IA

Aquí es donde Unity Catalog transforma el rendimiento de la IA. Proporciona un contexto semántico enriquecido a través de metadatos completos: etiquetas, descripciones, esquemas, grafos de linaje, patrones de uso y Metric Views que definen KPIs canónicos.

Las Metric Views son particularmente importantes. Cuando el NOC informa una disponibilidad de red del 90% y la presentación ejecutiva muestra el 85%, la junta pregunta cuál número es correcto. La respuesta generalmente implica diferentes metodologías de cálculo, diferentes ventanas de tiempo, diferentes definiciones de "disponibilidad" y diferentes reglas de exclusión para el mantenimiento planificado. Las Metric Views declaran métricas de negocio de primera clase, dimensiones y medidas. Todo gobernado por Unity Catalog, para que todos hagan referencia al mismo cálculo. Los agentes que consultan "Ingresos", "ARPU" o "Usuario Activo" recuperan la definición autorizada en lugar de volver a derivar lógica que puede diferir entre equipos.

Cuando le hace una pregunta a un espacio Genie, la interfaz de consulta en lenguaje natural de Databricks, como "¿Cuál es el costo promedio de despliegue de FTTH por región?", la IA va más allá de la simple coincidencia de palabras clave. Entiende:

  • Qué tablas contienen datos de costos autorizados, rastreados a través del linaje desde sistemas financieros hasta agregaciones analíticas
  • Que "FTTH" y "fiber to the home" representan el mismo concepto, codificado en etiquetas semánticas y glosarios de negocio
  • Qué definiciones regionales utiliza Finanzas frente a Operaciones
  • Si los datos son lo suficientemente recientes para la pregunta que se está haciendo

Según la investigación de NVIDIA, el 39% de los encuestados del sector de las telecomunicaciones citan la precisión de los resultados como el factor más importante al inferir modelos de IA generativa. La capa semántica de Unity Catalog aborda directamente esto al dar a la IA el contexto que necesita para ofrecer respuestas precisas dentro de su dominio de negocio específico.

Esto resulta especialmente crítico para los agentes que realizan operaciones, no solo responden preguntas. Para cualquier empresa que aspire al Nivel 5 de Red Autónoma del TM Forum, los agentes deben ser confiables. Eso requiere controles, salvaguardas, evaluaciones y supervisión de expertos. Todo depende de que el agente comprenda no solo "qué datos existen", sino "qué significan estos datos en nuestro contexto de negocio".

Considere un agente de optimización de red que recomienda cambiar el tráfico para reducir la congestión. Sin comprensión semántica, podría proponer un cambio de configuración que mejore el rendimiento pero viole los compromisos del SLA con los clientes empresariales. Con los metadatos de Unity Catalog, el agente sabe qué circuitos tienen SLAs premium, qué segmentos de clientes toleran la degradación y qué segmentos de red alimentan la infraestructura crítica.

La conclusión

La adopción de la IA significa traducir sus funciones de negocio a un lenguaje operativo y accionable que pueda comunicarse a otros equipos, a sistemas posteriores y a agentes de IA que necesiten actuar en su nombre.

No necesita modelos fundacionales más potentes para que la IA funcione. Necesita que sus datos estén listos para la IA:

  • Acceso unificado a datos que pueden estar distribuidos en sistemas dispares y aislados.
  • Gobernanza consistente desde los datos brutos hasta los resultados de la IA.
  • Semántica coherente que informa tanto a los agentes de IA como a los humanos.

Unity Catalog proporciona la base de metadatos y gobernanza que transforma los datos fragmentados y opacos en una plataforma lista para la IA. En telecomunicaciones, donde el 97% adopta la IA pero la mayoría tiene problemas con la calidad de los datos, la estrategia ganadora no se trata de tener el mejor modelo. Se trata de tener la mejor base de datos y el compromiso organizacional para usarla. Acelere su hoja de ruta de IA definiendo hoy mismo su camino hacia una base de datos lista para la IA: Contacte con Databricks.

(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original

Recibe las últimas publicaciones en tu bandeja de entrada

Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.