Lakeflow Connect amplĆa su cobertura de fuentes de datos y Zerobus introduce una API de escritura directa de alto rendimiento con baja latencia
por Elise Georis, Peter Pogorski, Victoria Bukta y Giselle Goicochea
Todo comienza con buenos datos, por lo que la ingesta suele ser tu primer paso para descubrir información valiosa. Sin embargo, la ingesta presenta desafĆos, como familiarizarse con las complejidades de cada fuente de datos, estar al tanto de esas fuentes a medida que cambian y gobernar todo esto a lo largo del proceso.
Lakeflow Connect facilita la ingesta eficiente de datos, con una interfaz de usuario de apuntar y hacer clic, una API sencilla e integraciones profundas con la Plataforma de Inteligencia de Datos. El aƱo pasado, mĆ”s de 2.000 clientes utilizaron Lakeflow Connect para extraer valor de sus datos.Ā
En esta entrada de blog, repasaremos los aspectos bÔsicos de Lakeflow Connect y resumiremos los últimos anuncios de la Data + AI Summit 2025.
Lakeflow Connect ofrece conectores de ingesta sencillos para aplicaciones, bases de datos, almacenamiento en la nube, buses de mensajes y mĆ”s. Bajo el capó, la ingesta es eficiente, con actualizaciones incrementales y uso optimizado de la API. A medida que se ejecutan tus canalizaciones administradas, nos encargamos de la evolución del esquema, las actualizaciones sin problemas de la API de terceros y la observabilidad integral con alertas integradas.Ā
En la Data + AI Summit de este aƱo, Databricks anunció la Disponibilidad General de Lakeflow, el enfoque unificado para la ingenierĆa de datos en ingesta, transformación y orquestación. Como parte de esto, Lakeflow Connect anunció Zerobus, una API de escritura directa que simplifica la ingesta para IoT, clickstream, telemetrĆa y otros casos de uso similares. TambiĆ©n ampliamos la gama de fuentes de datos compatibles con mĆ”s conectores integrados para aplicaciones empresariales, fuentes de archivos, bases de datos y almacenes de datos, asĆ como datos de almacenamiento de objetos en la nube.
Hicimos un anuncio emocionante presentando Zerobus, un nuevo enfoque innovador para enviar datos de eventos directamente a tu lakehouse, acercÔndote a la fuente de datos. La eliminación de saltos de datos y la reducción de la carga operativa permiten a Zerobus ofrecer escrituras directas de alto rendimiento con baja latencia, proporcionando un rendimiento casi en tiempo real a escala.
Anteriormente, algunas organizaciones utilizaban buses de mensajes como Kafka como capas de transporte al Lakehouse. Kafka ofrece una forma duradera y de baja latencia para que los productores de datos envĆen datos, y es una opción popular al escribir en mĆŗltiples destinos. Sin embargo, tambiĆ©n aƱade complejidad y costos adicionales, asĆ como la carga de administrar otra copia de datos, por lo que es ineficiente cuando tu Ćŗnico destino es el Lakehouse. Zerobus proporciona una solución sencilla para estos casos.Ā
Joby Aviation ya estĆ” utilizando Zerobus para enviar datos de telemetrĆa directamente a Databricks.
Joby puede utilizar nuestros agentes de fabricación con Zerobus para enviar gigabytes de datos de telemetrĆa por minuto directamente a nuestro lakehouse, acelerando el tiempo para obtener información valiosa, todo ello con Databricks Lakeflow y la Plataforma de Inteligencia de Datos.ā ā Dominik Müller, Factory Systems Lead, Joby Aviation, Inc.
Como parte de Lakeflow Connect, Zerobus tambiĆ©n estĆ” unificado con la Plataforma Databricks, por lo que puedes aprovechar capacidades analĆticas y de IA mĆ”s amplias de inmediato. Zerobus se encuentra actualmente en Vista Previa Privada; ponte en contacto con tu equipo de cuentas para acceder anticipadamente.
š„ Mira y aprende mĆ”s sobre Zerobus: Sesión magistral en la Data + AI Summit, con Joby Aviation, "Lakeflow Connect: eliminando saltos en tu arquitectura de streamingā
Se siguen lanzando nuevos conectores totalmente administrados en varios estados de lanzamiento (ver lista completa a continuación), incluidos Google Analytics y ServiceNow, asà como SQL Server, el primer conector de base de datos, todos actualmente en Vista Previa Pública con Disponibilidad General próximamente.
TambiĆ©n hemos seguido innovando para los clientes que desean mĆ”s opciones de personalización y utilizan nuestra solución de ingesta existente, Auto Loader. Procesa de forma incremental y eficiente los nuevos archivos de datos a medida que llegan al almacenamiento en la nube. Hemos lanzado importantes mejoras de costo y rendimiento para Auto Loader, que incluyen listados de directorios 3 veces mĆ”s rĆ”pidos y limpieza automĆ”tica con āCleanSourceā, ambos ahora disponibles de forma general, junto con una detección de archivos mĆ”s inteligente y rentable utilizando eventos de archivos. TambiĆ©n anunciamos soporte nativo para la ingesta de archivos Excel y la ingesta de datos de servidores SFTP, ambos en Vista Previa Privada, disponibles bajo solicitud para acceso anticipado.
Fuentes de datos admitidas:
Dentro de la oferta ampliada de conectores, presentamos conectores basados en consultas que simplifican la ingesta de datos. Estos nuevos conectores te permiten extraer datos directamente de tus sistemas de origen sin modificaciones en la base de datos y funcionan con rƩplicas de lectura donde los registros de captura de cambios de datos (CDC) no estƔn disponibles. Esto se encuentra actualmente en Vista Previa Privada; ponte en contacto con tu equipo de cuentas para acceder anticipadamente.
š„ Mira y aprende mĆ”s sobre Lakeflow Connect: Sesión magistral en la Data + AI Summit, āIntroducción a Lakeflow ConnectāĀ
š„ Mira y aprende mĆ”s sobre la ingesta desde aplicaciones empresariales SaaS: Sesión magistral en la Data + AI Summit con el cliente de Databricks Porsche Holding, "Lakeflow Connect: Ingesta de datos sin problemas desde aplicaciones empresariales"
š„ Mira y aprende mĆ”s sobre conectores de bases de datos: Sesión magistral en la Data + AI Summit, "Lakeflow Connect: Ingesta fĆ”cil y eficiente desde bases de datos"
Continuamos desarrollando capacidades para facilitar el uso de nuestros conectores de ingesta al crear canalizaciones de datos, como parte de la experiencia unificada de ingenierĆa de datos de Lakeflow. Databricks anunció recientemente Lakeflow Connect en Jobs, que te permite crear canalizaciones de ingesta dentro de Lakeflow Jobs. Por lo tanto, si tienes trabajos como centro de tu proceso ETL, esta integración perfecta proporciona una experiencia mĆ”s intuitiva y unificada para administrar la ingesta.Ā
Los clientes pueden definir y administrar sus cargas de trabajo de extremo a extremo, desde la ingesta hasta la transformación, todo en un solo lugar. Lakeflow Connect en Jobs ya estĆ” disponible de forma general.Ā
š„ Mira y aprende mĆ”s sobre Lakeflow Jobs: Sesión de clausura en el Data + AI Summit "Orquestación con Lakeflow Jobs" "Orquestación con Lakeflow Jobs"
Databricks comprende las necesidades de los ingenieros de datos y las organizaciones que impulsan la innovación con sus datos utilizando herramientas de anĆ”lisis e IA. Para ello, Lakeflow Connect ha seguido desarrollando capacidades de ingesta robustas y eficientes con conectores totalmente administrados para caracterĆsticas y API mĆ”s personalizables.Ā
ReciƩn estamos comenzando con Lakeflow Connect. Mantente atento a mƔs anuncios mƔs adelante este aƱo, o contacta a tu equipo de cuentas de Databricks para unirte a una vista previa y obtener acceso anticipado.
Para probar Lakeflow Connect, puedes revisar la documentación, o consultar el Demo Center.Ā Ā
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
SuscrĆbete a nuestro blog y recibe las Ćŗltimas publicaciones directamente en tu bandeja de entrada.