Nous sommes ravis d’annoncer que nous avons finalisé notre acquisition d’Arcionun fournisseur leader de technologies de réplication de données en temps réel.
Les capacités d’Arcion permettront à Databricks de fournir des solutions natives pour répliquer et ingérer des données provenant de diverses bases de données et applications SaaS, permettant ainsi aux clients de se concentrer sur le travail réel de création de valeur et d’informations basées sur l’IA à partir de leurs données. Nous travaillons en étroite collaboration avec l’équipe d’Arcion depuis plusieurs années, non seulement en tant que partenaire Databricks, mais également en tant que Entreprises Databricks société de portefeuille. Avec cette annonce, nous accueillons officiellement l’équipe dans la famille Databricks.
Ingestion de données en temps réel et réplication de bases de données
Notre mission chez Databricks est de démocratiser les données et l’IA pour chaque organisation. Pour remplir notre mission, nous avons construit la plateforme Databricks Lakehouse pour offrir une plateforme unifiée, ouverte et évolutive pour toutes vos données, analyses et IA. Plus de 10 000 organisations dans le monde font confiance à Lakehouse et ont obtenu le meilleur rapport prix/performances de leur catégorie, ainsi que des capacités de gouvernance, de sécurité et d’IA unifiées.
Cependant, la valeur des plateformes dépend de la valeur des données qu’elles contiennent. Avant que les organisations puissent profiter pleinement des avantages de Lakehouse, elles doivent ingérer, répliquer ou migrer des données à partir de différentes bases de données et applications sources. Le mouvement des données à partir de différentes sources nécessite une connaissance spécialisée de chaque système source, comme les nuances des dialectes SQL uniques, les stratégies d’ingestion, les protocoles de journaux binaires et les défis de sécurité. Non seulement ces problèmes entraînent des frictions importantes dans le développement des pipelines, mais ils créent également des frais opérationnels élevés en raison de pipelines fragiles et de processus complexes et sujets aux erreurs qui se manifestent souvent par des retards frustrants dans la valorisation des données et un coût total de possession plus élevé.
Arcion permettra à Databricks de fournir nativement une solution évolutive, facile à utiliser et rentable pour ingérer des données en temps réel et à la demande provenant de diverses sources de données d’entreprise. L’architecture de pipeline CDC (Change Data Capture) sans code et sans maintenance d’Arcion permet des cas d’utilisation d’analyse, de streaming et d’IA en aval via des connecteurs natifs à plus de 20 systèmes de bases de données d’entreprise, tels qu’Oracle, SQL Server, Teradata et Snowflake, ainsi que ainsi que des applications SaaS telles que Salesforce, SAP et Workday. Chacun de ces connecteurs permet une conversion automatique du schéma et est adapté aux nuances particulières du système source. Cela minimise la charge opérationnelle sur l’infrastructure des clients et permet aux équipes de déployer des pipelines de production en quelques minutes. Enfin, Arcion réduit encore davantage les frais généraux de DevOps grâce à la mise à l’échelle automatique intégrée, à la haute disponibilité et à la surveillance en direct.

Une équipe de classe mondiale
Arcion a été fondée par le technologue de bases de données et actuel CTO Rajkumar Sen. Il a ensuite été rejoint par le PDG Gary Hagmueller, un vétéran des technologies de données et d’IA. La vision de Raj consistant à rendre le CDC basé sur les journaux simple et performant a transformé Arcion en une solution leader du secteur avec l’aide d’une équipe qui apporte plus de 140 années d’expérience combinées dans le domaine de la réplication de données. L’équipe d’experts d’Arcion sera un atout majeur pour aider à accélérer le parcours de nos clients vers Lakehouse, et nous sommes ravis d’accueillir Raj et son équipe chez Databricks.
Et après
Nous souhaitons permettre à nos clients d’accéder facilement et rapidement aux sources de données pertinentes dans leur entreprise. Plus tôt cette année, nous avons annoncé Fédération Lakehouse pour permettre aux organisations de créer une architecture de maillage de données hautement évolutive et performante avec une gouvernance unifiée. Lakehouse Federation permet aux organisations d’exposer, d’interroger et de gérer facilement des données cloisonnées, quel que soit leur emplacement, en tant qu’extension de leur Lakehouse.
À l’ère de l’IA générative, il est encore plus vrai que les données constituent l’atout le plus précieux de chaque entreprise. Pour la plupart des clients, la grande quantité de données contenues dans des bases de données, des entrepôts de données et des applications SaaS existants présente un énorme potentiel pour leur donner un avantage concurrentiel.
Avec l’intégration de Databricks et des capacités de réplication de données d’Arcion, nous allons accélérer encore la promesse de la plateforme Databricks Lakehouse pour nos clients de tous les secteurs afin de rendre rapidement disponibles des décennies de données pour l’analyse traditionnelle ainsi que pour les applications d’IA générative. Surveillez dans les mois à venir les annonces de nombreuses fonctionnalités basées sur Arcion qui simplifieraient considérablement la réplication et l’ingestion de données.