Accueil Big Data Cloudera dévoile la prochaine phase d’Open Data Lakehouse pour débloquer l’IA d’entreprise

Cloudera dévoile la prochaine phase d’Open Data Lakehouse pour débloquer l’IA d’entreprise

0
Cloudera dévoile la prochaine phase d’Open Data Lakehouse pour débloquer l’IA d’entreprise


(INGARA/Shutterstock)

Dans le monde actuel axé sur les données, la manière dont nous stockons, analysons et gérons les données est importante pour les organisations. Data Lakehouse, qui utilise les meilleurs aspects des lacs de données et des entrepôts de données, offre aux organisations un moyen de stocker d’énormes volumes de données brutes tout en fournissant un environnement structuré pour des analyses complexes.

Pour aider à libérer tout le potentiel des lacs de données, Cloudera, une société de données d’entreprise basée sur l’IA, a annoncé la prochaine phase de son lac de données ouvert sur un cloud privé. La société est désormais devenue le seul fournisseur à proposer un Lakehouse de données ouvertes avec Apache Iceberg pour les cloud privés et publics.

Une étude récente de Cloudera a montré que plus de la moitié des organisations (53 %) aux États-Unis utilisent actuellement GenAI et 36 % supplémentaires en sont aux premiers stades d’exploration de la mise en œuvre de GenAI. Alors que l’adoption de GenAI est en hausse, l’étude a révélé que 84 % des décideurs en matière de stratégie et de gestion des données sont préoccupés par les problèmes de confidentialité, de sécurité et de conformité des données liés à l’utilisation de GenAI.

Des préoccupations similaires ont été soulignées dans plusieurs autres études, notamment État de la gestion des données non structurées en 2023 enquête menée par Komprise, et le État de l’éthique et de la confiance dans la technologie rapport de Deloitte.

La menace imminente d’une réglementation stricte sur la mise en œuvre de GenAI et les questions éthiques ont ajouté aux inquiétudes. L’adoption de GenAI est au point mort alors que les entreprises trouvent des moyens de surmonter certains défis.

Cloudera propose une solution en fournissant un Lakehouse ouvert avec Apache Iceberg sur des Clouds privés. Les organisations peuvent désormais résoudre le problème de la mise à l’échelle des déploiements AL d’entreprise afin de tirer une plus grande valeur de leurs données.

Le format de table hautes performances d’Apache Icebergs permet aux organisations d’appliquer l’IA à de grands volumes de données pour les environnements cloud et sur site. Cela permet aux organisations de créer de nouveaux cas d’utilisation. Le déploiement LLM isolé proposé par Cloudera offre une sécurité et une confidentialité des données améliorées, ainsi que des coûts d’exploitation réduits et des performances améliorées.

« La mission de Cloudera est de permettre aux clients de transformer leurs données n’importe où en informations exploitables en les intégrant à l’IA », a déclaré Dipto Chakravarty, directeur des produits chez Cloudera. « En leur fournissant une base de données fiable pour l’analyse, cette prochaine phase de solutions cloud natives ouvre des possibilités infinies pour créer des applications d’IA innovantes. »

Selon Chakravarty, pour que les organisations puissent tirer le maximum de valeur de leur pile technologique, elles ont besoin d’une stratégie de gestion des données capable de « transformer des données complexes n’importe où en informations exploitables ».

La maison de lac de données ouvertes de Cloudera prendra en charge la communauté Apache Iceberg à croissance rapide. Le format de table ouverte devrait continuer à croître car il permet aux entreprises d’utiliser et de gérer plus facilement leurs données. L’un des principaux avantages de ce format est qu’il permet aux entreprises de devenir propriétaires de leurs données. Cela signifie que même s’ils migrent vers d’autres technologies ou vers d’autres fournisseurs à l’avenir, ils conserveront l’entière propriété de leurs données.

Avec sa meilleure interopérabilité, la prise en charge des évolutions de schéma, les performances des requêtes et l’efficacité du stockage, les données ouvertes au format table ouverte pourraient devenir une exigence fondamentale pour les entreprises.

Cloudera a également annoncé des mises à jour supplémentaires de sa plate-forme, notamment une prise en charge étendue de l’intégration avec plusieurs langages de programmation, logiciels et plates-formes, notamment Oracle 8.8 et Python 3.10. Les nouvelles fonctionnalités d’Apache Zone faciliteront l’évolutivité à moindre coût. La plate-forme bénéficie également de mises à niveau sans temps d’arrêt et d’améliorations de sécurité telles que Transport Layer Security (TLS) 1.2.

Articles connexes

Le Data Lakehouse est à l’horizon, mais la navigation n’est pas encore fluide

Le Data Lakehouse mènera-t-il à un verrouillage de type entrepôt ?

Il existe de nombreux chemins vers le Data Lakehouse. Choisis sagement

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici