
(TierneyMJ/Shutterstock)
L’observabilité des données est une solution transformatrice qui donne aux organisations la possibilité d’exploiter tout le potentiel de leurs données en identifiant, dépannant et résolvant les problèmes de données en temps réel. Cependant, quantifier le retour sur investissement (ROI) de cette nouvelle technologie peut s’avérer difficile.
Il existe cinq domaines clés dans lesquels le retour sur investissement de l’observabilité des données peut cependant être intégré dans une analyse de rentabilisation convaincante, vous permettant de mesurer les avantages tangibles et de présenter des arguments convaincants en faveur d’un investissement.
1. Réduire le coût des solutions locales
Les équipes d’ingénierie des données investissent souvent des heures considérables dans le développement, la maintenance et la validation des règles de qualité des données. La complexité des pipelines de données et la nécessité d’une validation à partir de plusieurs sources compliquent encore davantage le processus, en particulier dans les cas où les données ne sont pas clairement structurées. Les solutions locales manquent de capacités d’apprentissage automatique et peinent à détecter les anomalies.
Mesurer l’impact: Pour calculer le retour sur investissement, tenez compte des facteurs de coûts suivants :
- Nombre d’ingénieurs pour le développement et la maintenance.
- Coûts en équivalent temps plein (ETP) par ingénieur et par an.
Il est essentiel de reconnaître que la construction d’un système d’observabilité des données, tout comme tout logiciel opérationnel, nécessite des ressources d’ingénierie (dans ce cas, l’ingénierie des données), une expertise en science des données pour la modélisation et la construction de la détection des anomalies, une équipe d’assurance qualité dédiée et des ingénieurs DevOps responsables de déployer la solution et assurer son bon fonctionnement.
Bien que les échelles salariales pour ces rôles spécialisés puissent varier, par souci de simplification, nous pouvons calculer une moyenne pour tous les membres de l’équipe.
Formule : ROI = (nombre total d’ingénieurs à construire + nombre d’ingénieurs à maintenir) * ETP ($)
2. Réduire les coûts indirects d’infrastructure
La validation des données dans des bases de données ou des entrepôts de données via des requêtes – une pratique courante dans de nombreuses équipes – peut augmenter considérablement les coûts, en particulier lorsque ces systèmes sont facturés en fonction de leur utilisation. Cela inclut les coûts liés à l’augmentation du nombre de requêtes, au stockage des mesures historiques de qualité des données, ainsi qu’à la gestion et à l’hébergement du cloud. En raison de ces considérations de coûts, de nombreuses organisations choisissent de valider et de surveiller uniquement des échantillons, ce qui entraîne des améliorations limitées de la qualité des données et des résultats incomplets.
Des solutions spécifiques d’observabilité des données sont conçues avec des capacités complètes d’analyse de la qualité des données, de stockage et d’hébergement intégrées à la plateforme. Cette approche élimine le besoin de décharger ces services sur les systèmes surveillés, atténuant ainsi efficacement les dépenses associées. De plus, cette approche offre une évolutivité, permettant la détection des problèmes de qualité des données sur l’intégralité des données plutôt que de s’appuyer uniquement sur des échantillons.
Mesurer l’impact : Décomposez ces coûts en :
- % des frais de dépassement de base de données liés aux requêtes de validation.
- % des coûts de stockage supplémentaires pour la conservation des mesures historiques de qualité des données.
- % d’augmentation des dépenses d’hébergement cloud pour prendre en charge la qualité des données à grande échelle.
Formule : ROI = (coûts annuels de l’entrepôt de données * % de dépassement lié aux requêtes de validation des données) + (coûts de stockage annuels * % de dépassement dans le stockage des métriques de qualité des données historiques) + (coûts annuels de l’infrastructure cloud * % de dépassement dans l’hébergement de la qualité des données à grande échelle).
Dans de nombreuses organisations, les coûts d’infrastructure sont souvent regroupés chez un seul fournisseur qui propose des services complets, notamment l’entreposage de données, le stockage et l’hébergement cloud. Dans de tels cas, le calcul du retour sur investissement implique de multiplier les coûts totaux d’infrastructure par un pourcentage (généralement entre 10 % et 20 %) pour représenter l’impact accru de la surveillance de la qualité des données. Par exemple, si les dépenses annuelles d’une organisation en matière d’entrepôt de données cloud coûtent 1 million de dollars, la mise en œuvre de la qualité et de l’observabilité des données pourrait générer un impact indirect de 10 %, soit l’équivalent de 100 000 dollars par an.
3. Réduire les cas de gestion des incidents
La gestion des incidents est généralement une réponse réactive aux problèmes de qualité des données. S’orienter vers une prévention proactive grâce à l’observabilité des données est idéal mais pas toujours possible. Lorsque les problèmes de qualité des données entraînent des inexactitudes dans les systèmes en aval, affectant les applications métier ou même atteignant les clients, les équipes commerciales sont souvent impliquées dans l’identification, l’investigation et la résolution des problèmes. Cela a un impact sur l’organisation dans son ensemble et doit être pris en compte dans l’analyse du retour sur investissement des solutions d’observabilité des données.
Mesurer l’impact : Les équipes chargées des données catégorisent souvent la gestion des incidents en fonction des niveaux de gravité. Par exemple, une entreprise classe ses incidents liés aux données comme suit :
○ Quantité : 0-1 par sprint
○ Délai de résolution : 2-3 jours
○ Nombre de personnes impliquées : 1
○ Quantité : 3-4/trimestre
○ Délai de résolution : 3-4 jours
○ Nombre de personnes à résoudre : 2
○ Quantité : 1-2/an
○ Délai de résolution : 5 à 10 jours
○ Nombre de personnes à résoudre : 10 personnes
Pour simplifier, vous pouvez regrouper les incidents et calculer les moyennes pour tous les inducteurs de coûts.
- Nombre moyen d’incidents par an.
- Délai moyen pour résoudre les incidents en heures.
- Coût horaire moyen pour détecter et résoudre correctement ces problèmes.
Formule : ROI = (Nombre moyen d’incidents par an) * (Délai moyen pour détecter et résoudre le
incident en heures) * (Coût horaire moyen)
4. Créer des données fiables pour une meilleure prise de décision
Alors que les trois premiers gains de retour sur investissement se sont principalement concentrés sur les économies de coûts, les deux derniers se penchent sur les augmentations potentielles de revenus liées à la mise en œuvre de l’observabilité des données.
Déterminer dans quelle mesure l’amélioration des revenus est directement attribuée à l’observabilité des données peut s’avérer complexe. Par exemple, si l’observabilité des données améliore la qualité des données clients et conduit à une meilleure rétention, ce n’est pas uniquement dû à l’observabilité ; d’autres facteurs comme la compétence de votre personnel ou les récentes améliorations du produit peuvent être entrés en jeu.
Pour calculer le retour sur investissement, définissez la portée du problème et évaluez l’impact potentiel de l’observabilité des données sur les améliorations.
Mesurer l’impact : Définissez l’énoncé du problème, la valeur de base du problème et la partie amélioration qui peut être attribuée à l’observabilité des données. Décomposons-le avec un exemple.
- Énoncé du problème : « Des données inexactes entravent notre [business objective, e.g., customer retention].»
- Valeur de référence : « Des données inexactes entraînent des coûts annuels de X $ pour l’organisation. »
- Portée adressable : « Nous prévoyons d’améliorer cela de Y %, reconnaissant qu’une certaine perte de revenus est inhérente à notre activité en raison de facteurs allant au-delà de la qualité des données. »
- Amélioration attendue de l’observabilité des données : « Nous prévoyons qu’un Z % de l’amélioration peut être attribué à une solution d’observabilité des données. »
Formule : ROI = valeur de référence ($X) * Portée adressable (Y %) * Amélioration attendue (Z %)
Il est important de noter que si l’observabilité des données contribue à cette amélioration, elle ne constitue qu’un élément parmi plusieurs facteurs affectant la qualité des données. D’autres facteurs incluent l’amélioration des compétences de l’équipe, le perfectionnement des processus, la réalisation de recherches approfondies et l’intégration d’outils complémentaires parallèlement à l’observabilité des données.
5. Accélération du délai de rentabilisation des produits de données
Les produits de données gagnent en popularité, mais leur succès repose sur des données de haute qualité. L’observabilité des données promet un moyen systématique de détecter et d’identifier les problèmes de données en temps opportun. Cette approche accélère non seulement la mise sur le marché des produits de données, mais établit également des processus d’analyse et de correction en temps réel pour garantir la fiabilité de ces produits lorsqu’ils sont accessibles par les consommateurs.
Mesurer l’impact : Pour calculer l’impact sur les produits de données, il est essentiel d’évaluer le délai de mise sur le marché résultant de problèmes de qualité et de cohérence des données. Certains outils d’observabilité des données offrent une interface low-code et sans code qui favorise la collaboration entre les utilisateurs métiers et techniques. Cela accélère le développement et les tests de la qualité des données, vous aidant ainsi à atteindre plus rapidement vos objectifs de revenus. Ces outils utilisent l’apprentissage automatique (ML) pour évaluer la qualité des données et identifier les valeurs aberrantes et les anomalies, rationalisant ainsi un processus qui autrement prendrait du temps et dépendrait de conjectures.
De plus, ces plateformes d’observabilité exploitent les tendances des données historiques pour détecter les problèmes de données inattendus en temps réel. Cette capacité de surveillance en temps réel permet aux équipes produit et d’ingénierie de garantir la santé et la fiabilité continues des produits de données, contribuant ainsi à la croissance des revenus.
Formule : ROI = Revenu annuel des produits de données par an * délai de mise sur le marché dû à des données incorrectes
Pensées finales
Ce ne sont là que cinq domaines dans lesquels l’observabilité des données génère des avantages commerciaux substantiels. Même si tous les cas ne s’appliquent pas à toutes les organisations, chacun joue un rôle essentiel dans la réalisation de la valeur potentielle de l’observabilité des données. Lors de l’élaboration de votre analyse de rentabilisation, examinez ce cadre avec vos équipes de direction et tenez compte de tous les facteurs de coûts et opportunités de génération de revenus. Documentez et décomposez le retour sur investissement total dans un calendrier clair de mise en œuvre. L’observabilité des données n’est pas seulement une dépense ; c’est un investissement. Il réduit le temps et les ressources consacrés au dépannage et à la correction des problèmes de données, réduit les coûts d’infrastructure, accélère les produits de données et, en fin de compte, vous aide à augmenter vos revenus.
À propos de l’auteur : Farnaz Erfan est la fondatrice responsable de la croissance chez Telmaïun fournisseur d’outils d’observabilité. Farnaz est un leader en matière de produits et de commercialisation avec plus de 20 ans d’expérience dans les données et l’analyse. Elle a passé sa carrière à piloter des stratégies de produits et de croissance dans des startups et des entreprises telles que Telmai, Marqeta, Paxata, Birst, Pentaho et IBM. Farnaz est titulaire d’un baccalauréat ès sciences en informatique de l’Université Purdue et a passé la première partie de sa carrière en tant qu’ingénieur logiciel à créer des produits de données.
Articles connexes:
Il existe quatre types d’observabilité des données. Lequel est bon pour toi?
L’observabilité est prête pour une percée en 2023 : prédiction
Les sociétés de capital-risque ouvrent le chéquier aux startups d’observabilité