Data Storage 101

07 juil., 2023

Informations sur le stockage d'entreprise

5 défis liés à la gestion des données dans l'écosystème multicloud

Data Storage 101

Les données sont porteuses de nombreuses promesses pour les entreprises. De leurs données, les entreprises peuvent dériver une valeur favorisant la croissance, l'innovation et l'amélioration de l'expérience client.

Alors que le volume et la vitesse de circulation des données ne cessent de progresser, beaucoup d'entreprises sont toujours dans l'incapacité d'exploiter tout le potentiel associé au monde des données actuel. Non seulement elles ne capturent et n’utilisent qu’une partie des données qu’elles génèrent, mais elles peinent aussi à trouver des stratégies de gestion des données adéquates. De ce fait, elles se privent de diverses opportunités et de sources potentielles de revenus.

Évolution des tendances de la gestion des données

Premier défi, les données des entreprises sont dispersées, ce qui ne facilite pas leur stockage et leur gestion. Elles s'étalent souvent sur plusieurs sites (points de terminaison, périphérie et différents clouds).

Dans son récent rapport Rethink Data, Seagate montre que les entreprises, à quelques exceptions près, stockent actuellement leurs données de façon relativement équilibrée entre la périphérie et les clouds publics, privés et sectoriels. De plus, selon un commentaire récent de Gartner, 81 % des entreprises qui utilisent le cloud public travaillent avec au moins deux fournisseurs, ce qui ajoute encore à la complexité.

Le rapport de Seagate, basé sur une enquête de l'IDC, indique que les entreprises ont l'intention de transférer encore plus de données vers des référentiels cloud à l'avenir. Ces changements sont liés aux cinq facteurs principaux suivants :

  • Amélioration de la sécurité des données (mentionnée par 17 % des personnes interrogées)
  • Meilleur accès aux services d'analyse et de gestion des données, tels que l'intelligence artificielle, l'apprentissage automatique et l'IoT (14 %)
  • Meilleure visibilité et facilité de gestion des opérations liées à l'infrastructure informatique (14 %)
  • Réduction des coûts et du coût total de possession de l'infrastructure (11 %)
  • Meilleur accès aux données pour les applications et les unités opérationnelles (10 %)

La transition vers un écosystème multicloud ne représente pas vraiment un défi pour les services informatiques. Ce changement, ainsi que la dispersion croissante des données, affecte directement la capacité des propriétaires d'entreprises à exploiter pleinement la valeur des données et, en conséquence, à augmenter leur chiffre d'affaires.

Le rapport de Seagate identifie les processus suivants comme les principaux freins à la gestion efficace des données :

  • Rendre les données collectées utilisables (39 %)
  • Gérer le stockage des données collectées (37 %)
  • Assurer la collecte des données requises (36 %)
  • Sécuriser les données collectées (35 %)
  • Décompartimenter les données (30 %)

Examinons de plus près chacun de ces défis, en suivant le cycle de vie des données.

Défi 1 : collecte de données

Désormais, les données ne se créent pas seulement dans le centre de données. Le volume des données générées dans le cloud, ainsi que par les technologies émergentes telles que l'IoT et l'edge computing, ne cesse d'augmenter. Cependant, les organisations ne collectent que 56 % des données auxquelles elles ont accès via les opérations, selon le rapport.

Il serait tentant de capturer toutes les données disponibles, mais cela pèserait trop sur l'infrastructure informatique existante et augmenterait les coûts. C'est l'une des raisons pour lesquelles les entreprises doivent repenser la gestion des données. Par exemple, il est préférable d'identifier et de classifier les données au début de leur cycle de vie afin de les filtrer plus tôt et de réduire ainsi les coûts.

Défi 2 : silos de données

L'étalement des données crée des silos gênants pour les experts et les analystes qui cherchent à transformer les données en informations exploitables pour les décisionnaires. La culture d'entreprise peut, elle aussi, créer des silos lorsque des groupes en concurrence souhaitent conserver et contrôler certaines données dans le but d'atteindre des objectifs qui leur sont propres.

Ainsi, pour rendre les silos accessibles, les propriétaires d'entreprises sont amenés à résoudre des équations technologiques et humaines. Il existe des outils automatisés, par exemple des mécanismes d'application de règles unifiées, pour régler le problème technologique, et des systèmes de gestion et de normes globaux pour unifier les équipes.

Défi 3 : sécurité des données

La sécurité des données reste l'une des préoccupations majeures, autant pour les responsables informatiques que pour les dirigeants. La sécurité multicloud, en particulier, pose des problèmes spécifiques, avec des différences de visibilité selon les clouds et une orchestration insuffisante des différents composants de sécurité.

Les environnements vulnérables sont exposés à un risque de violation de données pouvant avoir des conséquences diverses (pertes financières, amendes, atteintes à la réputation et violations de la vie privée). Cela dit, la sécurité est importante à bien d'autres égards. En effet, une sécurité solide est indispensable pour tirer le meilleur parti des données, car elle garantit leur disponibilité permanente et leur intégrité.

Défi 4 : stockage des données

Pour bien gérer les données, il faut disposer d'une visibilité globale sur leur stockage sur site et dans des architectures cloud. Il ne s'agit pas simplement de démocratiser l'accès aux données, mais d'unifier le stockage et de gérer les données via une interface unique, indépendante de leur lieu de stockage.

Généralement, c'est la diversité des technologies de stockage utilisées, notamment lorsque celles-ci prolifèrent et coexistent dans l'entreprise, qui pose problème. De plus, de nombreuses organisations n'établissent pas de stratégie cohérente en matière de stockage des données.

Défi 5 : capacité d'utilisation des données

Le rapport Rethink Data montre que les organisations n'utilisent qu'un tiers des données dont elles disposent. Elles stockent généralement les données collectées dans de grands référentiels pour ensuite les laisser prendre la poussière. Plutôt que d'extraire des informations utiles de ces trésors, elles préfèrent les stocker et les oublier.

Pour pouvoir collecter des données intelligemment, les entreprises doivent se fixer des objectifs et identifier les informations qu'elles souhaitent extraire de leurs données. Une fois les objectifs fixés, les entreprises peuvent facilement identifier les types de données à collecter.

La capacité d'utilisation dépend aussi de l'étendue des volumes de données à traiter. Les organisations doivent également trouver des solutions aux difficultés (complexité des systèmes, outils concurrents, intégration des données) et aux autres facteurs qui limitent leur capacité à obtenir des informations exploitables.

La voie de la réussite

Les propriétaires d'entreprises doivent se concentrer sur les défis liés à la gestion des données dans un environnement multicloud pour pouvoir exploiter tout le potentiel des données qu'ils collectent. Pour y parvenir, ils doivent approfondir leurs stratégies actuelles. Amélioration de l'orchestration des données (des terminaux au cloud, en passant par le cœur) et adoption d'un modèle DataOps sont deux méthodes efficaces pour obtenir de meilleurs résultats.

Le modèle DataOps est une discipline émergente qui vise à améliorer la qualité, la rapidité et la valeur de l'analyse des données. Selon la définition de l'IDC, le DataOps connecte les créateurs de données (qu'il s'agisse de machines ou de personnes qui génèrent des rapports et des informations) aux consommateurs de données, à savoir les décisionnaires.

Le DataOps est un processus qui favorise la collaboration. Il peut inclure une intelligence artificielle pour offrir une vue d'ensemble des processus de l'entreprise et pour mieux corréler les données provenant du cloud, du cœur et de sources périphériques. Grâce à cet outil de gestion avancée des données, les entreprises pourront commencer à résoudre les problèmes posés par la complexité de l'environnement multicloud. Elles auront davantage de données à exploiter et pourront ainsi obtenir des informations stratégiques de meilleure qualité.

L'exploitation pleine et entière des données consiste à savoir transformer des données en informations. Comme le souligne Phil Goodwin, directeur de recherche à l'IDC, dans le rapport Rethink Data : « Qu'elles soient structurées, semi-structurées, non structurées, générées par des personnes ou par des machines, ou stockées dans un centre de données ou sur le cloud, les données sont le nouveau moteur des avantages concurrentiels. »

Pour en savoir plus sur la manière dont les entreprises peuvent exploiter davantage de données, lisez le rapport Rethink Data de Seagate.