Como as empresas devem se preparar para obter o máximo de seus investimentos em IA?
13 out, 2025
Não há sucesso em IA sem dados, muitos deles.
E não há conjuntos de dados massivos sem armazenamento de dados amplo e eficiente.
Os dados sustentam a IA, e os discos rígidos de capacidade massiva sustentam os dados.
Esses insights são trazidos à tona em uma pesquisa de 2025 da firma de pesquisa Recon Analytics.
A pesquisa global comissionada pela Seagate entrevistou 1.062 participantes. Eles são compradores e tomadores de decisões de armazenamento de TI que trabalham em funções de infraestrutura de armazenamento para empresas que reportam mais de US$ 10 milhões em receita anual, têm mais de 50 terabytes de uso de armazenamento, adotaram a IA ou planejam adotar a IA nos próximos três anos, e estão localizadas nos Estados Unidos, China, Reino Unido, Coreia do Sul, Singapura, França, Índia, Japão, Taiwan e Alemanha.
A pesquisa se concentrou nos efeitos da adoção da IA nas prioridades de infraestrutura, retenção de dados e gerenciamento de dados. Os resultados lançam luz sobre como a IA afetará as necessidades de infraestrutura nos próximos três anos.
Primeiro, a pesquisa demonstrou que a adoção da IA está gerando um crescimento exponencial na demanda de armazenamento de dados até 2028.
Figura 1. 61% dos participantes cujas empresas usam o armazenamento em nuvem principalmente para gerenciamento de dados de IA esperam aumentar seus requisitos de armazenamento em 100% ou mais.
À medida que aplicativos de IA geram uma criação de dados sem precedentes, quanto mais dados as organizações salvam, mais elas podem validar que a IA está agindo conforme o esperado. Com acesso a dados comportamentais, como conjuntos de dados de treinamento, pontos de verificação de modelo, solicitações e respostas, as empresas podem examinar algoritmos e entender e aperfeiçoar melhor a tomada de decisão de IA. Sem a escala e a eficiência dos data centers, o potencial da IA seria limitado, visto que a capacidade de armazenar e recuperar conjuntos de dados massivos é fundamental para o sucesso da IA.
Não é apenas a quantidade de armazenamento que gera o sucesso da IA. A duração do armazenamento de dados também é importante.
Figura 2. 90% das empresas que usam IA hoje acreditam que reter mais dados históricos melhora a precisão do modelo.
Essa descoberta aponta para uma correlação entre preservar dados por períodos mais longos e insights de IA mais confiáveis. Isso pode dever-se a vários fatores. Primeiro, o processamento iterativo constante é intrínseco à forma como os algoritmos de IA funcionam. As saídas de conteúdo retroalimentam o modelo, aprimorando sua precisão e possibilitando novos modelos. Conjuntos de dados e resultados brutos tornam-se fontes para o desenvolvimento futuro e novos fluxos de trabalho.
No entanto, reter os conjuntos de dados por mais tempo também serve para outras funções cruciais para os negócios: proteger a propriedade intelectual da empresa. Ela mantém “recibos” dos conjuntos de dados e processos originais do modelo, fornecendo uma explicação dos resultados quando necessário (por exemplo, como parte de um processo jurídico). Esses “recibos” estabelecem uma linhagem de dados, garantindo um registro claro da jornada que os dados fazem da entrada à saída. A linhagem de dados permite que as organizações verifiquem a origem e o uso de conjuntos de dados, fazendo com que os modelos de IA confiem em dados precisos. Isso permite que os sistemas de IA sejam totalmente auditáveis e garante conformidade com normas e responsabilidade interna.
Além disso, as empresas podem escolher armazenar mais dados por mais tempo, pois percebem que não podem saber hoje quais insights novos e valiosos os algoritmos de amanhã poderão descobrir a partir dos dados de ontem. A retenção de dados mais longa permite o processamento de dados antigos por modelos de IA ainda não desenvolvidos. Por esses motivos, a retenção de dados mais longa impulsiona o valor comercial que a IA pode fornecer.
Em uma descoberta relacionada, os tomadores de decisões de infraestrutura veem a retenção estendida de dados como essencial para criar confiança, uma base crucial sem a qual os insights de IA têm pouco valor.
A Seagate define IA confiável como fluxos de trabalho e modelos de dados de IA, que usam entradas confiáveis e geram insights confiáveis. A IA confiável é baseada em dados que atendem aos seguintes critérios:
Figura 3. 88% dos participantes cujas empresas usam IA hoje disseram que a adoção de IA de confiança requer uma necessidade maior de armazenar mais dados por períodos de tempo mais longos.
Uma infraestrutura de armazenamento escalável oferece suporte a uma IA confiável, porque permite que as grandes quantidades de dados usados por sistemas de IA sejam gerenciados, armazenados e protegidos adequadamente.
Checkpointing é o processo de salvar o estado de um modelo de IA em intervalos curtos e específicos durante seu treinamento. Os modelos de IA são treinados em grandes conjuntos de dados por meio de processos iterativos que podem levar de minutos a meses. A duração do treinamento de um modelo depende da complexidade do modelo, do tamanho do conjunto de dados e da potência computacional disponível. Durante esse tempo, os modelos são alimentados com dados, os parâmetros são ajustados e o sistema aprende a prever resultados com base nas informações que processa.
Os checkpoints (ou pontos de verificação) agem como instantâneos do estado atual do modelo (seus dados, parâmetros e configurações) em vários pontos durante o treinamento. Salvos em dispositivos de armazenamento a cada minuto a alguns minutos, os instantâneos permitem que os desenvolvedores mantenham um registro do progresso do modelo e evitem perder um trabalho valioso devido a interrupções inesperadas.
Segundo a pesquisa, as empresas que usam mais de 100 PB de armazenamento estão salvando e fazendo backup de checkpoints diariamente a semanalmente, com 87% delas armazenando esses checkpoints na nuvem ou em uma combinação de HDD e SSD.
Computação e energia são temas populares nas discussões sobre a adoção da IA. No entanto, a pesquisa da Recon Analytics destaca o armazenamento como o principal fator.
Figura 4. 66% dos tomadores de decisões de infraestrutura classificaram o armazenamento como o segundo componente mais importante entre seus quatro principais viabilizadores de IA. Eles também classificaram o armazenamento como a quarta barreira mais importante para a implantação de IA.
O fundador e analista líder da Recon, Roger Entner, descreve a lição:
“Os resultados da pesquisa geralmente indicam um aumento repentino na demanda por armazenamento de dados, com os discos rígidos emergindo como o claro vencedor. Quando consideramos que os líderes de empresas que participaram da pesquisa pretendem armazenar cada vez mais esses dados gerados por IA na nuvem, parece que os serviços de nuvem estão bem posicionados para enfrentar uma segunda onda de crescimento.”
Para obter o máximo valor da IA, as empresas devem se preparar com um armazenamento de dados escalável e eficiente. Seja diretamente ou por meio de serviços de nuvem, a dependência da IA nos dados depende dos discos rígidos, que oferecem capacidade, eficiência de custos e sustentabilidade incomparáveis, como a base da IA confiável.