O crescimento dos dados nunca foi tão rápido quanto é hoje. Os serviços de nuvem, por exemplo, serão um setor de alto crescimento para os requisitos de armazenamento nos próximos cinco anos. A Gartner prevê que a receita da infraestrutura como um serviço (IaaS) atingirá US$ 24,4 bilhões em 2016, sendo o armazenamento responsável por quase 40% desse número (Gartner, Public Cloud Services,Worldwide, 2011-2016, 2Q12 Update, publicado em: 20 de agosto de 2012). Há diversas outras tendências impulsionando o crescimento dos dados além da nuvem, como as redes sociais, BYOD e analítica de big data.
A questão mais importante é: o que estamos fazendo para preparar nossa infraestrutura de servidor e armazenamento para não só atender à explosiva demanda por capacidade de armazenamento e ainda fornecer níveis sem precedentes de desempenho, escalabilidade e confiabilidade?
Introdução às interfaces
Com a explosão de dados no decorrer da última década, a tecnologia de armazenamento foi forçada a evoluir. Nos primórdios do armazenamento corporativo, parallel SCSI foi a interface de escolha para o armazenamento baseado em servidor. Com o desenvolvimento das redes, o conceito de acessar dados a partir de pools compartilhados de recursos de armazenamento, o que geralmente é chamado de SAN (storage area networks), deu credibilidade à interface fibre channel. Nesse momento, a interface parallel SCSI dominou as arquiteturas DAS (direct attach storage) e de servidor e fibre channel dominou a SAN.
Foi aí que a interface de desktop ATA e a interface de DAS corporativa SCSI começaram a se tornar serializadas. A introdução das interfaces serial AT attachment (SATA) e serial attach SCSI (SAS) levou a um boom no armazenamento de desktop e corporativo. A SATA foi rapidamente adotada como a interface padrão para computação cliente fornecendo taxa de transferência maia rápida, cabeamento mais fino e manejável e maior integridade de sinal. Ao mesmo tempo, a SAS logo começou a competir com fibre channel nos espaços de DAS e SAN corporativa, mas outra arquitetura nova estava surgindo – NAS (network attach storage) e o protocolo iSCSI – e oferecia custo mais baixo e conectividade mais ampla.
Como chegamos até aqui?
Com a expansão do armazenamento NAS e iSCSI, a grande base instalada de cabeamento Ethernet dentro de empresas de todos os portes era aproveitada para o armazenamento. As soluções NAS de custo mais baixo possibilitaram conectividade integrada com clientes de grupo de trabalho e departamentos, desbancando o ambiente de central de dados, que era exclusivamente ocupado por SAN de nível corporativo. Nesse momento é que a unidade SATA de classe desktop foi introduzida nas empresas.
Como os discos rígidos SATA de classe desktop tinham um preço inferior, assim como as controladoras SATA, e havia a vantagem de que a interface SATA podia funcionar em um backplane SAS, as soluções NAS e DAS começaram a usar discos SATA de desktop para armazenamento de alta capacidade e baixo custo, embora essa abordagem apresentasse alguns problemas. Os discos SATA de classe desktop não foram projetados para os ciclos de trabalho 24 horas exigidos em um ambiente corporativo. Os clientes depararam-se com redução de desempenho e confiabilidade insatisfatória, conforme mostrado posteriormente. O culpado: a vibração rotacional. Discos rígidos em excesso operando ininterruptamente em um sistema fazem com que o sistema vibre levando a uma queda significativa nas operações de entrada/saída por segundo (IOPS) e na confiabilidade. Mesmo assim, os discos rígidos de classe desktop continuaram a se proliferar no que é comercializado como soluções de armazenamento de classe corporativa, principalmente com o advento da nuvem.
Quando os dados se expandem no ritmo em que estão se expandindo e previsto para se expandir, as empresas tendem a procurar toda e qualquer oportunidade para remover custos de suas soluções de armazenamento. Para muitas empresas, tornou-se um hábito simplesmente escolher o disco rígido com a capacidade mais alta que puder encontrar ao custo mais baixo possível. Em muitos casos, isso acaba se concretizando na forma de um produto de classe desktop não projetado para as cargas e os ciclos de trabalho corporativos. Isso pode superar o desafio de reduzir os custos de aquisição de capacidade de armazenamento iniciais, mas introduz um conjunto inteiramente novo de custos ocultos para a central de dados.

A introdução de uma SAS completamente corporativa
As tendências tecnológicas dinâmicas acima impulsionaram os fabricantes de disco rígido a desenvolver uma nova categoria de armazenamento de classe corporativa de alta capacidade e baixo custo: o nearline. O armazenamento nearline (geralmente chamado de armazenamento tier 2, ou camada 2) e armazenamento para atividades cruciais, o midline, e até mesmo o armazenamento em lote, são as métricas de armazenamento mais críticas que as empresas buscam em termos de custo por gigabyte ou, nos ambientes de armazenamento atuais, custo por terabyte. O nearline foi a resposta à explosão de dados.
Já bem estabelecida nos mercados de discos de alto desempenho, a SAS agora está penetrando as camadas de armazenamento secundário com seus discos nearline com capacidade otimizada. Quando se trata de escalabilidade ou da capacidade de uma central de dados corporativa ou central de dados em nuvem ser escalada rapidamente conforme as demandas de capacidade e desempenho aumentarem, não há uma solução comprovada que forneça o desempenho, a integridade de dados, a confiabilidade e a proteção ao investimento a longo prazo da SAS.
Como a SAS completamente corporativa muda o conceito de armazenamento?
Desempenho – Os discos de classe corporativa devem manter altos níveis de desempenho em configurações com vários discos, onde ocorrem vibrações físicas transmitidas pelo gabinete. Esse fenômeno é conhecido como vibração rotacional (VR).
A VR em si é uma ação como se fosse uma torção e torque e é medida em radianos como a taxa angular da alteração em segundos. Em outras palavras, é a quantidade de movimento de aceleramento angular que o disco pode suportar.
As principais fontes de energia de VR são:
- Movimentos de busca do disco rígido
- Discos adicionais dentro do gabinete acessando dados (por exemplo, ambientes com várias rotações)
- Forças externas agindo sobre o gabinete
Se a VR não for levada em conta no design do disco, a força da VR pode deslocar a cabeça, causando a perda de revoluções e atrasos na transferência de dados. Testes em discos incapazes de suportar VR mostraram reduções significativas (mais de 50%) em desempenho.
Felizmente, os discos corporativos usam inúmeras tecnologias há mais de uma década para mitigar os efeitos da VR. Para otimizar esses ambientes densos com vários discos, a Seagate usa sensores de VR, bem como sensores de vibração linear em seus discos corporativos. Com esses sensores, os discos podem compensar qualquer vibração que ocorrer no próprio disco ou de fontes externas ao disco (por exemplo, coolers, chassi de qualidade inferior, etc.) e continuar a ler e gravar dados.
Também é recomendável reduzir a quantidade de vibração que um disco pode gerar por si próprio no design. Os discos corporativos de alta capacidade da Seagate são desenvolvidos usando um motor de rotação conectado à tampa superior, o que aumenta a rigidez dentro de qualquer disco rígido que utilize uma configuração de quatro discos. Outros aprimoramentos de design são feitos com a otimização dos perfis de busca dos discos no firmware para minimizar qualquer torque emitido.
E a questão de usar discos de desktop em um ambiente corporativo? O diagrama abaixo mostra o impacto sobre o desempenho de discos de classe desktop, nearline e corporativa com diferentes níveis de vibração. Os índices de 6, 12 e 21,5 radianos/seg.^2 representam as tolerâncias específicas dos discos desktop, enterprise capacity (nearline) e enterprise performance (enterprise), respectivamente, para manter o desempenho de throughput em 80%. Observe que, quando as VRs são elevadas acima dessas tolerâncias especificadas, o desempenho dos discos de desktop, em particular, cai drasticamente, enquanto os discos de classe corporativa mantêm quase 100% de seu desempenho sob todas as condições, exceto as mais extremas.

Como a vibração rotacional afeta a operação do disco rígido?
As cabeças de leitura/gravação seguem trilhas concêntricas no disco. A posição da cabeça deve permanecer dentro de uma janela de tolerância permitida para as operações de leitura e gravação ocorrerem. A janela de gravação permitida é menor do que a janela de leitura permitida, tornando as operações de gravação mais sensíveis à vibração do que as operações de leitura.
Se a posição do gravador exceder a janela de posição permitida, a operação de gravação é temporariamente interrompida. Uma violação à janela de posição de gravação é chamada de falha de gravação. A operação de gravação é retomada quando a precisão nas trilhas retorna para dentro da janela permitida e o local de destino da gravação (LBA - logical block address, endereçamento de bloco lógico) passa sob o gravador. O LBA de destino passa sob o gravador uma vez por revolução de disco. Quando ocorre uma falha de gravação, geralmente a operação de gravação é retomada uma revolução de disco depois. Sob vibração extrema, a operação de gravação pode ser atrasada por várias revoluções de disco. Operações de leitura/gravação atrasadas são a raiz de toda degradação de E/S induzida por vibração.
Conclusão: os clientes com aplicações de vários discos se beneficiarão bastante de alcançar os níveis de desempenho especificados conseguidos com a integração de discos de classe corporativa em camadas de armazenamento múltiplas.
Em um ambiente de armazenamento em camadas, os dados não só precisam se mover mais rapidamente do armazenamento de camada 0 e camada 1, mas também entre o armazenamento de camada 2 de custo mais baixo. A capacidade de mover dados o mais rapidamente possível para cima e para baixo nas camadas de armazenamento está se tornando mais crítica para atender às expectativas do cliente. Não atender às expectativas gera custos de oportunidade associados ao abandono do cliente, perda de vendas e menos clientes.
Escalabilidade – Para atender às crescentes demandas de dados, as empresas buscam soluções que forneçam o mais alto nível de escalabilidade. Poder expandir a capacidade de armazenamento de rede de forma rápida e econômica sem interromper acordos de nível de serviço é essencial no atual mundo dos terabytes, petabytes e até mesmo exabytes de dados.
Com a transição para as redes de armazenamento vem a necessidade de haver uma verificação de erros mais avançada. Levar os dados de uma placa-mãe para um disco conectado diretamente é uma coisa. Levar essas mesmas informações por diversos pontos de comutação, seja dentro de um rack de servidor ou atravessando o país, é outra coisa completamente diferente. Cada ponto onde há uma mudança de endereço introduz uma oportunidade de erro. Discos de desktop usam verificação de erros básica, mas não há nada no disco que diga “preciso confirmar se as informações que estou recebendo são exatamente as mesmas informações que foram originalmente enviadas para mim”. Se uma informação for alterada em trânsito, um disco de desktop registrará o erro e ficará por isso mesmo. Um disco SAS nearline usará métodos avançados, semelhantes aos usados com a memória de servidor ECC, juntamente com metadados embutidos no fluxo de informações para identificar e corrigir erros de falha de comparação.
A correção de erros e endereçamento começam a assumir mais importância conforme analisamos como a SAS pode ser escalada além da implementação típica de dois a quadro discos rígidos. Como sabemos, a maioria das placas-mãe acomoda somente de quatro a oito dispositivos SATA. No entanto, diferentemente de dispositivos SATA, os dispositivos SAS operam dentro de um domínio, bastante similar a uma rede corporativa convencional. Como ocorre com as redes, é possível empregar diversos tipos de switches SAS (geralmente chamados de expansores) para agregar dispositivos dentro de um domínio. Pode haver 128 dispositivos em um expansor de borda e 128 expansores de borda por expansor fanout. No total, um domínio SAS pode conter 16.384 dispositivos.
Obviamente, a maioria dos usuários não deve usar nada que chegue perto dessa quantidade. Mesmo assim, em uma montagem em rack, precisar de uma solução de armazenamento contendo dezenas ou centenas de discos rígidos não é incomum. É aí que o potencial arquitetônico da SAS em termos de escalabilidade rápida se torna um enorme benefício.
Confiabilidade – Como mencionado anteriormente, a confiabilidade insatisfatória do disco, na maioria dos casos, geralmente resulta da implementação do tipo errado de dispositivo de armazenamento dentro de um sistema de classe corporativa ou para uma carga de trabalho de classe corporativa específica. As unidades de disco rígido, sendo dispositivos mecânicos, são projetadas com recursos e componentes específicos para cargas de trabalho específicas. Um disco de classe corporativa é equipado com recursos e funcionalidades adicionais para possibilitar a leitura e gravação confiáveis de dados em um ambiente de central de dados de operação 24 horas por dia, 7 dias por semana, sob uma carga de trabalho mais pesada.
Por exemplo, os discos SAS ajudam a reduzir as taxas de falha do sistema de armazenamento diminuindo o número de interconexões físicas e adicionando recurso de porta dupla. Embora os profissionais de TI possam relutar em implementar sistemas de armazenamento que possivelmente interrompam as operações, o design do disco SAS corporativo permite integração completa com as mesmas infraestruturas SAS atualmente suportando armazenamento de camada 1 crucial. A compatibilidade com uma grande quantidade de conexões host ajuda os discos SAS a evitar o risco de ponto único de falha que caracteriza os discos SATA. Além disso, ao evitar a necessidade de haver uma placa de interposição SATA, os discos SAS também podem reduzir a contagem total de peças no sistema, uma consideração importante ao projetar para alta escalabilidade.
A vibração rotacional (VR), conforme mencionado na seção Desempenho, obviamente afeta a confiabilidade do disco, bem como seu desempenho em ambientes com várias rotações. Entretanto, os discos corporativos, especificamente projetados tendo a VR em mente, incluem sensores para fornecer feedback em vibração mecânica de neutralização, tanto linear quanto rotacional. Atuadores de duplo estágio para fornecer uma maior largura de banda para criar imunidade à VR e motores de eixo para garantir maior estabilidade mecânica são outros exemplos de tecnologias projetadas em discos corporativos não consideradas necessárias em discos de desktop. O uso de discos corporativos tem muitos benefícios tangíveis sobre a vida útil do disco ou sobre o tempo médio entre falhas (MTBF), que é muito maior em discos corporativos, incluindo esforços de integração inferiores, melhor taxa de erros irrecuperáveis, otimização de velocidade, testes de fabricação mais amplos e, o mais importante, menos compras de discos de substituição, gerando um melhor retorno sobre o investimento (ROI).
Principais lições
Para resumir:
- Os requisitos de armazenamento continuam crescendo sem nenhuma desaceleração à vista.
- Os discos de desktop não são projetados para ambientes de central de dados e de várias rotações com desempenho sustentado, escalabilidade e confiabilidade como principais impulsionadores
- Nem todas as centrais de dados e infraestruturas são iguais e a capacidade de desempenho relacionada de qualquer ambiente deve coincidir com os requisitos necessários para as aplicações cruciais.
- As organizações que pretendem comprar ou alugar desempenho de armazenamento sustentado confiável escalável são aconselhadas a buscar e exigir a melhor correspondência sustentada de discos corporativos de alto desempenho (SAS nearline) para as suas necessidades.
Embora este artigo tenha abordado algumas das variações tecnológicas reais entre os discos de desktop (SATA) e corporativos (SAS), há, é claro, mais detalhes sobre os recursos e as diferenças entre os discos. Retorne a esta seção de Explicação técnica para obter mais informações.
Etiqueta: