Subscribe to our Newsletter!
By subscribing to our newsletter, you agree with our privacy terms
Home > Monitoramento de TI > Datacenters > IA Generativa: data centers precisam ser reformulados?
Maio 30, 2023
Durante a divulgação do mais recente relatório financeiro da Nvidia, Jensen Huang, fundador e CEO da empresa, fez uma afirmação que deixou o mundo dos data centers em alerta. O executivo afirmou que a “a indústria dos computadores está passando por duas transições simultâneas — computação acelerada e IA generativa”. Completou dizendo que “um trilhão de dólares em infraestrutura de data centers instalada no mundo fará a transição do modelo de uso geral para computação acelerada à medida que empresas correrem para aplicar IA generativa em todos seus produtos, serviços e processos de negócios”.
Será mesmo que os data center precisarão ser totalmente reformulados por conta do uso disseminado dos modelos de Inteligência Artificial (IA) generativa? É certo que quanto mais empresas integrarem ferramentas de IA na rotina de seus negócios, maior será a demanda por recursos dos data centers. E como ficam as infraestruturas existentes? Darão conta de se atualizar? E a que custo?
Segundo previsão da Tirias Research, os custos da infraestrutura de servidores dos data centers para IA generativa somados às despesas operacionais vão exceder US$ 76 bilhões até 2028. Esse aumento de custos pode acabar com o sonho das empresas que, por exemplo, buscam automatizar seus negócios incorporando esse tipo de ferramenta de IA. Segundo essa perspectiva da Tirias, a incorporação de uma nova infraestrutura de data centers ofereceria elevaria o desempenho computacional em quatro vezes, mas esse ganho seria superado por um aumento de 50 vezes nas cargas de trabalho de IA, mesmo com algoritmos de inferência inovadores e mais eficientes.
Em entrevista ao site Tech Wire Asia, Chris Street, diretor de data centers da consultoria JLL de investimentos imobiliários, comentou que o setor está experimentando um aumento da densidade energética que visa suportar aplicações de IA e isso traz consigo desafios, especialmente instalações mais antigas não projetadas para esse tipo de uso. “Essa situação torna a mudança para serviços em nuvem imperativa para muitas organizações”, afirma o analista. Para Street, algumas instalações podem ser reaproveitadas, enquanto outras podem exigir um esforço considerável para se atualizarem, podendo não valer a pena.
Já Bradley Shimmin, analista do setor de dados e IA do grupo consultivo Omdia, reconhece que poderá haver a necessidade de adotar novas abordagens para hardware de aceleração, porém não compartilha totalmente da visão de Huang da Nvidia de que data centers precisarão substituir todos seus equipamentos.
No site Data Center Knowledge, Shimmin detalhou que, para muitos casos de uso, especialmente aqueles usam modelos de treinamento altamente exigentes do ponto de vista de poder computacional, as empresas precisarão investir nos melhores tipos de aceleração de hardware para IA. “No entanto, há uma tendência oposta acontecendo justamente agora, na qual pesquisadores estão aprendendo a fazer mais com menos modelos e com menos parâmetros, conjuntos de dados altamente selecionados e treinamento mais inteligente, por exemplo”, acrescenta Shimmin.
Outra iniciativa do ecossistema que pode ajudar os data centres a suportar casos de uso de IA generativa vem dos fabricantes de processadores, destaca o executivo da Omina. Por exemplo, a Samsung está se empenhando para executar modelos de IA no nível dos chips e dos dispositivos edge, aliviando assim a sobrecarga dos data centers.
No entanto, há quem concorde com o executivo da Nvidia. Karl Freund, fundador e analista principal da Cambrian-AI Research, disse ao Data Center Knowledge que “Huang é um visionário e há tempos vem dizendo que os data centers devem ser acelerados”. Pelo menos para a Nvidia, esse cenário está se tornando realidade, uma bela realidade que está demandando muito hardware especializado em IA para data centers — no último relatório financeiro, a empresa reportou a receita recorde de US$ 4,28 bilhões de sua divisão para data centers, um aumento de 14% em relação ao ano anterior e de 18% em relação ao trimestre anterior.
As soluções de aceleração de hardware da Nvidia estão surfando tão bem a onda da IA a ponto de fazer a empresa atingir um valor de mercado de US$ 1 trilhão hoje, chegando ao que chamam de “clube dos 12 zeros”.
Mas como uma empresa fundada em 1993 por um engenheiro elétrico taiwanês-americano chamado Jensen Huang como foco em processamento gráfico de alta resolução chegou ao mundo da Inteligência Artificial e dos data centers?
Bem, unidades de processamento gráfico (GPUs) são projetadas para realizar infindáveis cálculos matemáticos usando como entrada grandes volumes de dados (pixels nas imagens) para renderizar espaços tridimensionais de forma otimizada e acelerada, ao contrário das CPUs que são indicadas para uso genérico. Ao longo do tempo, as GPUs, que estavam e estão até hoje no core business da Nvidia, evoluíram e passaram a ter vários processadores executando cálculos menores em paralelo, derivados de um problema maior e mais complicado, como são as imagens com grandes detalhes em movimento acelerado sob interação dos jogadores, por exemplo.
Podemos dizer agora que o jogo virou de alguma forma. Ao site NetworkWorld, Manuvir Das, vice-presidente de computação corporativa da Nvidia, afirmou a empresa “está definitivamente concentrada no mundo corparativo”, ainda que a essência da Nvidia, de ser uma organização de jogos, não vai mudar.
Voltando ao cenário atual da IA, coincidentemente, o aprendizado de máquina e seus algoritmos de treinamento, presentes nos modelos LLM, também exigem muitos cálculos simultâneos usando grandes volumes de dados. Não é difícil deduzir que as GPUS da Nvidia seriam adequados para uso com IA. “Eles foram espertos, capitalizando isso”, afirma Willy Shih, professor da Harvard Business School.
Segundo Das, o conjunto de GPUs da Nvidia oferece funcionalidades diferentes, dependendo do mercado-alvo. As GPUs voltadas para empresas possuem um mecanismo para processamento de linguagem natural, por exemplo, e outras funções que não são encontradas nas GPUs para jogos.
A Nvidia saiu na frente nessa corrida, mas Intel, AMD, assim como Amazon e Google, também estão investindo no segmento de GPUs para IA.
Setembro 27, 2023
Setembro 20, 2023
Setembro 13, 2023
Setembro 08, 2023
Agosto 31, 2023
Agosto 25, 2023
Agosto 17, 2023
Agosto 01, 2023
Previous
Governo americano financia soluções de resfriamento para data centers
Next
Meta apresenta novo design de data centers para IA