Como a Decodificação Especulativa no AWS Trainium Reduz Custos e Acelera Modelos de Linguagem Grandes
Desvendando a decodificação especulativa para LLMs no AWS Trainium Modelos de linguagem grandes (LLMs) são fundamentais para aplicações de…
Orbital recebe investimento para lançar data centers de IA em órbita terrestre
A startup Orbital, sediada em Los Angeles e fundada em 2026, acaba de dar um importante passo para transformar sua visão futurista em realidade:…
Amazon SageMaker HyperPod: nova plataforma para inferência escalável e econômica em IA generativa
Amazon SageMaker HyperPod: inovação para inferência em IA generativa A AWS lançou o Amazon SageMaker HyperPod, uma solução completa para executar…
Etsy migra arquitetura MySQL com 1000 shards e 425 TB para Vitess e aprimora escalabilidade
A equipe de engenharia da Etsy concluiu recentemente a migração de sua infraestrutura de sharding MySQL, que abrange cerca de 1000 shards e 425 TB de…
Intel e Google firmam parceria estratégica para infraestrutura de IA com foco em IPUs e Xeon
A Intel e o Google anunciaram uma nova colaboração de longo prazo para o desenvolvimento e aprimoramento da infraestrutura de inteligência artificial…
Rebellions, SK Telecom e Arm unem forças para infraestrutura de IA soberana na Coreia do Sul
A fabricante sul-coreana de chips Rebellions firmou uma parceria estratégica com a SK Telecom (SKT) e a britânica Arm para desenvolver infraestrutura…
Novo chip da UC San Diego promete reduzir desperdício energético em data centers
Pesquisadores da Universidade da Califórnia em San Diego (UC San Diego) desenvolveram um novo chip que pode revolucionar a eficiência energética dos…
Google Cloud destaca avanços técnicos no núcleo do PostgreSQL focados em replicação e upgrades
O Google Cloud divulgou suas contribuições técnicas recentes ao PostgreSQL, ressaltando melhorias significativas em recursos centrais do banco de…
Google e Intel ampliam parceria para desenvolver chips customizados e fortalecer infraestrutura de IA
Google e Intel renovam e expandem colaboração em processadores para IA Google e Intel anunciaram uma ampliação significativa de sua parceria…
Meta e CoreWeave firmam acordo de US$ 21 bilhões para ampliar parceria em infraestrutura de IA
A Meta, empresa controladora do Facebook, Instagram e WhatsApp, anunciou um novo acordo com a CoreWeave, um dos principais provedores neocloud…
Escassez de Memória de Alta Largura de Banda: O Apetite Insaciável da IA por Chips de Memória
Nos últimos anos, a inteligência artificial (IA) tem impulsionado uma demanda sem precedentes por componentes de hardware, especialmente por chips de…
Chuck Robbins, CEO da Cisco, aposta em data centers no espaço para superar limites terrestres
Data centers no espaço: a visão de Chuck Robbins Em entrevista exclusiva ao podcast Decoder, o CEO da Cisco, Chuck Robbins, revelou sua convicção de…