llm

Notícias de Tecnologia

Subquadratic afirma ter resolvido o gargalo matemático dos transformers — e tem benchmarks independentes para provar

Startup de Miami afirma ter resolvido o gargalo da atenção densa em transformers. Modelo SubQ seria 56x mais rápido e processa 12x mais contexto, com benchmarks independentes da Appen para provar....

tiago

19 de junho de 2026

Notícias de Tecnologia

Subquadratic afirma ter resolvido o gargalo que limita os LLMs — e os testes independentes mostram velocidade 56x maior

A startup americana Subquadratic saiu do modo stealth no mês passado com uma afirmação ambiciosa: resolveram o gargalo matemático que tem limitado os grandes modelos de linguagem (LLMs) há quase uma d...

tiago

19 de junho de 2026

Notícias de Tecnologia

AWS SageMaker ganha mais de 100 métricas detalhadas para inferência de IA generativa

AWS SageMaker AI agora emite mais de 100 métricas detalhadas de inferência com dashboard integrado no CloudWatch, cobrindo saúde de GPU, latência de tokens e pressão de cache KV....

tiago

19 de junho de 2026

Notícias de Tecnologia

Amazon Bedrock AgentCore: agentes de IA em produção com duas chamadas de API

Há um ano, Simon Willison definiu agentes de IA com uma das descrições mais claras até hoje: "Um agente LLM executa ferramentas em loop para alcançar um objetivo." Essa definição permanece atual porqu...

tiago

18 de junho de 2026

Notícias de Tecnologia

Corrida da Compressão KV Cache: TurboQuant vs OSCAR vs EpiCache

Modelos de linguagem grandes (LLMs) com contexto longo enfrentam um gargalo de memória que não tem nada a ver com os pesos do modelo. Durante a decodificação, os transformers armazenam em cache os vet...

tiago

18 de junho de 2026

Notícias de Tecnologia

Tokenomics: como empresas estão lidando com o custo crescente do uso de IA generativa

Enquanto empresas investem centenas de milhões de dólares em ferramentas de IA para codificação, marketing e atendimento ao cliente, uma nova obsessão domina o setor de tecnologia: a "tokenomics" — ou...

tiago

16 de junho de 2026

HuggingFace

AWS acelera carregamento de modelos LLM e amplia janelas de contexto com GPUDirect e Amazon FSx for Lustre

Para quem trabalha com grandes modelos de linguagem (LLMs) em instâncias GPU da AWS, o tempo de carregamento do modelo na memória de alta largura de…...

tiago

1 de junho de 2026

HuggingFace

Desafios e Métricas para Avaliação de Desempenho de LLMs: Insights de Legare Kerrison e Cedric Clyburn

Contexto e importância da avaliação de LLMs O avanço das Large Language Models (LLMs) tem impulsionado a adoção de aplicações de inteligência…...

tiago

28 de abril de 2026

HuggingFace

DoorDash revoluciona personalização com LLMs para momentos dinâmicos e hiperpersonalização

DoorDash avança na personalização dinâmica com modelos de linguagem de grande escala Na busca por transformar a experiência do consumidor, DoorDash…...

tiago

21 de abril de 2026

TechCrunch AI

Por que o Vale do Silício perdeu o contato com as necessidades reais dos usuários

O distanciamento do Vale do Silício em relação ao consumidor comum Em um artigo recente do The Verge, a jornalista Elizabeth Lopatto destaca um…...

tiago

20 de abril de 2026

HuggingFace

ToolSimulator: Testes Escaláveis e Seguros para Agentes de IA com Ferramentas Externas

A AWS lançou o ToolSimulator, um framework de simulação de ferramentas baseado em grandes modelos de linguagem (LLM) integrado ao Strands Evals SDK,…...

tiago

20 de abril de 2026

HuggingFace

Meta Revoluciona Detecção de Bugs com Testes Just-in-Time e IA

Meta lança abordagem Just-in-Time para testes de software com IA A Meta anunciou uma inovação significativa na área de testes automatizados para…...

tiago

17 de abril de 2026

1 2

Navegando pela Tag: llm

Subquadratic afirma ter resolvido o gargalo matemático dos transformers — e tem benchmarks independentes para provar

Subquadratic afirma ter resolvido o gargalo que limita os LLMs — e os testes independentes mostram velocidade 56x maior

AWS SageMaker ganha mais de 100 métricas detalhadas para inferência de IA generativa

Amazon Bedrock AgentCore: agentes de IA em produção com duas chamadas de API

Corrida da Compressão KV Cache: TurboQuant vs OSCAR vs EpiCache

Tokenomics: como empresas estão lidando com o custo crescente do uso de IA generativa

AWS acelera carregamento de modelos LLM e amplia janelas de contexto com GPUDirect e Amazon FSx for Lustre

Desafios e Métricas para Avaliação de Desempenho de LLMs: Insights de Legare Kerrison e Cedric Clyburn

DoorDash revoluciona personalização com LLMs para momentos dinâmicos e hiperpersonalização

Por que o Vale do Silício perdeu o contato com as necessidades reais dos usuários

ToolSimulator: Testes Escaláveis e Seguros para Agentes de IA com Ferramentas Externas

Meta Revoluciona Detecção de Bugs com Testes Just-in-Time e IA

Featured Posts

iOS 27: os recursos práticos de IA que vão transformar seu iPhone além da Siri

Governo Trump força Anthropic a tirar modelos Fable 5 e Mythos 5 do ar: quem se beneficia?

Claude-Mem: a “memória infinita” que faz o Claude Code lembrar do que já fez

Navegando pela Tag: llm

Social Icons

Featured Posts