Startup de Miami afirma ter resolvido o gargalo da atenção densa em transformers. Modelo SubQ seria 56x mais rápido e processa 12x mais contexto, com benchmarks independentes da Appen para provar....
A startup americana Subquadratic saiu do modo stealth no mês passado com uma afirmação ambiciosa: resolveram o gargalo matemático que tem limitado os grandes modelos de linguagem (LLMs) há quase uma d...
AWS SageMaker AI agora emite mais de 100 métricas detalhadas de inferência com dashboard integrado no CloudWatch, cobrindo saúde de GPU, latência de tokens e pressão de cache KV....
Há um ano, Simon Willison definiu agentes de IA com uma das descrições mais claras até hoje: "Um agente LLM executa ferramentas em loop para alcançar um objetivo." Essa definição permanece atual porqu...
Modelos de linguagem grandes (LLMs) com contexto longo enfrentam um gargalo de memória que não tem nada a ver com os pesos do modelo. Durante a decodificação, os transformers armazenam em cache os vet...
Enquanto empresas investem centenas de milhões de dólares em ferramentas de IA para codificação, marketing e atendimento ao cliente, uma nova obsessão domina o setor de tecnologia: a "tokenomics" — ou...
Para quem trabalha com grandes modelos de linguagem (LLMs) em instâncias GPU da AWS, o tempo de carregamento do modelo na memória de alta largura de…...
Contexto e importância da avaliação de LLMs O avanço das Large Language Models (LLMs) tem impulsionado a adoção de aplicações de inteligência…...
DoorDash avança na personalização dinâmica com modelos de linguagem de grande escala Na busca por transformar a experiência do consumidor, DoorDash…...
O distanciamento do Vale do Silício em relação ao consumidor comum Em um artigo recente do The Verge, a jornalista Elizabeth Lopatto destaca um…...
A AWS lançou o ToolSimulator, um framework de simulação de ferramentas baseado em grandes modelos de linguagem (LLM) integrado ao Strands Evals SDK,…...
Meta lança abordagem Just-in-Time para testes de software com IA A Meta anunciou uma inovação significativa na área de testes automatizados para…...
