Em uma parceria entre a Artificial Analysis e o IBM Research, foi lançado o ITBench-AA, o primeiro benchmark focado em avaliar modelos de…...
A IBM Research, em parceria com a Hugging Face, lançou o VAKRA, um benchmark inovador que avalia a capacidade de agentes de inteligência artificial…...
O problema do "estagiário eterno" em agentes de IA Imagine um cozinheiro que decorou todos os livros de receita, mas esquece as particularidades da…...
A IBM Research acaba de anunciar o lançamento da versão 0.4.0 do Mellea, uma biblioteca open-source em Python para criação de programas generativos…...
