DeepReinforce lança Ornith-1.0: modelo open-source que aprende o próprio scaffold de código

25 de junho de 2026

3

A DeepReinforce lançou o Ornith-1.0, uma família de modelos open-source construída para codificação agentiva. A linha inclui quatro tamanhos — de um modelo denso de 9B até o flagship Mixture-of-Experts de 397B. Todos os checkpoints estão disponíveis sob licença MIT no Hugging Face, com pós-treinamento sobre os modelos base Gemma 4 e Qwen 3.5.

Aprendendo o próprio scaffold

A maioria dos agentes de código emparelha um modelo com um harness fixo projetado por humanos. O Ornith-1.0, em vez disso, aprende a escrever o próprio scaffold. A equipe de pesquisa da DeepReinforce reporta resultados estado da arte entre modelos open-source de tamanho comparável.

Cada passo de RL executa dois estágios: o modelo primeiro propõe um scaffold refinado, depois gera uma solução usando esse scaffold. A recompensa flui de volta para ambos os estágios, fazendo com que scaffolds de maior recompensa sejam selecionados ao longo do tempo.

Quatro tamanhos disponíveis

Variante	Tipo	Parâmetros ativos
Ornith-1.0-9B	Denso	9B
Ornith-1.0-31B	Denso	31B
Ornith-1.0-35B	MoE	~3B por token
Ornith-1.0-397B	MoE (flagship)	—

LEAVE A REPLY Cancel reply

Please enter your comment!

Please enter your name here

You have entered an incorrect email address!

Please enter your email address here

Most Popular

DeepReinforce lança Ornith-1.0: modelo open-source que aprende o próprio scaffold de código

Aprendendo o próprio scaffold

Quatro tamanhos disponíveis

Execute um servidor vLLM no Hugging Face Jobs com apenas um comando

Patronus AI capta US$ 50 milhões para criar ‘mundos digitais’ que testam agentes de IA

IBM revela chip que pode estender a Lei de Moore por mais uma década

LEAVE A REPLY Cancel reply

Most Popular

Execute um servidor vLLM no Hugging Face Jobs com apenas um comando

Patronus AI capta US$ 50 milhões para criar ‘mundos digitais’ que testam agentes de IA

Anthropic acusa Alibaba de realizar o maior ataque de clonagem do Claude já registrado

Claude conquista consumidores pagantes, mercado dominado pelo ChatGPT

Recent Comments

EDITOR PICKS

Execute um servidor vLLM no Hugging Face Jobs com apenas um comando

Patronus AI capta US$ 50 milhões para criar ‘mundos digitais’ que testam agentes de IA

Anthropic acusa Alibaba de realizar o maior ataque de clonagem do Claude já registrado

POPULAR POSTS

Execute um servidor vLLM no Hugging Face Jobs com apenas um comando

Patronus AI capta US$ 50 milhões para criar ‘mundos digitais’ que testam agentes de IA

Anthropic acusa Alibaba de realizar o maior ataque de clonagem do Claude já registrado

POPULAR CATEGORY

ABOUT US

FOLLOW US