Tag: modelos

  • In the Weights: ex-OpenAI criam busca de vaidade que mede o quanto a IA te conhece

    In the Weights: ex-OpenAI criam busca de vaidade que mede o quanto a IA te conhece

    Dois ex-funcionários da OpenAI acabam de lançar uma ferramenta que pode se tornar a nova obsessão do mundo tech: o In the Weights, um site que mede o quanto você é “lembrado” pelos modelos de inteligência artificial.

    Criado por Thomas Dimson e Joey Flynn — que chegaram à OpenAI quando a startup de design Global Illumination foi adquirida — o site consulta diversos modelos de IA (incluindo Grok, Gemini, múltiplas versões do GPT, Claude e Llama) com perguntas do tipo “Quem é [nome]?” e atribui uma pontuação de “força” baseada nas respostas.

    Como funciona

    O In the Weights envia o nome da pessoa para cada modelo, coleta até 10 resultados com descrições curtas e níveis de confiança, e então agrupa respostas similares para gerar uma pontuação consolidada. O slogan do site não economiza na ambição:

    “Estar nos pesos significa que sua existência foi considerada importante no processo de criação de inteligência artificial sobre-humana.”

    Resultados surpreendentes

    Os criadores relataram que a recepção tem sido “insana”. Dimson contou ao TechCrunch que achava que seria uma “curiosidade moderada”, mas o site parece ter tocado em um nervo: “as pessoas querem saber se vão viver para sempre na superinteligência — e o fator comparação também não atrapalha.”

    Um aspecto curioso: modelos diferentes da mesma família (como versões distintas do GPT) retornam resultados diferentes para a mesma pessoa, revelando vieses e diferenças de treinamento. O GPT-5.4 Mini, por exemplo, classificou um nome como “forma ambígua que pode se referir a múltiplas pessoas com as iniciais A.H.A.”

    Motivação

    Dimson explicou que ele e Flynn queriam “reativar a criatividade” após deixarem a OpenAI. A ideia surgiu da percepção de que buscas de vaidade no Google são o objetivo errado em 2026, já que cada vez mais o tráfego migra para LLMs.

    Os próximos passos incluem investigar por que modelos da mesma série retornam resultados diferentes, quais modelos têm viés para diferentes tipos de pessoas, e quem “deveria ter um artigo na Wikipédia mas não tem.”

    Para os curiosos de plantão: o site está no ar e aceita consultas públicas. Qual será o seu score?

    Fonte: TechCrunch (Anthony Ha)

  • Liquid AI lança LFM2.5-Embedding e ColBERT-350M: novos modelos de busca multilíngue em 11 idiomas

    Liquid AI lança LFM2.5-Embedding e ColBERT-350M: novos modelos de busca multilíngue em 11 idiomas

    A Liquid AI — startup fundada por ex-pesquisadores do MIT e conhecida por sua arquitetura alternativa aos transformers — acaba de lançar dois novos modelos de embedding que prometem busca multilíngue ultrarrápida em 11 idiomas, incluindo o português.

    Dois modelos, um backbone

    Os LFM2.5-Embedding-350M e LFM2.5-ColBERT-350M compartilham o mesmo backbone de 350 milhões de parâmetros, baseado na arquitetura LFM2.5 da Liquid AI. A diferença está na forma como representam o texto:

    • Embedding (Bi-Encoder Denso): Converte cada documento em um único vetor de 1024 dimensões. Ideal para busca rápida com o menor índice possível. Escolha quando velocidade e custo de armazenamento são prioridade.

    • ColBERT (Late-Interaction): Converte cada token em um vetor de 128 dimensões, permitindo comparação palavra por palavra entre consulta e documento. Oferece precisão superior e melhor generalização, com o trade-off de um índice maior. Também pode ser usado como reranker.

    Ambos os modelos são voltados para busca de contexto curto, como catálogos de produtos, bases de conhecimento FAQ e documentação de suporte — um encaixe natural para pipelines RAG (Retrieval-Augmented Generation).

    Arquitetura bidirecional adaptada

    O ponto de partida é o checkpoint LFM2.5-350M-Base, um modelo de uso geral que a Liquid AI adaptou com patches bidirecionais. Originalmente, a arquitetura LFM2 é causal (cada token olha apenas para o passado), o que funciona para geração de texto, mas não é ideal para recuperação de informação.

    A equipe substituiu a máscara de atenção causal por uma bidirecional, permitindo que cada token atenda ao contexto tanto à esquerda quanto à direita. As convoluções curtas também foram tornadas não-causais, misturando informações locais simetricamente ao redor de cada token.

    O resultado: 17 camadas (10 de convolução, 6 de atenção e 1 de pooling/densa), contexto de até 32.768 tokens e documentos afinados para 512 tokens — preservando a eficiência do backbone LFM2 enquanto produz as representações de contexto completo que a recuperação exige.

    Resultados em 11 idiomas

    Os modelos foram avaliados em dois benchmarks:

    • NanoBEIR: recuperação multilíngue
    • MKQA-11: QA cross-lingual de domínio aberto

    Ambos cobrem 11 idiomas: árabe, alemão, inglês, espanhol, francês, italiano, japonês, coreano, norueguês, português e sueco.

    O ColBERT lidera em ambas as médias, com 0,605 no NanoBEIR (melhoria significativa sobre os 0,540 do LFM2-ColBERT-350M anterior). O Embedding chega perto no MKQA-11, com 0,691. Ambos superam o Qwen3-Embedding-0.6B, um modelo maior.

    Latência e deploy

    A Liquid AI disponibilizou variantes GGUF para llama.cpp, permitindo execução em CPUs, laptops e dispositivos edge. Em uma MacBook Pro M4 Max (FP16), a latência mediana de consulta fica abaixo de 10 ms para embeddings pré-computados. Em GPUs H100 (FP16), as latências chegam a 1 ms.

    Para uso via Python, o Embedding roda com sentence-transformers e o ColBERT com PyLate, incluindo índice PLAID com FastPLAID para busca eficiente de similaridade. Ambos suportam fine-tuning com dados próprios.

    Disponibilidade

    Os modelos estão disponíveis no Hugging Face sob os identificadores LiquidAI/LFM2.5-Embedding-350M e LiquidAI/LFM2.5-ColBERT-350M. A Liquid AI recomenda o Embedding para pipelines RAG que priorizam custo e velocidade, e o ColBERT quando a precisão é o fator decisivo — especialmente em cenários cross-lingual onde a interação tardia captura nuances que embeddings densos podem perder.

  • Z.ai Lança GLM-5.2: Contexto de 1 Milhão de Tokens e Dois Níveis de Raciocínio

    Z.ai Lança GLM-5.2: Contexto de 1 Milhão de Tokens e Dois Níveis de Raciocínio

    A Z.ai acaba de lançar o GLM-5.2, a quarta iteração da linha GLM-5 em apenas quatro meses, trazendo um salto impressionante: 1 milhão de tokens de contexto utilizável e dois níveis de esforço de raciocínio. O modelo já está disponível para todos os planos do GLM Coding (Lite, Pro, Max, Team).

    Contexto de 1 Milhão de Tokens

    A variante glm-5.2[1m] oferece uma janela de contexto de 1.000.000 de tokens, aproximadamente 5 vezes maior que os 200K do GLM-5.1. Isso permite que um agente de codificação mantenha um repositório inteiro de médio porte (código-fonte, testes, configurações, histórico) na memória de trabalho, eliminando a necessidade de sumarização constante.

    Cada resposta pode retornar até 131.072 tokens de saída, uma capacidade massiva para tarefas complexas.

    Dois Níveis de Esforço de Raciocínio

    O GLM-5.2 introduz dois modos de raciocínio:

    • High — para tarefas padrão
    • Max — recomendado para trabalhos de codificação complexos e em múltiplas etapas

    No Claude Code, o esforço pode ser configurado via /effort. As opções xhigh, max e ultracode são mapeadas para o modo Max do GLM-5.2.

    Arquitetura

    A Z.ai não divulgou a arquitetura exata do GLM-5.2 no lançamento, mas a comunidade aponta que a base GLM-5 é um modelo Mixture-of-Experts de 744 bilhões de parâmetros, ativando 40 bilhões por token. O GLM-5.1 manteve a mesma espinha dorsal com pós-treinamento redirecionado.

    Sem Benchmarks no Lançamento

    Um ponto curioso: nenhum benchmark foi publicado no lançamento. A Z.ai optou por focar em disponibilidade, contexto e no roadmap open-source. Números de SWE-bench, Terminal-Bench ou Code Arena ainda estão pendentes.

    Casos de Uso

    • Refatoração de repositórios inteiros — carregue um repo de 40 arquivos Python em uma única sessão
    • Execuções de agentes de longa duração — ciclos sustentados de planejar-executar-testar-corrigir; o GLM-5.1 sustentou ~1.700 passos de agente por até 8 horas
    • Substituição direta do Claude Code — troque apenas a URL base e o identificador do modelo
    • Análise de documentos extensos — alimente especificações, logs ou transcrições além de 200K tokens sem truncamento

    Open Source e Licença MIT

    O modelo será liberado sob licença MIT, com pesos pendentes para a próxima semana — seguindo a tradição de abertura da Z.ai com a linha GLM-5.

    Compatibilidade

    O GLM-5.2 é compatível desde o primeiro dia com Claude Code, Cline, OpenCode e OpenClaw (8 ferramentas no total), utilizando um endpoint compatível com a API Anthropic por meio de uma simples troca de URL base e modelo.

    A Z.ai continua sua trajetória agressiva de lançamentos, posicionando o GLM-5.2 como uma alternativa open-source viável para codificação assistida por IA em larga escala.

  • Segurança de IA de Fronteira: Os Desafios dos Modelos Mais Avançados

    Segurança de IA de Fronteira: Os Desafios dos Modelos Mais Avançados

    Nos últimos anos, a inteligência artificial (IA) avançou de forma impressionante, especialmente com o desenvolvimento de modelos de linguagem e aprendizado profundo cada vez maiores e mais sofisticados. Esses modelos de ponta, frequentemente chamados de “modelos de IA de fronteira”, são capazes de realizar tarefas complexas, desde a geração de textos coerentes até a criação de imagens realistas e a resolução de problemas científicos. Contudo, à medida que essas tecnologias se tornam mais poderosas e onipresentes, surgem também desafios cruciais relacionados à sua segurança. Garantir que esses sistemas operem de maneira segura, ética e confiável é um tema central para pesquisadores, empresas e reguladores.

    Para compreender os desafios da segurança em IA de fronteira, é importante primeiro entender o que caracteriza esses modelos. Modelos de IA de fronteira geralmente envolvem redes neurais profundas treinadas com vastas quantidades de dados, muitas vezes utilizando milhares de GPUs durante semanas ou meses. Exemplos conhecidos incluem o GPT-4 da OpenAI, o Claude da Anthropic e o PaLM do Google. Esses sistemas podem “aprender” padrões complexos e gerar respostas que parecem humanas, mas, por serem baseados em probabilidades e correlações, podem também apresentar comportamentos imprevisíveis ou indesejados.

    Um dos principais riscos associados a esses modelos é a possibilidade de eles serem manipulados por agentes mal-intencionados. Por exemplo, técnicas conhecidas como “ataques adversariais” podem explorar vulnerabilidades no modelo para induzir respostas erradas ou prejudiciais. Imagine um sistema de IA usado para moderação de conteúdo que, por meio de pequenas alterações no texto de entrada, começa a permitir discursos de ódio ou informação falsa. Além disso, há o risco de “prompt injection”, onde um usuário malicioso insere comandos escondidos dentro de uma solicitação para fazer o modelo agir de maneira contrária às suas diretrizes.

    Outra preocupação significativa refere-se à geração de informações falsas ou enganosas, também chamadas de “deepfakes textuais” ou “alucinações” em IA. Modelos avançados podem criar notícias falsas, perfis falsos em redes sociais ou manipular opiniões públicas sem que seja fácil detectar a fraude. Isso tem implicações sérias para a segurança digital, a democracia e a confiança em informações online. Por exemplo, durante as eleições, a disseminação automatizada de desinformação pode influenciar resultados e polarizar ainda mais a sociedade.

    Além disso, a segurança de IA de fronteira envolve a proteção contra o uso indevido por terceiros. Como esses modelos são extremamente poderosos, há o risco de que sejam utilizados para fins nocivos, como a criação de malware, automação de ataques cibernéticos ou mesmo para auxílio em atividades ilegais. Empresas como a Anthropic, que desenvolve o Claude, têm investido fortemente em alinhamento ético e segurança, buscando formas de tornar seus modelos mais resistentes a abusos, por meio de técnicas como aprendizado de reforço com feedback humano (RLHF) e filtros de segurança dinâmicos.

    Do ponto de vista técnico, garantir a segurança dos modelos de IA envolve múltiplas camadas. A primeira é o treinamento responsável, que inclui a seleção cuidadosa dos dados para evitar vieses e a implementação de mecanismos para detectar e mitigar respostas inadequadas. Em seguida, há o monitoramento contínuo do desempenho do modelo em produção, para identificar comportamentos anômalos ou riscos emergentes. Outra camada importante é o controle de acesso e a utilização de APIs com limites e políticas claras para evitar abusos. Por fim, a pesquisa em explicabilidade e interpretabilidade da IA busca tornar as decisões dos modelos mais transparentes, ajudando especialistas a entender por que determinado resultado foi gerado.

    Um exemplo prático dessa abordagem pode ser visto na implementação de sistemas de atendimento ao cliente baseados em IA. Empresas que utilizam chatbots avançados precisam garantir que o sistema não apenas responda corretamente, mas que também não divulgue informações confidenciais, não promova discursos inadequados e seja resistente a tentativas de manipulação. Se um modelo não for suficientemente seguro, a reputação da empresa pode ser comprometida, assim como a privacidade dos usuários.

    No mercado, a segurança em IA de fronteira tornou-se um diferencial competitivo. Organizações que conseguem demonstrar compromisso com práticas seguras atraem mais clientes e parceiros, além de reduzir riscos legais e financeiros. Por outro lado, falhas de segurança podem resultar em prejuízos significativos, desde multas regulatórias até danos à imagem pública. Com o avanço da regulamentação global, como a Lei Geral de Proteção de Dados (LGPD) no Brasil e a proposta de regulamentos europeus sobre IA, a conformidade com padrões de segurança será cada vez mais mandatória.

    Para os usuários finais, a segurança da IA impacta diretamente na confiança e na qualidade da experiência. Quando os modelos funcionam de forma segura, eles podem ser ferramentas poderosas para educação, saúde, produtividade e entretenimento. Porém, o medo de manipulação ou de exposição a conteúdos nocivos pode limitar a adoção dessas tecnologias. Portanto, é fundamental que desenvolvedores, reguladores e a sociedade trabalhem juntos para criar um ambiente confiável para o uso da IA.

    O futuro da segurança em IA de fronteira está ligado à evolução das técnicas de defesa e ao desenvolvimento de modelos cada vez mais robustos e alinhados. Pesquisas emergentes exploram abordagens como a IA adversarial defensiva, que tenta prever e neutralizar ataques antes que causem danos, e a IA explicável, que permite auditorias mais eficazes. Além disso, o conceito de “segurança por design” deve ser incorporado desde as fases iniciais do desenvolvimento, reduzindo vulnerabilidades e promovendo a ética no uso da tecnologia.

    Em resumo, a segurança dos modelos de IA de fronteira é um desafio complexo e multidimensional, que envolve questões técnicas, éticas e sociais. À medida que esses sistemas ganham espaço em nossas vidas, proteger contra abusos, manipulações e falhas torna-se essencial para maximizar os benefícios da inteligência artificial. Com investimentos contínuos em pesquisa, regulamentação adequada e conscientização, é possível construir um futuro em que a IA seja não apenas avançada, mas também segura e confiável para todos.

  • Ataques de Destilação: Detectando e Prevenindo Roubo de Modelos de IA

    Ataques de Destilação: Detectando e Prevenindo Roubo de Modelos de IA

    No cenário atual, onde a inteligência artificial (IA) se tornou um ativo valioso para empresas e pesquisadores, a proteção dos modelos treinados é uma preocupação crescente. Esses modelos, frequentemente resultado de investimentos significativos em dados, computação e expertise, podem ser alvo de ataques que visam sua cópia ou uso indevido. Entre as técnicas de ataque, os chamados ataques de destilação têm ganhado destaque por sua capacidade de roubar modelos de IA de forma furtiva e eficaz. Este artigo explora o que são esses ataques, como detectá-los e estratégias para preveni-los, destacando a importância da segurança em IA para preservar o valor e a integridade dos sistemas inteligentes.

    Ataques de destilação, também conhecidos como “model stealing” ou “model extraction”, são técnicas que buscam replicar um modelo de IA sem acesso direto ao seu código ou aos dados originais de treinamento. A ideia central é que um invasor utilize o modelo alvo como uma “caixa-preta”, enviando um conjunto de entradas e observando as respostas para construir um novo modelo que imita o comportamento do original. Esse processo é semelhante à técnica de destilação de conhecimento (“knowledge distillation”) usada legitimamente para criar versões mais leves ou eficientes de modelos complexos, mas, no contexto de ataques, é realizado sem autorização.

    Para entender melhor, imagine que uma empresa desenvolveu um sofisticado modelo de classificação de imagens e o disponibilizou via uma API para seus clientes. Um atacante pode enviar milhares de imagens à API, coletar as respostas (probabilidades, rótulos, etc.) e, com esses pares entrada-saída, treinar um modelo próprio que se comporta de maneira muito semelhante ao original. Desta forma, o invasor obtém uma cópia funcional do modelo sem precisar pagar pelo serviço ou investir em todo o processo de desenvolvimento e treinamento.

    Um exemplo prático aconteceu com serviços populares de reconhecimento de fala e visão computacional, nos quais pesquisadores demonstraram que era possível replicar modelos comerciais apenas explorando as APIs públicas. Além do prejuízo financeiro, esse tipo de ataque pode impactar a reputação da empresa que perde o controle sobre sua propriedade intelectual, além de potencialmente facilitar ataques subsequentes, como a geração de respostas manipuladas ou evasão de sistemas de segurança.

    Detectar ataques de destilação não é trivial, pois o invasor geralmente age de forma discreta e utiliza consultas que parecem legítimas. No entanto, algumas estratégias podem ajudar a identificar comportamentos suspeitos, como um volume excessivo de requisições em curto espaço de tempo, padrões repetitivos de entradas que não correspondem a usos típicos ou tentativas de sondagem sistemática de diferentes regiões do espaço de entrada. Ferramentas de monitoramento de tráfego e análise comportamental podem ser integradas aos sistemas para alertar sobre possíveis tentativas de extração.

    Além da detecção, a prevenção é fundamental para proteger os modelos. Uma abordagem é limitar a quantidade de informações retornadas pela API, por exemplo, fornecendo apenas o rótulo final em vez de probabilidades detalhadas, dificultando o treinamento do modelo roubado. Outra técnica envolve a inserção de “marcas d’água” nos modelos, que são padrões sutis e invisíveis que podem ser usados para provar a autoria em casos de disputa. Também é possível aplicar mecanismos de controle de acesso rigorosos, autenticação forte e monitoramento contínuo para restringir o uso indevido.

    No contexto mais amplo do mercado, os ataques de destilação representam um risco para empresas que investem em IA como diferencial competitivo. A proteção da propriedade intelectual não é apenas uma questão técnica, mas também legal e estratégica. Usuários finais podem ser impactados indiretamente, pois a cópia e distribuição não autorizada de modelos podem levar à proliferação de versões menos seguras, com desempenho inferior ou até manipuladas para fins maliciosos. Isso ressalta a necessidade de normas e regulamentações que incentivem práticas responsáveis e protejam todos os envolvidos no ecossistema de IA.

    O futuro da segurança em IA deve considerar a evolução constante dessas ameaças e a necessidade de soluções inovadoras. Pesquisas em técnicas avançadas de proteção, como aprendizado federado, criptografia homomórfica e métodos de verificação de integridade, prometem aumentar a robustez dos sistemas. Além disso, o desenvolvimento de padrões para certificação de modelos e a conscientização dos desenvolvedores e usuários são passos essenciais para mitigar riscos e fomentar um ambiente tecnológico seguro e confiável.

    Em resumo, os ataques de destilação são uma ameaça real e crescente para a segurança dos modelos de IA, capazes de comprometer investimentos, propriedade intelectual e a confiança dos usuários. Detectar e prevenir esses ataques requer uma combinação de estratégias técnicas, monitoramento rigoroso e políticas adequadas. Com o avanço da inteligência artificial e sua integração em diversos setores, proteger esses ativos se torna cada vez mais vital, garantindo que os benefícios da tecnologia sejam explorados de forma ética e segura. A atenção contínua a essa questão será fundamental para o desenvolvimento sustentável e responsável da IA no futuro.