Publicado em:
11/04/2025
A DeepSeek, startup chinesa de inteligência artificial, revelou uma nova técnica para melhorar o raciocínio de grandes modelos de linguagem (LLMs). Em colaboração com pesquisadores da Universidade de Tsinghua, a empresa desenvolveu o método que combina modelagem de recompensa generativa com ajuste de crítica autodidata. Com essa inovação, espera-se que os LLMs consigam responder de forma mais eficaz e rápida a consultas gerais, alinhando-se às preferências humanas.
Os resultados iniciais indicam que os modelos DeepSeek-GRM superaram técnicas já estabelecidas, ao oferecer desempenho comparável aos dos modelos de recompensa consolidados.
"A modelagem de recompensa funciona como um mecanismo de orientação, direcionando os modelos para resultados mais alinhados às expectativas humanas", comentaram os pesquisadores.
Além disso, a empresa planeja disponibilizar esses modelos em código aberto, ainda que não tenha definido um prazo para isso. Enquanto o setor discute um possível lançamento do DeepSeek-R2, sucessor do modelo R1 conhecido pelo bom desempenho a baixo custo, a empresa opta por não comentar sobre o assunto.
Em redes sociais, uma conta de atendimento ao cliente da DeepSeek negou rumores de um lançamento iminente, e a startup não respondeu a pedidos de esclarecimentos. Fundada em 2023 em Hangzhou por Liang Wenfeng, a DeepSeek tem mantido uma postura discreta, concentrando seus esforços em pesquisa e desenvolvimento.
A empresa anunciou anteriormente a liberação de cinco repositórios de software em código aberto, seguindo sua política de "progresso sincero com total transparência". A atualização mais recente, o DeepSeek-V3-0324, trouxe melhorias em raciocínio e produção de texto em chinês, além de inovações como a "atenção esparsa nativa".
Liang, que também lidera a High-Flyer Quant, fundo de hedge responsável pelo financiamento da DeepSeek, participou de um simpósio com lideranças do setor tecnológico, destacando a resiliência da indústria chinesa frente às restrições ocidentais. A introdução do DeepSeek-GRM é mais um passo na tentativa da startup de se consolidar no competitivo mercado global de IA.
Com um cenário de desafios impostos por restrições comerciais e a busca pela redução da dependência tecnológica externa, a DeepSeek e outras empresas chinesas intensificam a cooperação com universidades e fundos de investimento. A expectativa em torno do DeepSeek-R2 continua a alimentar debates sobre o futuro da empresa, que permanece focada na pesquisa e colaboração técnica enquanto refina sua estratégia de comunicação.