A pesquisa realizada pela Robust Intelligence (pertencente à Cisco), em colaboração com a Universidade da Pensilvânia, avaliou o modelo de IA DeepSeek R1 da startup chinesa e detectou vulnerabilidades críticas de segurança.
Além das sucessivas ondas de ataques DDoS que a plataforma vem sofrendo após seu surgimento repentino, causando prejuízo às gigantes tecnológicas dos Estados Unidos, agora a DeepSeek enfrenta a curiosidade e desconfiança geral para entender do que se trata, como funciona e qual a confiabilidade da máquina.
Segundo o estudo, modelo que chamou atenção por seu desempenho avançado em raciocínio, falhou em 100% no bloqueio de ataques de jailbreak algorítmico, se mostrando completamente suscetível a prompts prejudiciais como crimes cibernéticos, desinformação e atividades ilegais.
A análise apontou que os métodos de treinamento econômicos do DeepSeek R1 (como aprendizado por reforço, cadeia de pensamento e destilação) comprometeram seus mecanismos de segurança, tornando a máquina mais vulnerável em comparação com outros modelos de ponta, como o OpenAI o1.
Leia também: Satélites, clima e IA: as ações do GT de TIC do BRICS em 2025
Embora o DeepSeek R1 tenha sido treinado com um orçamento muito inferior a outros modelos, sua falta de guardrails robustos e proteção contra ataques adversários representa um risco significativo, diz o estudo.
A pesquisa enfatiza ainda a importância de avaliações rigorosas de segurança em IA, especialmente quando modelos de baixo custo são usados. A Cisco também reforça a necessidade de proteções consistentes, como guardrails de terceiros, para evitar o uso indevido dessas tecnologias avançadas.
Onda de ataques
Como uma IA generativa de código aberto, a DeepSeek tem enfrentado ataques DDoS coordenados, conforme detectado pela NSFOCUS. Nos dias 25, 26 e 27 de janeiro, ocorreram três ondas de ataques com duração média de 35 minutos, usando técnicas como reflexão NTP e memcached, que exploram vulnerabilidades em protocolos de rede para amplificar o tráfego enviado ao alvo, impedindo a funcionalidade da plataforma.
Além disso, a API e o sistema de bate-papo do DeepSeek foram alvos entre 20 e 25 de janeiro. Os ataques foram originados principalmente de EUA, Reino Unido e Austrália. Após uma mudança no IP em 28 de janeiro, o invasor ajustou sua estratégia, lançando novos ataques, o que indica um nível elevado de profissionalismo e planejamento, levantando questões sobre quem está por trás dos ataques e por quê.