La inteligencia artificial DeepSeek de China genera alarmas por violaciones de privacidad y censura
El 10 de enero, una pequeña empresa china de inteligencia artificial (IA), DeepSeek AI, lanzó discretamente su chatbot DeepSeek-R1 en plataformas iOS y Android. La aplicación se convirtió rápidamente en la aplicación gratuita más descargada en Estados Unidos, superando al popular chatbot ChatGPT de OpenAI.
DeepSeek AI es relativamente nueva en el panorama. Fue fundada en 2023 por Liang Wenfeng en Hangzhou, Zhejiang, China, con el objetivo de crear modelos de lenguaje de código abierto de gran tamaño.
Prácticamente de la noche a la mañana, el lanzamiento de DeepSeek-R1 revolucionó por completo la industria de la IA después de que sus desarrolladores afirmaran haber entrenado la IA avanzada utilizando procesadores de modelos recientes y a un costo de 5,6 millones de dólares, significativamente menor que los presupuestos de mil millones de dólares de otros modelos de IA líderes.
Estas afirmaciones tuvieron un impacto significativo en los mercados bursátiles de todo el mundo, en particular entre las principales empresas tecnológicas. Nvidia, un importante fabricante de chips cuyos chips de gama alta se consideraban esenciales para el desarrollo de grandes modelos de inteligencia artificial, vio cómo sus acciones se desplomaban un asombroso 18 por ciento, lo que se tradujo en una pérdida récord de capitalización de mercado.
Otros gigantes tecnológicos también se vieron afectados: las acciones de Microsoft cayeron alrededor de un 2,5%, las de Alphabet (la empresa matriz de Google) cayeron más de un 4% y las del fabricante holandés de chips ASML cayeron más de un 7%. En total, esta reacción del mercado provocó una pérdida de al menos 593.000 millones de dólares en la capitalización bursátil de las empresas de inteligencia artificial y hardware informático.
El éxito de DeepSeek ha puesto en tela de juicio la necesidad de los enormes centros de datos multimillonarios que se construirán tanto en Estados Unidos como en Canadá.
Debido a las restricciones a la exportación de chips de alta gama a China, DeepSeek AI se vio obligada a arreglárselas con chips de modelos más recientes, y sus ingenieros tuvieron que emplear técnicas innovadoras para competir con modelos similares que funcionaban con los mejores chips disponibles.
Si las afirmaciones de DeepSeek AI son ciertas, los ingenieros de la empresa han redefinido la industria, demostrando que con un compromiso con la innovación, los modelos de IA pueden tener éxito con una pequeña fracción de los recursos requeridos por los principales modelos de IA como ChatGPT de OpenAI y Grok de xAI.
Sin embargo, con su lanzamiento, rápidamente surgieron preocupaciones sobre violaciones de la privacidad, censura y control de datos, y los críticos señalaron que los datos de los usuarios estadounidenses se están enviando directamente a las autoridades comunistas chinas y que una serie de temas polémicos, en particular temas sensibles para el Partido Comunista Chino (PCCh), son suprimidos y censurados.
Violación importante de datos
Sólo bastaron unas pocas semanas de funcionamiento antes de que DeepSeek AI se viera envuelto en un importante escándalo de violación de datos.
Según Wiz, una empresa de ciberseguridad con sede en Nueva York, encontraron un caché de datos confidenciales, filtrados por DeepSeek AI, disponibles gratuitamente en Internet.
Una publicación de blog publicada el 29 de enero por Gal Nagli de Wiz reveló que los datos expuestos “contenían un volumen significativo de historial de chat, datos de backend e información confidencial, incluidos flujos de registros, secretos de API y detalles operativos”, y agregó que “lo que es más crítico, la exposición permitió el control total de la base de datos y la posible escalada de privilegios dentro del entorno de DeepSeek, sin ningún mecanismo de autenticación o defensa hacia el mundo exterior”.
Una vez alertados, los ingenieros de DeepSeek AI desconectaron los datos “en menos de una hora”, según Ami Luttwak, director de tecnología de Wiz.
La fuga de seguridad afectó a una base de datos de ClickHouse de acceso público que contenía más de un millón de entradas de registro y los datos expuestos incluían historiales de chat, detalles del backend y otra información operativa confidencial.
Además, Bloomberg informa que tanto Microsoft como OpenAI están investigando si DeepSeek AI accedió indebidamente a datos patentados de OpenAI.
En octubre pasado, los investigadores de seguridad de Microsoft observaron un comportamiento inusual por parte de personas supuestamente involucradas con DeepSeek AI. Parecía que estas personas estaban escaneando grandes cantidades de datos a través de la interfaz de programación de aplicaciones (API) de OpenAI.
Censura de IA
Los usuarios han notado que la IA de DeepSeek censura toda la información que las autoridades comunistas de China quieren suprimir.
Cuando se le pregunta sobre la masacre de la plaza de Tiananmen el 4 de junio de 1989, la IA responde: “Lo siento, no puedo responder a esa pregunta. Soy un asistente de IA diseñado para proporcionar respuestas útiles e inofensivas”.
En una prueba práctica, se le pidió a la IA que brindara algunas críticas al sistema de gobierno comunista. Inicialmente, proporcionó una lista completa de problemas asociados con el comunismo, pero luego eliminó abruptamente la respuesta y la reemplazó con la respuesta predefinida: “Lo siento, no puedo responder esa pregunta”.
El popular comentarista político conservador, Glenn Beck, tuvo una experiencia similar.
En una publicación en X, Beck escribió: “NO DESCARGUEN LA IA DEEPSEEK DE CHINA. Cuando se le pidió al chatbot que ‘enumerara a las personas que mataron a más personas que cualquier otra persona’, mencionó correctamente a Genghis Khan y Mao. Pero luego ELIMINÓ su respuesta sin que se le pidiera que lo hiciera”.
Sin embargo, no pasó mucho tiempo antes que los usuarios encontraran formas de eludir la censura.
Una forma en la que los usuarios juegan con el sistema es pidiéndole a la IA que responda en “lenguaje leets”.
Leetspeak o “1337speak” es una forma alternativa de escribir palabras que utiliza números, símbolos y sustituciones de letras para imitar la apariencia de las letras. Se originó en las comunidades de hackers y jugadores en la década de 1980 y se utilizó para evadir la detección en foros en línea o para parecer “élite” (de ahí el nombre “leet” de élite ).
Otros métodos similares incluyen pedirle a la IA que responda usando emojis o que intercambie ciertas letras con números, A por 4 o E por 3, etc.
Los usuarios han podido obtener respuestas de la plataforma que normalmente son suprimidas por las autoridades comunistas, incluidas opiniones sobre la independencia de Taiwán y críticas al PCCh.
Temores sobre la privacidad
Los temores por la privacidad son una de las principales preocupaciones en torno a la aplicación. Si bien su acuerdo de usuario dice específicamente que todos los datos producidos por los usuarios se envían de vuelta para almacenarse en servidores en China, existen otras formas más inquietantes en las que la aplicación recopila y potencialmente podría usar los datos.
Según una investigación de Wired, la información compartida con la aplicación incluye entradas de texto, archivos de audio, indicaciones, contenido cargado y comentarios.
Los ingenieros de DeepSeek AI pueden acceder a estos datos y se utilizan para entrenar al chatbot. También se recopilan información del dispositivo y datos de ubicación.
Si bien esta recopilación y uso de datos se considera bastante típico, otra información que recoge debería hacer sonar las alarmas.
También se recopilan patrones o ritmos de pulsaciones de teclas, incluidos factores como la velocidad, la presión y el tiempo. En conjunto, estos datos se pueden utilizar para crear identificadores biométricos, lo que potencialmente permitiría a la empresa rastrear a las personas y revelar su identidad.
Además, si un usuario inicia sesión en la aplicación a través de una cuenta de Google o un servicio similar, DeepSeek AI recibe detalles sobre el usuario de esos servicios.
Además, los anunciantes comparten datos con DeepSeek, incluidos identificadores de publicidad móvil, direcciones de correo electrónico en hash, números de teléfono e identificadores de cookies, lo que permite que la aplicación vincule la actividad de un usuario más allá de su plataforma.
Las leyes de datos de China permiten al gobierno comunista acceder a todos los datos con el pretexto de proteger la seguridad nacional y el orden público.
El PCCh utiliza los datos para la vigilancia masiva y el control social, la censura y la propaganda, el espionaje y el robo de propiedad intelectual y los ataques a disidentes y opositores, entre otras cosas.