La plupart des chatbots d’IA dévorent les données utilisateurs

Comme beaucoup de gens le font aujourd’hui, vous pouvez vous tourner vers l’IA pour répondre à des questions, générer du contenu et recueillir des informations. Mais il y a toujours un prix à payer. Dans le cas de l’IA, il s’agit des données des utilisateurs. Dans un nouveau rapport, le service de sécurité et de VPN Surfshark a analysé les types de données que diverses IA collectent auprès de vous et celles qui en recueillent le plus.

Pour son rapport, Surfshark a examiné 10 chatbots IA populaires :

ChatGPT
Claude AI
DeepSeek
Google Gemini
Grok
Jasper
Meta AI
Microsoft Copilot
Perplexity
Pi
Poe

L’analyse a vérifié les détails relatifs à la confidentialité de chaque application sur l’App Store d’Apple, ainsi que les politiques de confidentialité de DeepSeek et de ChatGPT. L’objectif était de déterminer le nombre de types de données collectées par chaque application, si elle recueille des données liées à vous et si elle utilise la publicité de tiers.

35 types de données passées au crible

Surfshark s’est concentré sur 35 types de données différents, dont :

Les coordonnées
La santé et la forme physique
Les informations financières
La localisation
Les informations sensibles
Les contacts
Le contenu de l’utilisateur
L’historique
Les identifiants
Les diagnostics
Les données d’utilisation
Les achats

Les informations sensibles comprennent, par exemple, les données raciales ou ethniques, l’orientation sexuelle, les informations relatives à la grossesse ou à l’accouchement, le handicap, les croyances religieuses ou philosophiques, l’appartenance à un syndicat, les opinions politiques, les informations génétiques ou les données biométriques.

Les 10 applications d’IA collectent toutes un certain type de données sur les utilisateurs. Le nombre moyen de types de données collectées est de 13 sur 35. Environ 45 % des applications recueillent votre localisation. Près de 30 % suivent les données de l’utilisateur, ce qui signifie que les informations collectées par l’application sont associées à des données de tiers afin de diffuser des publicités ciblées ou de les partager avec un courtier en données.

Alors, qui sont les pires délinquants ?

Surfshark

D’après l’examen de Surfshark, c’est Meta AI qui arrive en tête. C’est elle qui recueille le plus de données sur les utilisateurs, avec 32 des 35 types de données possibles, soit 90 % d’entre elles. Meta AI est la seule application d’IA à avoir recueilli des données dans des catégories telles que les informations financières, la santé et la forme physique, et les informations sensibles. En outre, seules Meta et Copilot ont récupéré des données liées à l’identité de l’utilisateur pour afficher des publicités tierces. Meta AI peut également collecter jusqu’à 24 types de données différents à cette fin.

L’application Google Gemini, recueille 22 types de données différents. L’application recueille des données sur votre localisation précise ainsi que des informations de contact (nom, adresse électronique, numéro de téléphone, etc.), le contenu de l’utilisateur, les contacts (une liste de contacts sur votre téléphone), l’historique des recherches et l’historique de navigation.

Poe, Claude et Copilot complètent le top cinq. Poe collecte 14 types de données différents, Claude 13 et Copilot 12. Et Poe et Copilot sont deux des trois applications (Jasper étant la troisième) qui collectent des données utilisées pour vous pister. En utilisant l’identifiant de votre appareil, Poe et Copilot peuvent vendre vos données à des courtiers ou les utiliser pour afficher des publicités ciblées dans l’application.

Le double problème DeepSeek

En sixième position, on trouve DeepSeek, une IA chinoise dont les performances ont été saluées, mais dont les racines suscitent des inquiétudes. Dans l’analyse de Surfshark, DeepSeek s’est retrouvé au milieu, collectant 11 types de données, y compris l’historique de votre chat.

Cependant, le problème de DeepSeek est double. Tout d’abord, comme il est originaire de Chine, vos résultats pourraient être censurés en raison de l’interdiction de certains contenus. Deuxièmement, les données collectées par l’IA sont envoyées à China Mobile, une société de télécommunications exploitée par le gouvernement chinois interdite d’exploitation aux États-Unis depuis 2019 pour des raisons de sécurité nationale.

Surfshark note également que DeepSeek prétend conserver les informations aussi longtemps que nécessaire, en les sauvegardant sur des serveurs situés en République populaire de Chine.

« Ne baissez pas votre garde, car les chats stockés sur des serveurs risquent toujours d’être violés », prévient Surfshark dans son rapport. « Selon The Hacker News, DeepSeek a déjà connu une brèche dans laquelle plus d’un million d’enregistrements de l’historique des chats, de clés API et d’autres informations ont été divulgués. Il est généralement conseillé de faire attention aux informations fournies. »

Un bon point pour ChatGPT

Le suivant est ChatGPT, qui recueille 10 types de données, telles que les informations de contact, le contenu des utilisateurs, les identifiants, les données d’utilisation et les diagnostics. Point positif, l’IA d’OpenAI ne suit pas vos données et n’utilise pas de publicités tierces. De plus, les utilisateurs soucieux de leur vie privée peuvent toujours se tourner vers des chats temporaires dans lesquels toutes les données sont automatiquement supprimées au bout de 30 jours. De plus, vous pouvez demander que vos données personnelles ne soient pas utilisées à des fins de formation.

Grok, Pi et Jasper complètent le top 10. Surfshark a constaté que Grok recueille sept types de données, tandis que Pi et Jasper en collectent chacun cinq. Bien qu’il soit arrivé en dernière position, Jasper collecte des identifiants d’appareils, des données d’interaction avec les produits, des données publicitaires et d’autres données d’utilisation pour vous envoyer des publicités ciblées ou partager des données avec un courtier.

La collecte de données sur les utilisateurs est une pratique courante, non seulement parmi les robots d’intelligence artificielle, mais aussi parmi d’autres applications mobiles, sites de médias sociaux, moteurs de recherche et logiciels. Souvent, c’est le prix à payer pour obtenir des produits gratuits ou bon marché qui reposent sur la publicité. Mais cela ne signifie pas que vous devez vous soumettre de plein gré.

ChatGPT et d’autres applications et services d’IA proposent des moyens d’empêcher ou au moins de limiter la collecte de vos données. Le mieux est d’examiner les politiques de confidentialité et les paramètres de toutes les applications d’IA que vous utilisez pour voir comment vous pouvez prendre en charge vos propres données.

Source link

35 types de données passées au crible

Alors, qui sont les pires délinquants ?

Le double problème DeepSeek

Un bon point pour ChatGPT

Laisser un commentaire Annuler la réponse