Les informations publiques susceptibles d'intéresser les chercheurs ou des tiers sont disponibles sur les plateformes de réseaux sociaux, telles que Facebook, Instagram, Twitter, LinkedIn, etc. Elles peuvent être collectées systématiquement par le biais d'API, de web scraping et d'autres techniques.

Une interface de programmation d'applications (API) est une bibliothèque ou un ensemble structuré d'outils destinés aux développeurs de logiciels qui fournit une interface avec un logiciel principal, par exemple les réseaux sociaux. Les API ne fournissent pas d'accès direct au code source de la plateforme.
Les API sont très utiles pour collecter des tonnes de données en peu de temps.

Nous respectons les informations personnelles et n'extrayons des plateformes de réseaux sociaux que les données accessibles au public. Nous ne supprimons pas les informations personnelles sensibles de haut niveau.
Quels types d'informations publiques peuvent être légalement collectées sur les utilisateurs ?
En utilisant l'API, des chercheurs indépendants et des tiers pourraient facilement télécharger des informations publiques sur les profils des utilisateurs, ainsi que des commentaires et des réactions aux publications publiques, afin d'étudier l'impact des réseaux sociaux sur la société.

Les données des réseaux sociaux précédemment collectées à partir de l'API sont, après tout, accessibles au public et visibles pour les utilisateurs qui visitent les pages Web de Facebook ou de tout autre réseau social.

À l'aide de nos API, vous pouvez extraire des informations dérivées des données utilisateur. Ces données sont ensuite agrégées pour éviter raisonnablement l'identification d'une personne spécifique ou de l'utilisateur.

Nous suivons les règles :
  • Les données privées qui nécessitent un nom d'utilisateur et des codes d'accès ne peuvent pas être supprimées.
  • Respect des CGU (Terms of Service) qui interdisent explicitement l'action du web scraping.
  • Ne copiez pas de données protégées par des droits d'auteur.
  • Les informations confidentielles ne peuvent pas être récupérées.
Pourquoi l'extraction de données via notre API de réseaux sociaux est-elle légale ?
Nous expliquerons notre point de vue sur les raisons pour lesquelles notre API doit être considérée comme légale selon les principaux documents juridiques relatifs aux informations personnelles :
  • CFAA (Loi sur la fraude et les abus informatiques)
  • JOUETS (Conditions d'utilisation)
  • GDPR (Règlement général sur la protection des données)
Le 9 septembre, la cour d'appel du 9e circuit des États-Unis a statué (Appel interjeté par le tribunal de district des États-Unis pour le district nord de la Californie) que le web scraping de sites publics ne viole pas la CFAA (Loi sur la fraude et les abus informatiques).

Le tribunal a non seulement légalisé cette pratique, mais a également interdit aux concurrents de supprimer automatiquement des informations de votre site si celui-ci est public. Le tribunal a confirmé la logique claire selon laquelle l'entrée du bot Web Scraper n'est pas légalement différente de l'entrée du navigateur. Dans les deux cas, « l'utilisateur » demande des données ouvertes et fait quelque chose de son côté.

Plus important encore, la cour d'appel a également confirmé une décision d'une juridiction inférieure interdisant à LinkedIn d'interférer avec le web scraping de son site par HiQ.

Plus récemment, dans l'affaire HiQ Labs contre LinkedIn, la cour d'appel du neuvième circuit a statué que le grattage de données accessibles au public ne constitue pas un accès « non autorisé » à un ordinateur, même lorsque le propriétaire (dans notre cas, le propriétaire des serveurs sur lesquels les données sont stockées) a envoyé une lettre de cessation et d'abstention au visiteur du site Web. Même dans ce cas, l'argument est que lorsque certaines informations sont mises à la disposition du public, leur extraction ne constitue pas une violation de la CFAA.

La violation des conditions d'utilisation (TOS) pour extraire des informations publiques des plateformes de réseaux sociaux peut être légale pour les chercheurs. Comme certains l'ont fait remarquer (Bruns, 2018, 2019; Halavais, 2019), les recherches sur les réseaux sociaux servent l'intérêt public, et menacer d'appliquer la CFAA pour empêcher les universitaires et les journalistes de collecter des informations publiques sur Facebook à des fins de recherche constitue une violation du Premier Amendement (Institut Knight du Premier Amendement de l'Université de Columbia, 2018; Sandvig, 2017) et du droit de l'homme à la liberté de recherche (Nations Unies, 1976).

Il est prouvé que cette argumentation oriente les décisions juridiques. L'affaire Sandvig v. Sessions, dans laquelle un tribunal de Washington a statué que le grattage d'informations accessibles au public n'est pas un crime informatique, même lorsque le TOS l'interdit explicitement (Williams, 2018). Le point clé est le caractère public des informations que les chercheurs souhaitent recueillir. Comme l'a déclaré le tribunal,
le scraping n'est qu'une avancée technologique qui facilite la collecte d'informations; ce n'est pas vraiment différent de l'utilisation d'un magnétophone au lieu de prendre des notes écrites, ou de l'utilisation de la fonction panorama d'un smartphone au lieu de prendre une série de photos depuis différentes positions. (Sandvig c. Sessions, 2018, page 15)
À quoi devraient ressembler les données publiées pour être conformes aux réglementations en matière de confidentialité (comme le RGPD) ?

Conformément à l'article 4. PROTECTION DES DONNÉES PERSONNELLES dans le cadre du RGPD
Les données personnelles désignent toutes les informations relatives à une personne physique identifiée ou identifiable (« personne concernée ») ; une personne physique identifiable est une personne qui peut être identifiée, directement ou indirectement, notamment par référence à un identifiant tel qu'un nom, un numéro d'identification, des données de localisation, un identifiant en ligne ou à un ou plusieurs facteurs spécifiques à l'identité physique, physiologique, génétique, mentale, économique, culturelle ou sociale de cette personne physique.

Le traitement désigne toute opération ou ensemble d'opérations effectué sur des données personnelles ou sur des ensembles de données personnelles, que ce soit par des moyens automatisés ou non, tels que la collecte, l'enregistrement, l'organisation, la structuration, le stockage, l'adaptation ou la modification, la récupération, la consultation, l'utilisation, la divulgation par transmission, diffusion ou autre mise à disposition, alignement ou combinaison, restriction, effacement ou destruction.

Aux fins de la recherche universitaire, le moyen le plus simple de traiter les données conformément à la réglementation est d'obtenir le consentement éclairé des sujets (art. 6 (1) (a)). Cependant, le règlement prévoit également que le traitement des données peut être légal s'il est « nécessaire aux fins des intérêts légitimes poursuivis par le responsable du traitement ou par un tiers » (article 6, paragraphe 1, point f)). L'article précise en outre que « l'intérêt légitime » signifie que le traitement des données est « nécessaire à l'exécution d'une tâche d'intérêt public ». Par conséquent, étant donné qu'il est généralement simple de défendre la recherche universitaire comme relevant de l'intérêt public, la collecte, l'analyse et la publication de données à des fins scientifiques devraient être protégées par le RGPD.

En outre, la réglementation exige qu'une attention particulière soit portée au cas où le chercheur traiterait des données sensibles. De manière générale, le RGPD interdit le traitement des
les données personnelles révélant l'origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques, ou l'appartenance à un syndicat, et le traitement de données génétiques, de données biométriques dans le but d'identifier de manière unique une personne physique, de données concernant la santé ou de données concernant la vie sexuelle ou l'orientation sexuelle d'une personne physique. (Article 9, paragraphe 1)
Nous respectons la confidentialité et la sécurité des utilisateurs, nous ne fournissons que des données agrégées anonymisées. Data365.co est également conforme au RGPD et protège les données personnelles et la confidentialité des citoyens de l'UE pour les transactions effectuées dans les États membres de l'UE.