La información pública que pueda interesar a los investigadores o a terceros está disponible en las plataformas de redes sociales, como Facebook, Instagram, Twitter, LinkedIn, etc. Se puede recopilar sistemáticamente mediante API, web scraping y otras técnicas.

Una interfaz de programación de aplicaciones (API) es una biblioteca o conjunto estructurado de herramientas para desarrolladores de software que proporciona una interfaz para un software de fondo, por ejemplo, redes sociales. Las API no proporcionan acceso directo al código fuente de la plataforma.
Las API son realmente útiles para recopilar toneladas de datos en un corto período de tiempo.

Respetamos la información personal y extraemos de las plataformas de redes sociales solo los datos que están disponibles públicamente. No eliminamos información personal confidencial de alto nivel.
¿Qué tipo de información pública se puede recopilar legalmente sobre los usuarios?
Al usar la API, los investigadores independientes y terceros podían descargar fácilmente información pública sobre los perfiles de los usuarios, así como los comentarios y reacciones a las publicaciones públicas, para estudiar el impacto de las redes sociales en la sociedad.

Al fin y al cabo, los datos de las redes sociales que antes se recopilaban a través de la API están disponibles públicamente y son visibles para los usuarios que visitan las páginas web de Facebook o las páginas web de cualquier otra red social.

Con nuestras API, puede extraer información que se deriva de los datos de usuario. Luego, dichos datos se agregan para evitar razonablemente la identificación de una persona específica o del usuario.

Seguimos las reglas:
  • Los datos privados que requieren nombre de usuario y códigos de acceso no se pueden eliminar.
  • Cumplimiento de los ToS (Términos de servicio) que prohíben explícitamente la acción de raspado web.
  • No copies datos protegidos por derechos de autor.
  • La información confidencial no se puede extraer.
¿Por qué es legal extraer datos a través de nuestra API de redes sociales?
Explicaremos nuestro punto de vista sobre por qué nuestra API debe considerarse legal de acuerdo con los principales documentos legales sobre información personal:
  • CFAA (Ley de Fraude y Abuso Informático)
  • JUGUETES (Términos de servicio)
  • GDPR (Reglamento general de protección de datos)
El 9 de septiembre, el Tribunal de Apelaciones del Noveno Circuito de los Estados Unidos dictaminó (Apelación del Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California) que el raspado web de sitios públicos no infringe la CFAA (Ley de Fraude y Abuso Informático).

El tribunal no solo legalizó esta práctica, sino que también prohibió a los competidores eliminar automáticamente la información de su sitio si el sitio es público. El tribunal confirmó la lógica clara de que la entrada del robot web scraper no es legalmente diferente de la entrada del navegador. En ambos casos, el «usuario» solicita datos abiertos y hace algo con ellos de su parte.

Lo que es más importante, el tribunal de apelaciones también confirmó una sentencia de un tribunal inferior que prohíbe a LinkedIn interferir con el rastreo web de su sitio por parte de HiQ.

Más recientemente, en el caso HiQ Labs contra LinkedIn, el Tribunal de Apelaciones del Noveno Circuito dictaminó que extraer datos disponibles públicamente no constituye un acceso «no autorizado» a una computadora, incluso cuando el propietario (en nuestro caso, el propietario de los servidores donde se almacenan los datos) ha enviado una carta de cese y desistimiento al visitante del sitio web. Incluso en este caso, el argumento es que cuando parte de la información está disponible para el público, eliminarla no viola la CFAA.

Violar los términos de servicio (TOS) para extraer información pública de las plataformas de redes sociales podría ser legal para los investigadores. Como algunos han señalado (Bruns, 2018, 2019; Halavais, 2019), la investigación en las redes sociales sirve al interés público, y amenazar con aplicar la CFAA para impedir que académicos y periodistas recopilen información pública de Facebook con fines de investigación constituye una violación de la Primera Enmienda (Instituto Knight First Amendment de la Universidad de Columbia, 2018; Sandvig, 2017) y del derecho humano a la investigación gratuita (Naciones Unidas, 1976).

Hay evidencia de que esta línea de argumentación informa las decisiones legales. Un ejemplo destacado es el caso Sandvig contra Sessions, en el que un tribunal de Washington, D.C. dictaminó que extraer información disponible públicamente no es un delito informático, incluso cuando el TOS lo prohíba explícitamente (Williams, 2018). El punto clave es la naturaleza pública de la información que los investigadores desean recopilar. Como declaró el tribunal,
el raspado no es más que un avance tecnológico que facilita la recopilación de información; no es significativamente diferente de usar una grabadora en lugar de tomar notas escritas, o usar la función panorámica de un teléfono inteligente en lugar de tomar una serie de fotos desde diferentes posiciones. (Sandvig contra Sessions, 2018, pág. 15)
¿Qué aspecto deben tener los datos publicados para cumplir con las normas de privacidad (como el RGPD)?

Según el artículo 4. PROTECCIÓN DE DATOS PERSONALES del RGPD
Por datos personales se entiende cualquier información relativa a una persona física identificada o identificable («interesado»); una persona física identificable es aquella que puede identificarse, directa o indirectamente, en particular mediante referencia a un identificador como un nombre, un número de identificación, datos de ubicación, un identificador en línea o a uno o más factores específicos de la identidad física, fisiológica, genética, mental, económica, cultural o social de esa persona física.

Por procesamiento se entiende cualquier operación o conjunto de operaciones que se realice con datos personales o conjuntos de datos personales, ya sea por medios automatizados o no, como la recopilación, el registro, la organización, la estructuración, el almacenamiento, la adaptación o alteración, la recuperación, la consulta, el uso, la divulgación mediante transmisión, difusión o puesta a disposición de otro modo, la alineación o combinación, la restricción, el borrado o la destrucción.

Para los fines de la investigación académica, la forma más fácil de procesar los datos de manera que cumpla con el reglamento es obtener el consentimiento informado de los sujetos (art. 6 (1) (a)). Sin embargo, el reglamento también establece que el procesamiento de datos puede ser legal si «necesario para los fines de los intereses legítimos perseguidos por el controlador o por un tercero» (Art. 6 (1) (f)). El artículo especifica además que por «interés legítimo» se entiende que el procesamiento de datos es «necesario para la realización de una tarea de interés público». Por lo tanto, dado que, por lo general, es sencillo defender la investigación académica por considerarla de interés público, la recopilación, el análisis y la publicación de datos con fines científicos deberían estar protegidos por el GDPR.

Además, el reglamento exige que se preste especial atención en caso de que el investigador trate datos sensibles. En general, el GDPR prohíbe el procesamiento de
datos personales que revelen el origen racial o étnico, opiniones políticas, creencias religiosas o filosóficas o afiliación sindical, y el procesamiento de datos genéticos, datos biométricos con el fin de identificar de forma única a una persona física, datos sobre la salud o datos sobre la vida sexual u orientación sexual de una persona física. (Artículo 9 (1))
Respetamos la privacidad y la seguridad de los usuarios, y solo proporcionamos datos anónimos agregados. Data365.co también cumple con el RGPD y protege los datos personales y la privacidad de los ciudadanos de la UE en las transacciones que se realizan dentro de los estados miembros de la UE.