¿Es legal extraer datos a través de
Data365.co Social Media APIs?
La información pública que puede interesar a investigadores o terceros está disponible en plataformas de redes sociales, como Facebook, Instagram, Twitter, LinkedIn, etc. Se puede recopilar sistemáticamente a través de APIs, web scraping y otras técnicas.
Una interfaz de programación de aplicaciones (API) es una biblioteca o conjunto estructurado de herramientas para desarrolladores de software que proporciona una interfaz a un software de backend, por ejemplo, redes sociales. Las APIs no proporcionan acceso directo al código fuente de la plataforma.
Las APIs son realmente útiles para recopilar grandes cantidades de datos en un corto período de tiempo.
Respetamos la información personal y extraemos de las plataformas de redes sociales solo datos que son públicamente disponibles. No recopilamos información personal sensible de alto nivel.
Una interfaz de programación de aplicaciones (API) es una biblioteca o conjunto estructurado de herramientas para desarrolladores de software que proporciona una interfaz a un software de backend, por ejemplo, redes sociales. Las APIs no proporcionan acceso directo al código fuente de la plataforma.
Las APIs son realmente útiles para recopilar grandes cantidades de datos en un corto período de tiempo.
Respetamos la información personal y extraemos de las plataformas de redes sociales solo datos que son públicamente disponibles. No recopilamos información personal sensible de alto nivel.
¿Qué tipo de información pública se puede recopilar legalmente sobre los usuarios?
Al utilizar la API, investigadores independientes y terceros podrían descargar fácilmente información pública sobre los perfiles de los usuarios, así como comentarios y reacciones a publicaciones públicas, para estudiar el impacto de las redes sociales en la sociedad.
Los datos de redes sociales recopilados anteriormente de la API son, después de todo, públicamente disponibles y visibles para los usuarios que visitan las páginas web de Facebook o cualquier otra red social.
Usando nuestras APIs puedes extraer información que se deriva de los datos de usuario. Tales datos se agregan para evitar razonablemente la identificación de un individuo específico o del usuario.
Seguimos las reglas:
Los datos de redes sociales recopilados anteriormente de la API son, después de todo, públicamente disponibles y visibles para los usuarios que visitan las páginas web de Facebook o cualquier otra red social.
Usando nuestras APIs puedes extraer información que se deriva de los datos de usuario. Tales datos se agregan para evitar razonablemente la identificación de un individuo específico o del usuario.
Seguimos las reglas:
- No se pueden recopilar datos privados que requieran nombre de usuario y contraseñas.
- Cumplimiento de los Términos de Servicio (ToS) que prohíben explícitamente la acción de web scraping.
- No copies datos que estén protegidos por derechos de autor.
- No se puede recopilar información confidencial.
¿Por qué es legal extraer datos a través de nuestra API de redes sociales?
Explicaremos nuestro punto de vista sobre por qué nuestra API debe considerarse legal de acuerdo con los principales documentos legales sobre información personal:
- CFAA (Ley de Fraude y Abuso Informático)
- TOS (Términos de Servicio)
- GDPR (Reglamento General de Protección de Datos)
El 9 de septiembre, el tribunal de apelaciones del noveno circuito de EE. UU. dictó una sentencia (Apelación del Tribunal de Distrito de EE. UU. para el Distrito Norte de California) que el scraping de sitios públicos no viola la CFAA (Ley de Fraude y Abuso Informático).
El tribunal no solo legalizó esta práctica, sino que también prohibió a los competidores eliminar información de su sitio automáticamente si el sitio es público. El tribunal confirmó la lógica clara de que la entrada del bot scraper no es legalmente diferente de la entrada del navegador. En ambos casos, el "usuario" solicita datos abiertos — y hace algo con ellos en su lado.
Lo más importante es que el tribunal de apelaciones también confirmó una decisión de un tribunal inferior que prohíbe a LinkedIn interferir con el scraping de hiQ en su sitio.
Más recientemente, en el caso HiQ Labs v. LinkedIn, el Tribunal de Apelaciones del Noveno Circuito dictó que el scraping de datos disponibles públicamente no constituye un acceso "no autorizado" a una computadora, incluso cuando el propietario (en nuestro caso, el propietario de los servidores donde se almacenan los datos) ha enviado una carta de cese y desista al visitante del sitio web. Incluso aquí, el argumento es que cuando cierta información está disponible al público, hacer scraping de ella no viola la CFAA.
Violar los términos de servicio (TOS) para hacer scraping de información pública de plataformas de redes sociales podría ser legal para los investigadores. Como algunos han señalado (Bruns, 2018, 2019; Halavais, 2019), la investigación en redes sociales sirve al interés público, y amenazar con aplicar la CFAA para prevenir que académicos y periodistas recojan información pública de Facebook con fines de investigación constituye una violación de la Primera Enmienda (Knight First Amendment Institute en la Universidad de Columbia, 2018; Sandvig, 2017) y del derecho humano a la libre investigación (Naciones Unidas, 1976).
Hay evidencia de que esta línea de argumentación informa decisiones legales. Un ejemplo destacado es el caso Sandvig v. Sessions, donde un tribunal en Washington, D.C. dictó que hacer scraping de información disponible públicamente no es un crimen informático incluso cuando los TOS lo prohíben explícitamente (Williams, 2018). El punto clave es la naturaleza pública de la información que los investigadores desean hacer scraping. Como dijo el tribunal,
El tribunal no solo legalizó esta práctica, sino que también prohibió a los competidores eliminar información de su sitio automáticamente si el sitio es público. El tribunal confirmó la lógica clara de que la entrada del bot scraper no es legalmente diferente de la entrada del navegador. En ambos casos, el "usuario" solicita datos abiertos — y hace algo con ellos en su lado.
Lo más importante es que el tribunal de apelaciones también confirmó una decisión de un tribunal inferior que prohíbe a LinkedIn interferir con el scraping de hiQ en su sitio.
Más recientemente, en el caso HiQ Labs v. LinkedIn, el Tribunal de Apelaciones del Noveno Circuito dictó que el scraping de datos disponibles públicamente no constituye un acceso "no autorizado" a una computadora, incluso cuando el propietario (en nuestro caso, el propietario de los servidores donde se almacenan los datos) ha enviado una carta de cese y desista al visitante del sitio web. Incluso aquí, el argumento es que cuando cierta información está disponible al público, hacer scraping de ella no viola la CFAA.
Violar los términos de servicio (TOS) para hacer scraping de información pública de plataformas de redes sociales podría ser legal para los investigadores. Como algunos han señalado (Bruns, 2018, 2019; Halavais, 2019), la investigación en redes sociales sirve al interés público, y amenazar con aplicar la CFAA para prevenir que académicos y periodistas recojan información pública de Facebook con fines de investigación constituye una violación de la Primera Enmienda (Knight First Amendment Institute en la Universidad de Columbia, 2018; Sandvig, 2017) y del derecho humano a la libre investigación (Naciones Unidas, 1976).
Hay evidencia de que esta línea de argumentación informa decisiones legales. Un ejemplo destacado es el caso Sandvig v. Sessions, donde un tribunal en Washington, D.C. dictó que hacer scraping de información disponible públicamente no es un crimen informático incluso cuando los TOS lo prohíben explícitamente (Williams, 2018). El punto clave es la naturaleza pública de la información que los investigadores desean hacer scraping. Como dijo el tribunal,
el scraping es simplemente un avance tecnológico que facilita la recolección de información; no es significativamente diferente de usar una grabadora en lugar de tomar notas escritas, o usar la función de panorama en un teléfono inteligente en lugar de tomar una serie de fotos desde diferentes posiciones. (Sandvig v. Sessions, 2018, p. 15)
¿Cómo debería verse la información publicada para cumplir con las regulaciones de privacidad (como el GDPR)?
De acuerdo con el Artículo 4. PROTECCIÓN DE DATOS PERSONALES del GDPR
Los datos personales son cualquier información relacionada con una persona física identificada o identificable ('sujeto de datos'); una persona física identificable es aquella que puede ser identificada, directa o indirectamente, en particular mediante la referencia a un identificador como un nombre, un número de identificación, datos de ubicación, un identificador en línea o a uno o más factores específicos de la identidad física, fisiológica, genética, mental, económica, cultural o social de esa persona física.
El procesamiento significa cualquier operación o conjunto de operaciones que se realizan sobre datos personales o sobre conjuntos de datos personales, ya sea por medios automatizados o no, como la recolección, grabación, organización, estructuración, almacenamiento, adaptación o alteración, recuperación, consulta, uso, divulgación por transmisión, difusión o de otro modo poner a disposición, alineación o combinación, restricción, borrado o destrucción.
A efectos de la investigación académica, la forma más sencilla de procesar los datos de manera que cumpla con la regulación es obteniendo el consentimiento informado de los sujetos (Art. 6(1)(a)). Sin embargo, la regulación también establece que el procesamiento de datos puede ser lícito si es "necesario para los fines de los intereses legítimos perseguidos por el responsable o por un tercero" (Art. 6(1)(f)). El artículo especifica además que "interés legítimo" significa que el procesamiento de datos es "necesario para el desempeño de una tarea realizada en interés público." Por lo tanto, dado que generalmente es sencillo defender la investigación académica como relacionada con el interés público, la recolección, análisis y publicación de datos con fines científicos debería estar protegida por el GDPR.
Además, la regulación exige que se tenga un cuidado particular en caso de que el investigador trate con datos sensibles. En general, el GDPR prohíbe el procesamiento de
De acuerdo con el Artículo 4. PROTECCIÓN DE DATOS PERSONALES del GDPR
Los datos personales son cualquier información relacionada con una persona física identificada o identificable ('sujeto de datos'); una persona física identificable es aquella que puede ser identificada, directa o indirectamente, en particular mediante la referencia a un identificador como un nombre, un número de identificación, datos de ubicación, un identificador en línea o a uno o más factores específicos de la identidad física, fisiológica, genética, mental, económica, cultural o social de esa persona física.
El procesamiento significa cualquier operación o conjunto de operaciones que se realizan sobre datos personales o sobre conjuntos de datos personales, ya sea por medios automatizados o no, como la recolección, grabación, organización, estructuración, almacenamiento, adaptación o alteración, recuperación, consulta, uso, divulgación por transmisión, difusión o de otro modo poner a disposición, alineación o combinación, restricción, borrado o destrucción.
A efectos de la investigación académica, la forma más sencilla de procesar los datos de manera que cumpla con la regulación es obteniendo el consentimiento informado de los sujetos (Art. 6(1)(a)). Sin embargo, la regulación también establece que el procesamiento de datos puede ser lícito si es "necesario para los fines de los intereses legítimos perseguidos por el responsable o por un tercero" (Art. 6(1)(f)). El artículo especifica además que "interés legítimo" significa que el procesamiento de datos es "necesario para el desempeño de una tarea realizada en interés público." Por lo tanto, dado que generalmente es sencillo defender la investigación académica como relacionada con el interés público, la recolección, análisis y publicación de datos con fines científicos debería estar protegida por el GDPR.
Además, la regulación exige que se tenga un cuidado particular en caso de que el investigador trate con datos sensibles. En general, el GDPR prohíbe el procesamiento de
datos personales que revelen el origen racial o étnico, opiniones políticas, creencias religiosas o filosóficas, o afiliación sindical, y el procesamiento de datos genéticos, datos biométricos con el propósito de identificar de manera única a una persona física, datos relacionados con la salud o datos sobre la vida sexual o la orientación sexual de una persona física. (Art. 9(1))
Honramos la privacidad y seguridad de los usuarios, proporcionamos solo datos agregados y anonimizados. Data365.co también cumple con el GDPR y protege los datos personales y la privacidad de los ciudadanos de la UE para las transacciones que ocurren dentro de los estados miembros de la UE.