Ist das Extrahieren von Daten über
Data365.co Social Media APIs legal?
Öffentliche Informationen, an denen Forscher oder Dritte interessiert sein könnten, sind auf Social Media Plattformen wie Facebook, Instagram, Twitter, LinkedIn usw. verfügbar. Sie können systematisch über APIs, Web Scraping und andere Techniken gesammelt werden.
Eine Anwendungsprogrammierschnittstelle (API) ist eine Bibliothek oder ein strukturiertes Set von Werkzeugen für Softwareentwickler, die eine Schnittstelle zu einer Backend-Software, beispielsweise sozialen Netzwerken, bereitstellt. APIs bieten keinen direkten Zugriff auf den Quellcode der Plattform.
APIs sind sehr hilfreich, um in kurzer Zeit eine große Menge an Daten zu sammeln.
Wir respektieren persönliche Informationen und extrahieren von Social Network Plattformen nur Daten, die öffentlich verfügbar sind. Wir scrapen keine hochsensiblen persönlichen Informationen.
Eine Anwendungsprogrammierschnittstelle (API) ist eine Bibliothek oder ein strukturiertes Set von Werkzeugen für Softwareentwickler, die eine Schnittstelle zu einer Backend-Software, beispielsweise sozialen Netzwerken, bereitstellt. APIs bieten keinen direkten Zugriff auf den Quellcode der Plattform.
APIs sind sehr hilfreich, um in kurzer Zeit eine große Menge an Daten zu sammeln.
Wir respektieren persönliche Informationen und extrahieren von Social Network Plattformen nur Daten, die öffentlich verfügbar sind. Wir scrapen keine hochsensiblen persönlichen Informationen.
Welche Art von öffentlichen Informationen kann legal über die Nutzer gesammelt werden?
Durch die Nutzung der API könnten unabhängige Forscher und Dritte problemlos öffentliche Informationen über Nutzerprofile sowie Kommentare und Reaktionen auf öffentliche Beiträge herunterladen, um die Auswirkungen von sozialen Medien auf die Gesellschaft zu untersuchen.
Soziale Mediendaten, die zuvor über die API gesammelt wurden, sind schließlich öffentlich verfügbar und für die Nutzer sichtbar, die die Webseiten von Facebook oder anderen sozialen Netzwerken besuchen.
Mit unseren APIs können Sie Informationen extrahieren, die aus Nutzerdaten abgeleitet sind. Solche Daten werden dann aggregiert, um die Identifizierung einer bestimmten Person oder des Nutzers vernünftig zu vermeiden.
Wir befolgen die Regeln:
Soziale Mediendaten, die zuvor über die API gesammelt wurden, sind schließlich öffentlich verfügbar und für die Nutzer sichtbar, die die Webseiten von Facebook oder anderen sozialen Netzwerken besuchen.
Mit unseren APIs können Sie Informationen extrahieren, die aus Nutzerdaten abgeleitet sind. Solche Daten werden dann aggregiert, um die Identifizierung einer bestimmten Person oder des Nutzers vernünftig zu vermeiden.
Wir befolgen die Regeln:
- Private Daten, die Benutzernamen und Passwörter erfordern, können nicht gescraped werden.
- Einhaltung der ToS (Nutzungsbedingungen), die das Web Scraping ausdrücklich verbietet.
- Kopieren Sie keine Daten, die urheberrechtlich geschützt sind.
- Vertrauliche Informationen können nicht gescraped werden.
Warum ist das Extrahieren von Daten über unsere Social Media API legal?
Wir werden unseren Standpunkt erläutern, warum unsere API als legal angesehen werden sollte, gemäß den wichtigsten rechtlichen Dokumenten über persönliche Informationen:
- CFAA (Computer Fraud and Abuse Act)
- TOS (Nutzungsbedingungen)
- GDPR (Allgemeine Datenschutzverordnung)
Am 9. September entschied das Berufungsgericht des 9. US-Bezirks (Berufung vom US-Bezirksgericht für den nördlichen Bezirk Kalifornien), dass das Scraping öffentlicher Webseiten nicht gegen das CFAA verstößt (Computer Fraud and Abuse Act).
Das Gericht legalisierte nicht nur diese Praxis, sondern untersagte auch Wettbewerbern, Informationen von Ihrer Webseite automatisch zu entfernen, wenn die Webseite öffentlich ist. Das Gericht bestätigte die klare Logik, dass der Zugang des Web-Scraping-Bots rechtlich nicht anders ist als der Zugang des Browsers. In beiden Fällen fordert der "Benutzer" offene Daten an — und tut etwas damit auf seiner Seite.
Am wichtigsten ist, dass das Berufungsgericht auch ein Urteil eines unteren Gerichts bestätigte, das LinkedIn untersagt, sich in das Web-Scraping von hiQ auf seiner Webseite einzumischen.
Kürzlich entschied das Berufungsgericht im Fall HiQ Labs gegen LinkedIn, dass das Scraping öffentlich verfügbarer Daten keinen "unbefugten" Zugang zu einem Computer darstellt, selbst wenn der Eigentümer (in unserem Fall der Eigentümer der Server, auf denen die Daten gespeichert sind) dem Besucher der Webseite eine Abmahnung geschickt hat. Selbst hier ist das Argument, dass wenn einige Informationen öffentlich verfügbar sind, deren Scraping nicht gegen das CFAA verstößt.
Das Verletzen der Nutzungsbedingungen (TOS), um öffentliche Informationen von sozialen Medien zu scrapen, könnte für Forscher legal sein. Wie einige angemerkt haben (Bruns, 2018, 2019; Halavais, 2019), Forschung über soziale Medien dient dem öffentlichen Interesse, und die Androhung, das CFAA anzuwenden, um Akademiker und Journalisten daran zu hindern, öffentliche Informationen von Facebook zu Forschungszwecken zu sammeln, stellt einen Verstoß gegen den Ersten Verfassungszusatz dar (Knight First Amendment Institute an der Columbia University, 2018; Sandvig, 2017) und des Menschenrechts auf freie Forschung (Vereinte Nationen, 1976).
Es gibt Hinweise darauf, dass diese Argumentationslinie rechtliche Entscheidungen beeinflusst. Ein prominentes Beispiel ist der Fall Sandvig gegen Sessions, in dem ein Gericht in Washington, D.C. entschied, dass das Scraping öffentlich verfügbarer Informationen kein Computerverbrechen darstellt, selbst wenn die TOS dies ausdrücklich verbietet (Williams, 2018). Der entscheidende Punkt ist die öffentliche Natur der Informationen, die Forscher scrapen möchten. Wie das Gericht feststellte,
Das Gericht legalisierte nicht nur diese Praxis, sondern untersagte auch Wettbewerbern, Informationen von Ihrer Webseite automatisch zu entfernen, wenn die Webseite öffentlich ist. Das Gericht bestätigte die klare Logik, dass der Zugang des Web-Scraping-Bots rechtlich nicht anders ist als der Zugang des Browsers. In beiden Fällen fordert der "Benutzer" offene Daten an — und tut etwas damit auf seiner Seite.
Am wichtigsten ist, dass das Berufungsgericht auch ein Urteil eines unteren Gerichts bestätigte, das LinkedIn untersagt, sich in das Web-Scraping von hiQ auf seiner Webseite einzumischen.
Kürzlich entschied das Berufungsgericht im Fall HiQ Labs gegen LinkedIn, dass das Scraping öffentlich verfügbarer Daten keinen "unbefugten" Zugang zu einem Computer darstellt, selbst wenn der Eigentümer (in unserem Fall der Eigentümer der Server, auf denen die Daten gespeichert sind) dem Besucher der Webseite eine Abmahnung geschickt hat. Selbst hier ist das Argument, dass wenn einige Informationen öffentlich verfügbar sind, deren Scraping nicht gegen das CFAA verstößt.
Das Verletzen der Nutzungsbedingungen (TOS), um öffentliche Informationen von sozialen Medien zu scrapen, könnte für Forscher legal sein. Wie einige angemerkt haben (Bruns, 2018, 2019; Halavais, 2019), Forschung über soziale Medien dient dem öffentlichen Interesse, und die Androhung, das CFAA anzuwenden, um Akademiker und Journalisten daran zu hindern, öffentliche Informationen von Facebook zu Forschungszwecken zu sammeln, stellt einen Verstoß gegen den Ersten Verfassungszusatz dar (Knight First Amendment Institute an der Columbia University, 2018; Sandvig, 2017) und des Menschenrechts auf freie Forschung (Vereinte Nationen, 1976).
Es gibt Hinweise darauf, dass diese Argumentationslinie rechtliche Entscheidungen beeinflusst. Ein prominentes Beispiel ist der Fall Sandvig gegen Sessions, in dem ein Gericht in Washington, D.C. entschied, dass das Scraping öffentlich verfügbarer Informationen kein Computerverbrechen darstellt, selbst wenn die TOS dies ausdrücklich verbietet (Williams, 2018). Der entscheidende Punkt ist die öffentliche Natur der Informationen, die Forscher scrapen möchten. Wie das Gericht feststellte,
Scraping ist lediglich ein technologischer Fortschritt, der die Informationssammlung erleichtert; es unterscheidet sich nicht wesentlich davon, ein Diktiergerät anstelle von handschriftlichen Notizen zu verwenden oder die Panorama-Funktion eines Smartphones anstelle von einer Reihe von Fotos aus verschiedenen Positionen zu nutzen. (Sandvig gegen Sessions, 2018, S. 15)
Wie sollten veröffentlichte Daten aussehen, um den Datenschutzbestimmungen (wie der DSGVO) zu entsprechen?
Gemäß Artikel 4. DATENSCHUTZ DER PERSONENBEZOGENEN DATEN der DSGVO
Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person ('betroffene Person') beziehen; eine identifizierbare natürliche Person ist eine, die direkt oder indirekt identifiziert werden kann, insbesondere durch Bezugnahme auf einen Identifikator wie einen Namen, eine Identifikationsnummer, Standortdaten, einen Online-Identifikator oder auf eine oder mehrere Merkmale, die spezifisch für die physische, physiologische, genetische, mentale, wirtschaftliche, kulturelle oder soziale Identität dieser natürlichen Person sind.
Die Verarbeitung umfasst jeden Vorgang oder eine Reihe von Vorgängen, die an personenbezogenen Daten oder an Datensätzen personenbezogener Daten durchgeführt werden, unabhängig davon, ob dies automatisiert erfolgt oder nicht, wie z.B. Erhebung, Speicherung, Organisation, Strukturierung, Anpassung oder Veränderung, Abruf, Konsultation, Nutzung, Offenlegung durch Übertragung, Verbreitung oder anderweitige Bereitstellung, Abstimmung oder Kombination, Einschränkung, Löschung oder Zerstörung.
Für akademische Forschungszwecke ist der einfachste Weg, die Daten auf eine Weise zu verarbeiten, die den Vorschriften entspricht, die informierte Zustimmung der Betroffenen einzuholen (Art. 6(1)(a)). Die Verordnung sieht jedoch auch vor, dass die Datenverarbeitung rechtmäßig sein kann, wenn sie "notwendig ist für die Verfolgung der berechtigten Interessen des Verantwortlichen oder eines Dritten" (Art. 6(1)(f)). Der Artikel spezifiziert weiter, dass "berechtigtes Interesse" bedeutet, dass die Datenverarbeitung "notwendig ist für die Erfüllung einer Aufgabe, die im öffentlichen Interesse durchgeführt wird." Daher sollte die Datenerhebung, -analyse und -veröffentlichung für wissenschaftliche Zwecke, da sie im Allgemeinen leicht als im öffentlichen Interesse stehend verteidigt werden kann, durch die DSGVO geschützt sein.
Darüber hinaus verlangt die Verordnung, dass besondere Sorgfalt walten gelassen wird, wenn der Forscher mit sensiblen Daten umgeht. Im Allgemeinen verbietet die DSGVO die Verarbeitung von
Gemäß Artikel 4. DATENSCHUTZ DER PERSONENBEZOGENEN DATEN der DSGVO
Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person ('betroffene Person') beziehen; eine identifizierbare natürliche Person ist eine, die direkt oder indirekt identifiziert werden kann, insbesondere durch Bezugnahme auf einen Identifikator wie einen Namen, eine Identifikationsnummer, Standortdaten, einen Online-Identifikator oder auf eine oder mehrere Merkmale, die spezifisch für die physische, physiologische, genetische, mentale, wirtschaftliche, kulturelle oder soziale Identität dieser natürlichen Person sind.
Die Verarbeitung umfasst jeden Vorgang oder eine Reihe von Vorgängen, die an personenbezogenen Daten oder an Datensätzen personenbezogener Daten durchgeführt werden, unabhängig davon, ob dies automatisiert erfolgt oder nicht, wie z.B. Erhebung, Speicherung, Organisation, Strukturierung, Anpassung oder Veränderung, Abruf, Konsultation, Nutzung, Offenlegung durch Übertragung, Verbreitung oder anderweitige Bereitstellung, Abstimmung oder Kombination, Einschränkung, Löschung oder Zerstörung.
Für akademische Forschungszwecke ist der einfachste Weg, die Daten auf eine Weise zu verarbeiten, die den Vorschriften entspricht, die informierte Zustimmung der Betroffenen einzuholen (Art. 6(1)(a)). Die Verordnung sieht jedoch auch vor, dass die Datenverarbeitung rechtmäßig sein kann, wenn sie "notwendig ist für die Verfolgung der berechtigten Interessen des Verantwortlichen oder eines Dritten" (Art. 6(1)(f)). Der Artikel spezifiziert weiter, dass "berechtigtes Interesse" bedeutet, dass die Datenverarbeitung "notwendig ist für die Erfüllung einer Aufgabe, die im öffentlichen Interesse durchgeführt wird." Daher sollte die Datenerhebung, -analyse und -veröffentlichung für wissenschaftliche Zwecke, da sie im Allgemeinen leicht als im öffentlichen Interesse stehend verteidigt werden kann, durch die DSGVO geschützt sein.
Darüber hinaus verlangt die Verordnung, dass besondere Sorgfalt walten gelassen wird, wenn der Forscher mit sensiblen Daten umgeht. Im Allgemeinen verbietet die DSGVO die Verarbeitung von
personenbezogenen Daten, die rassische oder ethnische Herkunft, politische Meinungen, religiöse oder philosophische Überzeugungen oder die Mitgliedschaft in einer Gewerkschaft offenbaren, sowie die Verarbeitung von genetischen Daten, biometrischen Daten zum Zweck der eindeutigen Identifizierung einer natürlichen Person, Daten über die Gesundheit oder Daten über das Sexualleben oder die sexuelle Orientierung einer natürlichen Person. (Art. 9(1))
Wir respektieren die Privatsphäre und Sicherheit der Nutzer und stellen nur aggregierte anonymisierte Daten zur Verfügung. Data365.co ist ebenfalls DSGVO-konform und schützt die personenbezogenen Daten und die Privatsphäre von EU-Bürgern für Transaktionen, die innerhalb der Mitgliedstaaten der EU stattfinden.