Extrahiert Daten durch
Data365.co Social Media APIs sind legal?
Öffentliche Informationen, an denen die Forscher oder Dritte interessiert sein könnten, sind auf Social-Media-Plattformen wie Facebook, Instagram, Twitter, LinkedIn usw. verfügbar. Sie können systematisch über APIs, Web-Scraping und andere Techniken gesammelt werden.
Eine Anwendungsprogrammierschnittstelle (API) ist eine Bibliothek oder ein strukturierter Satz von Tools für Softwareentwickler, die eine Schnittstelle zu einer Backend-Software, beispielsweise sozialen Netzwerken, bietet. APIs bieten keinen direkten Zugriff auf den Quellcode der Plattform.
APIs sind sehr hilfreich, um in kurzer Zeit Tonnen von Daten zu sammeln.
Wir respektieren personenbezogene Daten und extrahieren von sozialen Netzwerkplattformen nur Daten, die öffentlich verfügbar sind. Wir löschen keine vertraulichen personenbezogenen Daten auf hohem Niveau.
Eine Anwendungsprogrammierschnittstelle (API) ist eine Bibliothek oder ein strukturierter Satz von Tools für Softwareentwickler, die eine Schnittstelle zu einer Backend-Software, beispielsweise sozialen Netzwerken, bietet. APIs bieten keinen direkten Zugriff auf den Quellcode der Plattform.
APIs sind sehr hilfreich, um in kurzer Zeit Tonnen von Daten zu sammeln.
Wir respektieren personenbezogene Daten und extrahieren von sozialen Netzwerkplattformen nur Daten, die öffentlich verfügbar sind. Wir löschen keine vertraulichen personenbezogenen Daten auf hohem Niveau.
Welche öffentlichen Informationen können legal über die Nutzer gesammelt werden?
Mithilfe der API könnten unabhängige Forscher und Dritte auf einfache Weise öffentliche Informationen über Nutzerprofile sowie Kommentare und Reaktionen auf öffentliche Beiträge herunterladen, um die Auswirkungen der sozialen Medien auf die Gesellschaft zu untersuchen.
Social-Media-Daten, die früher über die API gesammelt wurden, sind schließlich öffentlich verfügbar und für die Nutzer sichtbar, die die Webseiten von Facebook oder die Webseiten anderer sozialer Netzwerke besuchen.
Mithilfe unserer APIs können Sie Informationen extrahieren, die aus Benutzerdaten abgeleitet wurden. Diese Daten werden dann aggregiert, um die Identifizierung einer bestimmten Person oder des Benutzers vernünftigerweise zu vermeiden.
Wir halten uns an die Regeln:
Social-Media-Daten, die früher über die API gesammelt wurden, sind schließlich öffentlich verfügbar und für die Nutzer sichtbar, die die Webseiten von Facebook oder die Webseiten anderer sozialer Netzwerke besuchen.
Mithilfe unserer APIs können Sie Informationen extrahieren, die aus Benutzerdaten abgeleitet wurden. Diese Daten werden dann aggregiert, um die Identifizierung einer bestimmten Person oder des Benutzers vernünftigerweise zu vermeiden.
Wir halten uns an die Regeln:
- Private Daten, für die ein Benutzername und ein Passwort erforderlich sind, können nicht gelöscht werden.
- Einhaltung der Nutzungsbedingungen (Terms of Service), die das Web-Scraping ausdrücklich verbieten.
- Kopieren Sie keine urheberrechtlich geschützten Daten.
- Vertrauliche Informationen können nicht gelöscht werden.
Warum ist das Extrahieren von Daten über unsere Social Media API legal?
Wir werden unseren Standpunkt darlegen, warum unsere API gemäß den wichtigsten Rechtsdokumenten zu personenbezogenen Daten als legal angesehen werden sollte:
- CFAA (Gesetz über Computerbetrug und Missbrauch)
- TOS (Nutzungsbedingungen)
- DSGVO (Allgemeine Datenschutzverordnung)
Am 9. September entschied das Berufungsgericht des 9. Bezirks der USA (Berufung des Bezirksgerichts der Vereinigten Staaten für den Northern District of California) das Das Scraping öffentlicher Websites verstößt nicht gegen die CFAA (Gesetz über Computerbetrug und Missbrauch).
Das Gericht hat diese Praxis nicht nur legalisiert, sondern Wettbewerbern auch untersagt, Informationen automatisch von Ihrer Website zu entfernen, wenn die Website öffentlich ist. Das Gericht bestätigte die klare Logik, dass der Eintrag des Web Scraper Bots unterscheidet sich rechtlich nicht vom Eintrag des Browsers. In beiden Fällen fordert der „Nutzer“ offene Daten an — und macht seinerseits etwas damit.
Am wichtigsten ist, dass das Berufungsgericht auch ein unteres Gerichtsurteil bestätigte, das es LinkedIn verbietet, sich in das Web-Scraping seiner Website durch HiQ einzumischen.
In jüngerer Zeit entschied das Berufungsgericht des neunten Bezirks im Fall HiQ Labs gegen LinkedIn, dass Das Auslesen öffentlich zugänglicher Daten stellt keinen „unbefugten“ Zugriff auf einen Computer dar, auch wenn der Besitzer (in unserem Fall der Eigentümer der Server, auf denen die Daten gespeichert sind) hat dem Besucher der Website ein Unterlassungsschreiben geschickt. Auch hier lautet das Argument wenn einige Informationen der Öffentlichkeit zugänglich sind, verstößt das Auslesen dieser Informationen nicht gegen die CFAA.
Ein Verstoß gegen die Nutzungsbedingungen (TOS), um öffentliche Informationen von Social-Media-Plattformen zu entfernen, könnte für Forscher legal sein. Wie einige darauf hingewiesen haben (Bruns, 2018, 2019; Halavais, 2019), Recherchen in sozialen Medien dienen dem öffentlichen Interesse, und die Drohung, die CFAA anzuwenden, um zu verhindern, dass Wissenschaftler und Journalisten öffentliche Informationen von Facebook zu Forschungszwecken sammeln, stellt einen Verstoß gegen den First Amendment dar (Knight First Amendment Institute an der Columbia University, 2018; Sandvig, 2017) und des Menschenrechts auf freie Forschung (Vereinte Nationen, 1976).
Es gibt Hinweise darauf, dass diese Argumentationsweise rechtliche Entscheidungen beeinflusst. Ein prominentes Beispiel ist der Fall Sandvig gegen Sessions, in dem ein Gericht in Washington, D.C., entschied Das Auslesen öffentlich zugänglicher Informationen ist kein Computerverbrechen, auch wenn die Nutzungsbedingungen dies ausdrücklich verbieten (Williams, 2018). Der entscheidende Punkt ist der öffentliche Charakter der Informationen, die Forscher auslesen möchten. Wie das Gericht feststellte,
Das Gericht hat diese Praxis nicht nur legalisiert, sondern Wettbewerbern auch untersagt, Informationen automatisch von Ihrer Website zu entfernen, wenn die Website öffentlich ist. Das Gericht bestätigte die klare Logik, dass der Eintrag des Web Scraper Bots unterscheidet sich rechtlich nicht vom Eintrag des Browsers. In beiden Fällen fordert der „Nutzer“ offene Daten an — und macht seinerseits etwas damit.
Am wichtigsten ist, dass das Berufungsgericht auch ein unteres Gerichtsurteil bestätigte, das es LinkedIn verbietet, sich in das Web-Scraping seiner Website durch HiQ einzumischen.
In jüngerer Zeit entschied das Berufungsgericht des neunten Bezirks im Fall HiQ Labs gegen LinkedIn, dass Das Auslesen öffentlich zugänglicher Daten stellt keinen „unbefugten“ Zugriff auf einen Computer dar, auch wenn der Besitzer (in unserem Fall der Eigentümer der Server, auf denen die Daten gespeichert sind) hat dem Besucher der Website ein Unterlassungsschreiben geschickt. Auch hier lautet das Argument wenn einige Informationen der Öffentlichkeit zugänglich sind, verstößt das Auslesen dieser Informationen nicht gegen die CFAA.
Ein Verstoß gegen die Nutzungsbedingungen (TOS), um öffentliche Informationen von Social-Media-Plattformen zu entfernen, könnte für Forscher legal sein. Wie einige darauf hingewiesen haben (Bruns, 2018, 2019; Halavais, 2019), Recherchen in sozialen Medien dienen dem öffentlichen Interesse, und die Drohung, die CFAA anzuwenden, um zu verhindern, dass Wissenschaftler und Journalisten öffentliche Informationen von Facebook zu Forschungszwecken sammeln, stellt einen Verstoß gegen den First Amendment dar (Knight First Amendment Institute an der Columbia University, 2018; Sandvig, 2017) und des Menschenrechts auf freie Forschung (Vereinte Nationen, 1976).
Es gibt Hinweise darauf, dass diese Argumentationsweise rechtliche Entscheidungen beeinflusst. Ein prominentes Beispiel ist der Fall Sandvig gegen Sessions, in dem ein Gericht in Washington, D.C., entschied Das Auslesen öffentlich zugänglicher Informationen ist kein Computerverbrechen, auch wenn die Nutzungsbedingungen dies ausdrücklich verbieten (Williams, 2018). Der entscheidende Punkt ist der öffentliche Charakter der Informationen, die Forscher auslesen möchten. Wie das Gericht feststellte,
Scraping ist lediglich ein technologischer Fortschritt, der das Sammeln von Informationen erleichtert; es unterscheidet sich nicht wesentlich von der Verwendung eines Kassettenrekorders anstelle von schriftlichen Notizen oder der Nutzung der Panoramafunktion auf einem Smartphone, anstatt eine Reihe von Fotos aus verschiedenen Positionen aufzunehmen. (Sandvig gegen Sessions, 2018, S. 15)
Wie sollten veröffentlichte Daten aussehen, um den Datenschutzbestimmungen (wie der DSGVO) zu entsprechen?
Gemäß Artikel 4. SCHUTZ PERSONENBEZOGENER DATEN GEMÄSS GDPR
Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person („betroffene Person“) beziehen; eine identifizierbare natürliche Person ist eine Person, die direkt oder indirekt identifiziert werden kann, insbesondere durch Bezugnahme auf eine Kennung wie einen Namen, eine Identifikationsnummer, Standortdaten, eine Online-Kennung oder auf einen oder mehrere spezifische Faktoren, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser natürlichen Person sind.
Verarbeitung ist jeder Vorgang oder jede Vorgangsreihe, die mit personenbezogenen Daten oder mit Sätzen personenbezogener Daten ausgeführt wird, unabhängig davon, ob automatisiert oder nicht, wie das Erheben, Aufzeichnen, Organisieren, Strukturieren, Speichern, Anpassen oder Ändern, Abrufen, Abfragen, Verwenden, Offenlegen durch Übermittlung, Verbreitung oder sonstige Bereitstellung, Abgleich oder Kombination, Einschränkung, Löschung oder Zerstörung.
Für Zwecke der akademischen Forschung lassen sich die Daten am einfachsten vorschriftsgemäß verarbeiten, indem die informierte Einwilligung der Probanden eingeholt wird (Art. 6 (1) (a)). Die Verordnung sieht jedoch auch vor, dass die Datenverarbeitung rechtmäßig sein kann, wenn sie „zur Wahrung der berechtigten Interessen des für die Verarbeitung Verantwortlichen oder eines Dritten erforderlich“ (Artikel 6 Absatz 1 Buchstabe f). In dem Artikel wird weiter ausgeführt, dass „berechtigtes Interesse“ bedeutet, dass die Datenverarbeitung „für die Erfüllung einer im öffentlichen Interesse liegenden Aufgabe erforderlich ist“. Da es im Allgemeinen einfach ist, akademische Forschung als im öffentlichen Interesse liegend zu verteidigen, sollten die Datenerhebung, -analyse und -veröffentlichung für wissenschaftliche Zwecke durch die DSGVO geschützt werden.
Darüber hinaus verlangt die Verordnung, dass besondere Vorsicht geboten ist, wenn der Forscher mit sensiblen Daten umgeht. Im Allgemeinen verbietet die DSGVO die Verarbeitung von
Gemäß Artikel 4. SCHUTZ PERSONENBEZOGENER DATEN GEMÄSS GDPR
Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person („betroffene Person“) beziehen; eine identifizierbare natürliche Person ist eine Person, die direkt oder indirekt identifiziert werden kann, insbesondere durch Bezugnahme auf eine Kennung wie einen Namen, eine Identifikationsnummer, Standortdaten, eine Online-Kennung oder auf einen oder mehrere spezifische Faktoren, die Ausdruck der physischen, physiologischen, genetischen, psychischen, wirtschaftlichen, kulturellen oder sozialen Identität dieser natürlichen Person sind.
Verarbeitung ist jeder Vorgang oder jede Vorgangsreihe, die mit personenbezogenen Daten oder mit Sätzen personenbezogener Daten ausgeführt wird, unabhängig davon, ob automatisiert oder nicht, wie das Erheben, Aufzeichnen, Organisieren, Strukturieren, Speichern, Anpassen oder Ändern, Abrufen, Abfragen, Verwenden, Offenlegen durch Übermittlung, Verbreitung oder sonstige Bereitstellung, Abgleich oder Kombination, Einschränkung, Löschung oder Zerstörung.
Für Zwecke der akademischen Forschung lassen sich die Daten am einfachsten vorschriftsgemäß verarbeiten, indem die informierte Einwilligung der Probanden eingeholt wird (Art. 6 (1) (a)). Die Verordnung sieht jedoch auch vor, dass die Datenverarbeitung rechtmäßig sein kann, wenn sie „zur Wahrung der berechtigten Interessen des für die Verarbeitung Verantwortlichen oder eines Dritten erforderlich“ (Artikel 6 Absatz 1 Buchstabe f). In dem Artikel wird weiter ausgeführt, dass „berechtigtes Interesse“ bedeutet, dass die Datenverarbeitung „für die Erfüllung einer im öffentlichen Interesse liegenden Aufgabe erforderlich ist“. Da es im Allgemeinen einfach ist, akademische Forschung als im öffentlichen Interesse liegend zu verteidigen, sollten die Datenerhebung, -analyse und -veröffentlichung für wissenschaftliche Zwecke durch die DSGVO geschützt werden.
Darüber hinaus verlangt die Verordnung, dass besondere Vorsicht geboten ist, wenn der Forscher mit sensiblen Daten umgeht. Im Allgemeinen verbietet die DSGVO die Verarbeitung von
personenbezogene Daten, aus denen die rassische oder ethnische Herkunft, politische Meinungen, religiöse oder weltanschauliche Überzeugungen oder die Gewerkschaftszugehörigkeit hervorgehen, und die Verarbeitung genetischer Daten, biometrischer Daten zur eindeutigen Identifizierung einer natürlichen Person, Gesundheitsdaten oder Daten, die das Sexualleben oder die sexuelle Orientierung einer natürlichen Person betreffen. (Artikel 9 Absatz 1)
Wir respektieren die Privatsphäre und Sicherheit der Nutzer und stellen nur aggregierte anonymisierte Daten zur Verfügung. Data365.co ist außerdem DSGVO-konform und schützt die personenbezogenen Daten und die Privatsphäre von EU-Bürgern bei Transaktionen, die innerhalb der EU-Mitgliedstaaten stattfinden.