Data365.coのソーシャルメディアAPIを通じてデータを抽出することは合法ですか?
研究者や第三者が関心を持つ可能性のある公開情報は、Facebook、Instagram、Twitter、LinkedInなどのソーシャルメディアプラットフォームで入手可能です。これらの情報は、API、ウェブスクレイピング、その他の技術を通じて体系的に収集することができます。
アプリケーションプログラミングインターフェース(API)は、ソフトウェア開発者のためのライブラリまたは構造化されたツールセットであり、ソーシャルネットワークなどのバックエンドソフトウェアへのインターフェースを提供します。APIはプラットフォームのソースコードへの直接アクセスを提供しません。
APIは、短期間で大量のデータを収集するのに非常に役立ちます。
私たちは個人情報を尊重し、ソーシャルネットワークプラットフォームから公開されているデータのみを抽出します。高レベルの機密個人情報をスクレイピングすることはありません。
アプリケーションプログラミングインターフェース(API)は、ソフトウェア開発者のためのライブラリまたは構造化されたツールセットであり、ソーシャルネットワークなどのバックエンドソフトウェアへのインターフェースを提供します。APIはプラットフォームのソースコードへの直接アクセスを提供しません。
APIは、短期間で大量のデータを収集するのに非常に役立ちます。
私たちは個人情報を尊重し、ソーシャルネットワークプラットフォームから公開されているデータのみを抽出します。高レベルの機密個人情報をスクレイピングすることはありません。
ユーザーに関して合法的に収集できる公開情報はどのようなものですか?
APIを使用することで、独立した研究者や第三者は、ユーザーのプロフィールに関する公開情報や、公開投稿に対するコメントや反応を簡単にダウンロードし、ソーシャルメディアが社会に与える影響を研究することができます。
APIから以前に収集されたソーシャルメディアデータは、結局のところ、Facebookのウェブページや他のソーシャルネットワークのウェブページを訪れるユーザーに対して公開され、可視化されています。
私たちのAPIを使用することで、ユーザーデータから派生した情報を抽出できます。そのようなデータは、特定の個人やユーザーの識別を合理的に回避するために集約されます。
私たちは以下のルールに従います:
APIから以前に収集されたソーシャルメディアデータは、結局のところ、Facebookのウェブページや他のソーシャルネットワークのウェブページを訪れるユーザーに対して公開され、可視化されています。
私たちのAPIを使用することで、ユーザーデータから派生した情報を抽出できます。そのようなデータは、特定の個人やユーザーの識別を合理的に回避するために集約されます。
私たちは以下のルールに従います:
- ユーザー名とパスコードを必要とするプライベートデータはスクレイピングできません。
- ウェブスクレイピング行為を明示的に禁止するToS(利用規約)を遵守します。
- 著作権で保護されたデータをコピーしないでください。
- 機密情報はスクレイピングできません。
なぜ私たちのソーシャルメディアAPIを通じてデータを抽出することが合法なのですか?
私たちは、私たちのAPIが個人情報に関する主要な法的文書に従って合法と見なされるべき理由を説明します:
- CFAA(コンピュータ詐欺および濫用法)
- TOS(利用規約)
- GDPR(一般データ保護規則)
9月9日、アメリカの第9巡回控訴裁判所は、カリフォルニア州北部地区連邦地方裁判所からの控訴において、公共のウェブサイトからのデータスクレイピングはCFAA(コンピュータ詐欺および悪用法)に違反しないと判決を下しました。
裁判所はこの行為を合法化しただけでなく、公共のサイトであれば競合他社が自動的に情報を削除することを禁止しました。裁判所は、ウェブスクレイパーボットのアクセスはブラウザのアクセスと法的に異ならないという明確な論理を確認しました。どちらの場合も、「ユーザー」はオープンデータを要求し、それを自分の側で利用します。
最も重要なのは、控訴裁判所が下級裁判所の判決を支持し、LinkedInがhiQのウェブサイトからのデータスクレイピングを妨害することを禁止したことです。
最近のHiQ Labs対LinkedInのケースでは、第9巡回控訴裁判所が公開されているデータのスクレイピングは「無許可」のコンピュータアクセスには該当しないと判決を下しました。これは、所有者(この場合、データが保存されているサーバーの所有者)がウェブサイトの訪問者に対して停止命令を送信した場合でも同様です。ここでも、公共に利用可能な情報がある場合、そのスクレイピングはCFAAに違反しないという主張がなされています。
ソーシャルメディアプラットフォームから公共の情報をスクレイピングするためにサービス利用規約(TOS)に違反することは、研究者にとって合法である可能性があります。一部の人々が指摘しているように(Bruns, 2018, 2019; Halavais, 2019)、ソーシャルメディアに関する研究は公共の利益に資するものであり、学者やジャーナリストが研究目的でFacebookから公共情報を収集するのを防ぐためにCFAAを適用しようとすることは、第一修正の違反に該当します(コロンビア大学のナイト第一修正研究所, 2018; Sandvig, 2017) および自由な研究の人権の侵害(国連, 1976)。
このような主張が法的判断に影響を与えている証拠があります。著名な例として、Sandvig対Sessionsのケースがあり、ワシントンD.C.の裁判所は公開されている情報のスクレイピングはコンピュータ犯罪ではないと判断しました。たとえTOSが明示的に禁止していても(Williams, 2018)。重要な点は、研究者がスクレイピングしたい情報の公共性です。裁判所は次のように述べました。
裁判所はこの行為を合法化しただけでなく、公共のサイトであれば競合他社が自動的に情報を削除することを禁止しました。裁判所は、ウェブスクレイパーボットのアクセスはブラウザのアクセスと法的に異ならないという明確な論理を確認しました。どちらの場合も、「ユーザー」はオープンデータを要求し、それを自分の側で利用します。
最も重要なのは、控訴裁判所が下級裁判所の判決を支持し、LinkedInがhiQのウェブサイトからのデータスクレイピングを妨害することを禁止したことです。
最近のHiQ Labs対LinkedInのケースでは、第9巡回控訴裁判所が公開されているデータのスクレイピングは「無許可」のコンピュータアクセスには該当しないと判決を下しました。これは、所有者(この場合、データが保存されているサーバーの所有者)がウェブサイトの訪問者に対して停止命令を送信した場合でも同様です。ここでも、公共に利用可能な情報がある場合、そのスクレイピングはCFAAに違反しないという主張がなされています。
ソーシャルメディアプラットフォームから公共の情報をスクレイピングするためにサービス利用規約(TOS)に違反することは、研究者にとって合法である可能性があります。一部の人々が指摘しているように(Bruns, 2018, 2019; Halavais, 2019)、ソーシャルメディアに関する研究は公共の利益に資するものであり、学者やジャーナリストが研究目的でFacebookから公共情報を収集するのを防ぐためにCFAAを適用しようとすることは、第一修正の違反に該当します(コロンビア大学のナイト第一修正研究所, 2018; Sandvig, 2017) および自由な研究の人権の侵害(国連, 1976)。
このような主張が法的判断に影響を与えている証拠があります。著名な例として、Sandvig対Sessionsのケースがあり、ワシントンD.C.の裁判所は公開されている情報のスクレイピングはコンピュータ犯罪ではないと判断しました。たとえTOSが明示的に禁止していても(Williams, 2018)。重要な点は、研究者がスクレイピングしたい情報の公共性です。裁判所は次のように述べました。
スクレイピングは単に情報収集を容易にする技術的進歩であり、書き取りノートを取る代わりにテープレコーダーを使用することや、異なる位置からの一連の写真を撮る代わりにスマートフォンのパノラマ機能を使用することと本質的に異なるものではありません。(Sandvig対Sessions, 2018, p. 15)
公開されたデータは、プライバシー規制(GDPRなど)に準拠するためにどのように見えるべきか?
GDPRの第4条 個人データ保護によれば、
個人データとは、特定の自然人(「データ主体」)に関連する情報を指します。特定可能な自然人とは、名前、識別番号、位置データ、オンライン識別子、またはその自然人の身体的、身体的、遺伝的、精神的、経済的、文化的、または社会的アイデンティティに特有の1つまたは複数の要因を参照することによって、直接的または間接的に特定できる者を指します。
処理とは、個人データまたは個人データのセットに対して、手動または自動的手段を問わず、収集、記録、整理、構造化、保存、適応または変更、取得、照会、使用、伝達による開示、配布またはその他の方法での提供、整合または結合、制限、消去または破壊などのいずれかの操作または操作のセットを指します。
学術研究の目的において、規制に準拠した方法でデータを処理する最も簡単な方法は、被験者のインフォームドコンセントを取得することです(第6条第1項(a))。しかし、規制はまた、データ処理が「管理者または第三者が追求する正当な利益の目的に必要である場合」には合法であることを定めています(第6条第1項(f))。この記事はさらに、「正当な利益」とは、データ処理が「公共の利益のために行われる業務の遂行に必要である」ことを意味すると明記しています。したがって、学術研究が公共の利益に関わるものであることを一般的に容易に主張できるため、科学的目的のためのデータ収集、分析、および公表はGDPRによって保護されるべきです。
さらに、規制は、研究者がセンシティブデータを扱う場合には特に注意を払う必要があることを要求しています。一般的に、GDPRは、
GDPRの第4条 個人データ保護によれば、
個人データとは、特定の自然人(「データ主体」)に関連する情報を指します。特定可能な自然人とは、名前、識別番号、位置データ、オンライン識別子、またはその自然人の身体的、身体的、遺伝的、精神的、経済的、文化的、または社会的アイデンティティに特有の1つまたは複数の要因を参照することによって、直接的または間接的に特定できる者を指します。
処理とは、個人データまたは個人データのセットに対して、手動または自動的手段を問わず、収集、記録、整理、構造化、保存、適応または変更、取得、照会、使用、伝達による開示、配布またはその他の方法での提供、整合または結合、制限、消去または破壊などのいずれかの操作または操作のセットを指します。
学術研究の目的において、規制に準拠した方法でデータを処理する最も簡単な方法は、被験者のインフォームドコンセントを取得することです(第6条第1項(a))。しかし、規制はまた、データ処理が「管理者または第三者が追求する正当な利益の目的に必要である場合」には合法であることを定めています(第6条第1項(f))。この記事はさらに、「正当な利益」とは、データ処理が「公共の利益のために行われる業務の遂行に必要である」ことを意味すると明記しています。したがって、学術研究が公共の利益に関わるものであることを一般的に容易に主張できるため、科学的目的のためのデータ収集、分析、および公表はGDPRによって保護されるべきです。
さらに、規制は、研究者がセンシティブデータを扱う場合には特に注意を払う必要があることを要求しています。一般的に、GDPRは、
人種または民族的出自、政治的意見、宗教的または哲学的信念、または労働組合のメンバーシップを明らかにする個人データ、遺伝子データ、自然人を一意に特定するための生体データ、健康に関するデータ、または自然人の性生活や性的指向に関するデータの処理を禁じています。(第9条第1項)
私たちはユーザーのプライバシーとセキュリティを尊重し、集計された匿名データのみを提供します。Data365.coはGDPRに準拠しており、EU加盟国内で行われる取引においてEU市民の個人データとプライバシーを保護しています。