Semaltの専門家が、裁判所の判決によりWebデータのスクレイピングがどのように合法化されたかを語る

サイトの所有者の明示的な許可なしにWebサイトからデータをこするのは違法かもしれませんが、裁判官は最近、特定の状況下で別の方法で裁定しました。 hiQ Labsは最近、LinkedInページからデータを抽出できないようにするためにLinkedInに対して訴訟を起こしました。
ほとんどの人にとって失礼な衝撃として、LinkedInがスタートアップにWebページへの無料アクセスを許可するように言われた。 hiQはそのアルゴリズムを使用して、LinkedInユーザーが自分のパブリックプロファイルに加えた変更に基づいて求人を探していることを検出しました。
アルゴリズムは、LinkedIn Webページから抽出されたデータで実行されます。予想通り、LinkedInはこれを気に入らず、hiQがそれ以上データを抽出できないように対策が講じられました。導入された技術的障壁とは別に、強力な言葉による法的警告も発令されました。
スタートアップは法的に問題を取り上げざるを得なかった。 hiQは法的救済を求めなければなりませんでした。同社はLinkedInに技術的な障壁を取り除くように命令したかった。 hiQは、LinkedInでのデータ抽出プロセスを合法化することも望んでいました。

幸いなことに、スタートアップにとって、それは望んだものを得た。判決はhiQを支持した。 LinkedInは、hiQがその(LinkedIn)Webページをスクレイピングするのを妨げているすべての対策を削除するように命じられました。裁判官は、hiQがスクレイピングしたいのはパブリックビューのために表示されたデータであるという事実に基づいて裁定を下しました。
裁判官は被告にhiQに対して実施されたすべての予防メカニズムを削除するように命じただけでなく、被告に将来そのような行為をやめるように命じました。
オープンウェブデータの宣伝
判決はまだ一時的な差し止め命令ですが、この判決が確認しているように、法律はオープンウェブデータとインターネット上の情報への無料アクセスをサポートしていると聞いて心温まるものです。最終決定が被告を支持することになったとしても、この事実はすでに確立されています。
裁判官は事実上すべてのLinkedInの議論を止めることによってこの方針を促進しました。 LinkedInは原告がプライバシーを侵害していることを証明しようとしたが、裁判官は被告もデータを販売しているという事実を理由に反論した。
抗議が水を保持しなかったとき、被告はまた、スタートアップがデータを違法に収集するためにサーバーにアクセスしたため、hiQの行為はコンピューター詐欺および虐待法(CFAA)の重大な違反であると述べた。再び、議論は穴をあけられました。 hiQが保護されていない一般公開ページのコンテンツのみを削っていたという理由で拒否されました。
裁判官は、営業時間中に誰かが開いている店に足を踏み入れた場合と同様に事件を類推しました。そのような人は不法侵入しているとは言えません。したがって、hiQは不法侵入ではありませんでした。興味深いことに、裁判官はさらに、彼の判決が公共の利益になる理由を説明しました。
簡単に言えば、裁判所は、データのクロール、抽出、分析を許可することは公共の利益になることを認めました。したがって、情報の自由な流れに対する障壁の配置を奨励することは有害なポリシーになります。
判決から何を学ぶべきか
LinkedInから直接データを抽出する理由はないかもしれませんが、判決から学ぶ必要があります。すべてのWebサイトのrobots.txtファイルを読んで尊重することにより、安全にプレイすることをお勧めします。判決はまだ一時的な差止命令であることを忘れないでください。最終的にはLinkedInに有利になるかもしれない。

判決が直接あなたに影響を与えることはないかもしれませんが、連邦裁判所がウェブを一般に公開したままにするという方針を支持することは嬉しいことです。したがって、情報は、検索してそれを有効に利用できる人々が利用でき、アクセスできる必要があります。
Webデータは、すべての人、特にメディアアナリスト、開発者、データサイエンティスト、およびその他の専門家に非常に役立ちます。そのため、今回の判決は歓迎すべき進展です。