Эксперт Semalt распавядае, як было высунута апрацоўка дадзеных у Інтэрнэце пастановай суда

Нягледзячы на тое, што можна скрабаваць дадзеныя з вэб-сайтаў без відавочнага дазволу ўладальнікаў сайта, нядаўна пры пэўных абставінах суддзя пастанавіў інакш. Нядаўна hiQ Labs распачала пазоў супраць LinkedIn за недапушчэнне атрымання дадзеных са старонак LinkedIn.

Для большасці людзей гэта стала грубым шокам, калі LinkedIn загадаў даць стартапу бясплатны доступ да сваіх вэб-старонак. hiQ выкарыстаў свае алгарытмы, каб вызначыць, калі карыстальнік LinkedIn шукае працу на аснове змен, якія карыстальнік уносіць у свой публічны профіль.

Алгарытмы працуюць на дадзеных, атрыманых з вэб-старонак LinkedIn. Як і чакалася, LinkedIn гэта не спадабалася, і былі прынятыя меры супрацьдзеяння, каб прадухіліць наступны здабыча дадзеных. Акрамя тэхнічных бар'ераў, якія былі ўсталяваны, таксама выносіліся жорсткія прававыя папярэджанні.

У стартапа не было іншага выйсця, як прыняць праблему на законных падставах. hiQ прыйшлося шукаць судовую кампенсацыю. Кампанія хацела, каб LinkedIn загадаў зняць тэхнічныя бар'еры. hiQ таксама хацеў, каб яго працэс вылучэння дадзеных на LinkedIn быў легалізаваны.

На шчасце для стартапа, ён атрымаў усё, што хацеў. Пастанова была на карысць hiQ. LinkedIn атрымаў загад зняць усе контрмеры, якія стрымліваюць hiQ, з вычышчэння яго (LinkedIn) вэб-старонак, а таксама даць бясплатную руку hiQ, паколькі гэты акт з'яўляецца цалкам законным. Суддзя заклікаў сваю пастанову да таго, што hiQ хоча вычысціць, гэта дадзеныя, якія былі выстаўлены для прагляду грамадскасці.

Суддзя не толькі загадаў падсуднаму зняць усе механізмы прафілактыкі, якія былі ўсталяваны супраць парта, але ён таксама загадаў адмовіцца ад падобных дзеянняў у будучыні.

Прасоўванне адкрытых дадзеных у Інтэрнэце

Нягледзячы на тое, што пастанова па-ранейшаму з'яўляецца часовай забаронай, чуваць, што закон падтрымлівае адкрытыя дадзеныя ў Інтэрнэце і свабодны доступ да інфармацыі ў Інтэрнэце, як гэта пацвярджае. Нават калі канчатковае рашэнне атрымае ў карысць адказчыка, гэты факт ужо ўстаноўлены.

Суддзя прасоўваў гэтую палітыку, спыняючы практычна ўсе аргументы LinkedIn. У той час як LinkedIn спрабаваў усталяваць, што пазоўнік парушае яго прыватнае жыццё, суддзя супрацьдзейнічаў гэтаму таму, што адказчык таксама прадаваў дадзеныя.

Калі аргумент не вытрымаў, абвінавачаны таксама заявіў, што акт hiQ быў грубым парушэннем Закона аб кампутарных махлярствах і злоўжываннях (CFAA), таму што стартап звяртаўся да сваіх сервераў, каб збіраць дадзеныя незаконна. Зноў аргумент быў прабіты. Ён быў адхілены на той падставе, што hiQ стварае толькі змест зместу на агульнадаступных, не абароненых старонках.

Суддзя аналізаваў справу, калі хтосьці ў працоўны час хадзіў у адкрытую краму. Такога чалавека нельга сказаць пра парушэнне. Такім чынам, hiQ не быў парушальным. Цікава, што суддзя пайшоў далей, каб растлумачыць, чаму ягоная пастанова знаходзіцца ў інтарэсах грамадства.

У двух словах, суд прызнаў, што ў поўным інтарэсе дазволіць праходжанне, здабыча і аналіз дадзеных для пошуку дадзеных. Такім чынам, гэта будзе згубнай палітыкай для стымулявання размяшчэння бар'ераў для свабоднага патоку інфармацыі.

Пра што вы павінны даведацца ад пастановы

Хоць у вас няма прычын здабываць дадзеныя непасрэдна з LinkedIn, вам варта вучыцца ў пастанове. Лепш гуляць у бяспецы, чытаючы і паважаючы файл robots.txt на ўсіх сайтах. Памятаеце, што пастанова па-ранейшаму з'яўляецца часовым забаронай. У канчатковым выніку гэта можа пайсці на карысць LinkedIn.

Нягледзячы на тое, што пастанова не можа закрануць цябе наўпрост, радуе, што федэральны суд падтрымлівае палітыку падтрымання Інтэрнэту для грамадскасці. Такім чынам, інфармацыя павінна быць даступнай і даступнай для тых, хто можа іх шукаць і добра выкарыстоўваць.

Веб-дадзеныя надзвычай карысныя для ўсіх, асабліва медыя-аналітыкаў, распрацоўшчыкаў, навукоўцаў дадзеных і некаторых іншых спецыялістаў. Такім чынам, пастанова - гэта жаданае развіццё.

mass gmail