中国国际贸易促进委员会

执法风暴下的大数据爬虫合规之路(4)

 
场景2:企业与第三方平台
 
常见做法4:
未经被爬取平台的授权直接爬取。
合规误区:
        平台上用户数据属于用户,已经获得用户授权,爬取平台上用户数据不需要平台授权同意。
风险分析:
(1)非法收集个人信息的风险
        对被爬取平台而言,未经其授权的数据爬取行为存在一定的安全风险,因此可能遭到被爬取平台基于平台安全的合法正当理由的封阻;未经第三方平台授权,通过破解技术爬取用户数据的行为可能构成《网安法》项下的窃取或以其他非法方式获取个人信息的违法行为《网安法》【第四十四、六十四条】、脉脉案中确定的三重授权原则)。
(2)不正当竞争及其他风险
        未经授权直接爬取第三方平台数据的行为,很可能构成“不劳而获”和“搭便车”、“侵犯商业秘密”(同业爬虫)、“妨碍、破坏正常运营”(破解爬虫)的不正当竞争情形。破解爬虫,可能构成“非法侵入他人网络、窃取网络数据的违法行为”,亦有可能构成“危害计算机信息系统安全的其他行为”,由此可能面临相应行政监管的风险,也有构成“非法获取计算机信息系统数据罪”或“破坏计算机信息系统罪”的刑事风险。(《反不正当竞争法》【第二、九、十二条】、《网安法》【第二十七条】、《计算机信息系统安全保护条例》【第七条】以及《刑法》【第二百八十五条、二百八十六条】
 
        近期监管机构的立法亦试图规范不正当的爬取行为,2019年5月28日,网信办发布关于《数据安全管理办法(征求意见稿)》,其中【第十六条】规定:网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。
 
        2019年9月9日,美国联邦第九巡回上诉法院判决维持了地区法院支持数据爬取方hiQ的初审裁定。其中的焦点认定是:因为公开数据缺少相应的保护措施(例如密码),hiQ 爬取LinkendIn公开数据的爬虫行为不构成CFAA意义上的“未经授权”或“超出授权”行为。该案对我国数据爬虫纠纷审判实践具有借鉴意义。

附件:


分享到微信新浪微博人人网0