范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

原始数据清洁度与数据产品权利强度

  背景  爱拼公司通过网络爬虫技术,从互联网公开信息中收集和分析了上亿条简历、招聘数据("原始数据"),基于原始数据研发衍生数据产品,于2014年6月发布涉案数据"662所高校学生毕业十年就业薪酬和就业行业分布"数据。
  2015年,好未来收购高考派。
  2017年,因好未来及其关联公司在高考派、高考帮相关网站、移动端应用、微信公众号等产品中使用和销售涉案数据,爱拼公司以其构成不正当竞争为由提起诉讼,索赔经济损失5000万。被告认为原告获取原始数据的手段不正当、原始数据不真实,不具有法律上的合法权益,因此不能基于反不正当竞争法主张权益。原告为证明涉案数据是原告自主研发及其市场价值,提供以下证据:
  A.《爱拼数据产品研发相关技术说明》,载明数据收集和研发流程如下: 通过爬虫技术获取原始数据;
  通过数据清洗、别名识别等技术,将原始数据整理成标准化的有效信息;
  对基础数据进行大数据分析和计算,最终得出涉案数据。
  B. 广东省科学技术情报研究所和广州市科技和信息化局出具的相关报告,用于证明原告的"人才大数据项目",是采用大数据分析采集技术、数据清洗技术、数据智能关联等技术,开发人才数据挖掘系统,具有创新与行业应用价值。
  C.提交《爱拼网:掘金高校就业大数据》等27篇网络报道,用于说明涉案数据的研发过程及市场价值。 被告从两方面进行抗辩:
  第一,原告无法也无权使用相关原始数据 被告认为,即使原告声称的"原始数据为通过爬虫自行抓取"说法属实,原告对第三方平台上的公开的个人信息进行抓取、保存的行为也会因为无视网站robots协议限制、突破访问限制而具有不正当性。为此,被告提交多个招聘平台的隐私隐私政策和用户协议、58同城网和领英网的robots协议进行证明。 原告反对,提出原始数据来自互联网中用户自行公开的信息,有大量网站在2014年时并没有设置robots协议,比如智联招聘网就没有,因此原告没有违反robots协议获取数据。
  第二,原告获取的原始数据是虚假的,由此分析得出的涉案数据亦不具有客观真实性,主要理由是: 原告抓取数据的目标网站,比如智联招聘网、猎聘网、前程无忧网,其网站中的简历可自行创建,网站亦表示自己不对简历的真实性进行核实,因此这些内容是否真实,无法保证; 原告宣称自己分析了4000万学生的数据,这个说法不合常理且属于虚假宣传,因为和中国教育在线网、新东方在线网等发布的毕业生数量数据相差甚远; 相关就业报告、调查报告基本都是采用抽样调查的方式进行,全样本调查不具有现实可能性,且调查报告花费时间长,并非短时间内能够完成,因此涉案数据并非真实客观,且不具有商业价值。
  裁判
  法院从举证责任分配、个人隐私或第三方平台权利、网络爬虫与访问权限三方面对双方诉辩意见进行分析与评价。第一,从举证责任分配角度进行分析:
  法院认为,原告提交以下证据并进行说明,已经尽到初步举证责任: 针对涉案数据所依赖的原始数据的来源、收集方式; 以及涉案数据的研发过程和使用的相关技术。
  被告如果认为原告该等市场行为,或者由此产生的商品或服务具有不正当性,应就其不正当性承担举证责任。
  但是,本案被告未能举证证明原告通过非法手段获取原始数据。
  其提交的部分网站的用户协议、隐私政策、robots协议等,都是在诉讼过程中取证的,没法证明2014年涉案数据完成之前、原告获取原始数据违反了相关平台的协议。第二,涉案数据是否侵犯个人隐私或第三方平台的相关权利?
  法院认为,在案证据没法证明原告获取原始数据的行为不合法或者侵犯了个人隐私或第三方平台权利: 涉案数据是在原始基础上进行二次开发的衍生数据,本身不涉及任何个人信息和隐私,不存在侵犯公民个人信息或隐私的可能; 涉案数据不会对原始数据或其提供者在市场中产生替代; 2014年涉案数据面试后,原告进行了大量的宣传报道,向社会公示其研发过程和成果,原告表示从未有任何第三方向它们主张过权利,也没有证据显示曾经存在这种情况。 第三,被告抗辩时提出过某些网站需要用户登陆才能看到完整数据,法院指出:首先,被告没有举证证明"哪些原始数据是需要用户登录才能获取的",也没有证明"2014年时哪些第三方平台需要登陆才能查看简历等信息"; 其次,原告表示确实存在通过程序模拟用户登录过程从而浏览第三方网站的情形,但目前没有证据显示有第三方因此向原告主张权利,所以本案无法仅仅因为存在这种情况,就当然地认为原告获取数据的行为不合法。 综上,法院对被告抗辩意见评价如下:被告与原始数据相关的抗辩意见也因和本案缺乏关联,不予采信。 被告提出的涉案数据不具有客观真实性,法院认为涉案数据准确、优劣与否,与原告对涉案数据享有合法权益并无必然关联,故不予采信被告的该项意见。 对于原告关于"原始数据"的主张,法院认为:
  原告关于原始数据内容和获取方式的相关意见,缺乏事实证据,与本案缺乏关联性,不予采信,因为: 本案原告不能提供原始数据; 原告主张自己通过爬虫技术获取原始数据,但提供的证据(技术说明和两份机构报告)只是对原始数据的内容、来源介绍,不能证明原始数据的具体内容和实际来源,也无法确认其与涉案数据之间的关联性和对应性。 但是法院并未因此否定涉案数据的价值和原告享有的合法权益,法院认为:涉案数据不同且独立于原始数据,是原告付出相关成本和智力劳动的经营成果 ; 涉案数据具有一定社会价值,也扩大原告收益范围和竞争优势; 原告使用涉案数据获取经营收益、市场份额及竞争优势,该种合法权益应受到反不正当竞争法的保护。 2020年3月3日,法院一审判决认定被告构成不正当竞争,但仅支持了50万元的经济损失索赔金额。
  双方均不服判决并提起上诉,2022年1月24日,二审法院判决驳回上诉,维持原判。
  结合裁判意见可知,获取原始数据的手段、原始数据的内容,会影响数据衍生产品权利基础的稳固性。
  本案被告相关抗辩未获支持,是因为被告未完成其举证责任,而不是说前述二者无关联;本案原告索赔5000万,判赔50万,也与其关于原始数据的主张未被采信不无关系。 参见:
  北京市海淀区人民法院在2020年3月3日作出的(2017)京0108民初51904号民事判决书;
  北京知识产权法院在2022年1月24日作出的(2020)京73民终3422号民事判决书。

vivo旗下5款新品已经入网4月发布,80w闪充全覆盖今天有博主爆料出了蓝厂X系列5款新品已经入网,都搭载80w闪充,4月份发布,将会是4月份的主场。这5款新品分别是vivoxnotevivoxfoldvivox80vivox80Pr傍花香,听春日柔风ZAKER搞机团南卡Litepro2音乐游戏双模式耳机评测搞机型号南卡Litepro2搞机作者boomclap推荐指数机器性价比前言继上次测评南卡T2耳机后,再次测评南卡产品南卡L监控摄像头经常离线,掌握好这三点,千里之外随心看你是否遇到这样的情况,购买了一个远程监控摄像头,在家看得好好的,但是一旦离开家却一直显示摄像头离线,怎么都连接不上。还有些用户出差到其他城市,却不能收到实时传输的视频画面,摄像机一中国天眼给力!重复快速射电暴身份证找到来源科技日报就像我们能够通过某地出现彩虹,判断这个地方刚下过雨一样,天文学家可以通过快速射电暴周边环境的复杂程度,确定其所处的演化阶段。基于中国天眼(FAST)等多项数据,我们首次抬头望!宇宙中有了一颗华中科技大学星长江日报大武汉客户端3月21日讯(记者陈晓彤通讯员王潇潇)3月21日,即将迎来70周年校庆的华中科技大学收到一份来自太空的礼物。国家天文台宣布,将永久编号52487号小行星命名为华SHM金融科技师认证学习NoSQL及大数据应用NoSQL泛指非关系型的数据库。随着互联网web2。0网站的兴起,传统的关系数据库在处理web2。0网站,特别是超大规模和高并发的SNS类型的web2。0纯动态网站已经显得力不从心耳聋耳背听不清现在助听器都有哪些先进技术?助听器的先进技术如同电脑智能手机等高科技产品一样,近年来助听器技术的发展如日中天。现在的助听器在科学的临床研究的基础上,拥有更快的处理速度日异月新的功能以及智能化的设计,传统的模拟35岁互联网技术人将何去何从互联网行业如果到了35岁还没有走向管理岗位,后续就比较被动,哪怕一线主管过了35如果40之前团队规模上不去或者没有总监的岗位,基本竞争力也会急剧下降,很多技术总监以上岗位倾向40岁软银创始人孙正义身价暴跌财富一年蒸发250亿美元据外媒报道,在过去一年里,日本软银集团创始人亿万富翁孙正义的财富急剧缩水250亿美元,降至目前的137亿美元。如今的他,每天都要多次查看软银的贷款价值比。这项指标是用净债务除以其持抄底!中概互联网中国互联网恒生互联网港股互联网怎么选?各位基金投资者朋友们大家好,科普基金理财知识,倡导理性投资理财。我是你们的老朋友,逐日学基金。长期以来,受到美监管中国反垄断港股加息等因素影响,科技互联网板块持续大幅调整。3月15港股彻底燃爆了!腾讯一举突破370港元,段永平上演抄底神话段永平,小霸王缔造者步步高创始人VO联合创始人拼多多创始人黄铮的导师著名投资人他拥有太多的光环,如今又因成功上演了抄底神话而再次引起投资江湖的广泛关注。很多人谈论起段永平时,无不津
一加已经为这些手机推出了四月补丁一加承诺过为旗下所有的智能手机提供至少两年的定期系统更新,但是普遍情况下我们都能看到,旗舰机型的系统更新时限要比中低端机长得多OnePlus2022年4月安全更新有什么新功能?4月能同时充电和读数据的一拖二苹果TypeC这是在手机充电的时候电脑可以读取手机数据的一拖二苹果TypeC接口的数据线。市面上你能买到的,任意买一款这种一拖二或者一拖多的数据线,都是只有充电的安卓手机和苹果手机都有的大户人家定档4月28!余承东官宣华为新旗舰即将发布,网友买不起系列进入2022年后,国内手机厂商再次敲响了机海战的号角,34月份发布的新机没有20部也有10来部了,消费者也看得眼花缭乱。让人失望的是,这么多新机之中,竟没有一部来自华为。此前传言三科技公司却狂揽多项设计大奖!OPPO为何对设计如此情有独钟?现如今的科技产品虽然科技创新是内核,但是每一个科技产品的设计也依然有着至关重要的地位,尤其是智能手机这种情况更加明显。毕竟人们在考虑硬件配置功能性之外,最看重的就是它的整体颜值够不零跑T03小型新能源汽车首选,智能又安全随着科技进步,我们的生活也发生了翻天覆地的变化,生活中的方方面面都开始进入智能化。纯电动汽车也在智能化道路上有了很大的突破,零跑T03也在不断优化和进步。凭借着自身的高性价比长续航新鲜早科技丨Twitter接受马斯克440亿美元收购协议CVC资本等公司考虑竞购东芝台积电2026年初交付首批2nm芯片21世纪经济报道数字经济课题组综合报道早上好,新的一天又开始了。在过去的24小时内,科技行业发生了哪些有意思的事情?来跟21tech一起看看吧。巨头风向标1Twitter接受马斯克铠侠拓展PSSD业务极至光速XD10开箱专为视频高清图片用户设计很多人喜欢用Mac笔记本进行图片处理视频编辑,安装几个大应用插件后,再拷贝一些素材文件,不小心容量就满了!实话实说苹果的东西是真贵啊,更换个大硬盘的费用往往都能够入手更大的移动固盘红外探测器简介红外探测器是一种把红外辐射变成电信号的转换器,分为热探测器和光子探测器两种。在热探测器中,由于入射辐射的热效应引起器件材料与温度有关参数(如电阻自发极化强度等)的变化,测量这些参数如何用最简单的方法判断一个项目是否值得入手?最近我发现b圈的项目是越来越多,花样层出不穷。有些项目简直就是看不起韭菜的智商,啥也没有,白皮书都不抄一个就出来忽悠人了。或者改一下名字连APP里面内容都不换就出来骗钱了。随便什么前端性能优化总结gzip压缩gzip压缩效率很高,可以达到70的压缩率npmiDcompressionwebpackplugin安装插件依赖configureWebpackconfigconstC大数据分析解决方案越大越好吗?大数据分析解决方案越大越好只有当您无法驾驭数据无序增长时,它才是一件坏事。NetApp大数据分析解决方案正好可以驾驭它。因此,您可以更快地移动,轻松地扩展,并提供最大化的正常运行时