用网络爬虫还是其他手段抓取数据？证据会说话

　　上篇写道，一审法院将社交平台数据以是否设置访问权限分为＂公开数据＂与＂非公开数据＂后，对被告Y公司抓取的数据类型进行评议，结论是Y公司抓取了＂非公开数据＂且不能合理解释、举证其抓取非公开数据行为的正当性。
　　随后，一审法院对Y公司到底是用何种手段抓取进行评议。
　　一审争议焦点：数据抓取方式
　　W公司的主张  W公司认为Y公司是用非法手段获取数据，即以直接攻击微博平台服务器的方式抓取后端数据，而非网络爬虫技术。
　　第一，未经授权抓取。Y公司不是微博后端数据的授权使用方。
　　第二，非搜索引擎类爬虫。Y公司自认了这一点。
　　第三，设置访问权限的页面不可能通过网络爬虫技术抓取。
　　网页懒加载、查看更多、翻页等功能，需要微博用户访问、操作才能显示内容，且过程中网页地址不会发生变化，而是根据用户操作、不断调取后端数据并呈现在前端。
　　网络爬虫获取的是url地址对应的初始页面，不包含上述内容。Y公司展示该等内容说明其抓取了后端数据，抓取方式不可能使用网络爬虫技术。
　　第四，W公司针对微博平台前端和后端数据都设置了技术保护措施，包括＂登录机制＂及＂反抓站技术＂。
　　其中，＂反抓站技术＂是指＂当对微博平台服务器进行频繁的、不正常的操作和访问时，将被服务器识别为非法行为并拒绝其虚假操作所发出的请求＂。W公司提出，如果Y公司使用网络爬虫技术，抓取这种量级的数据必然会受到反抓站技术反制；如果没受到反制，要么是使用了其他手段，要么是破坏或者绕开这些技术措施。W公司专家辅助人对Y公司可以采用的三种技术手段进行说明：
　　第一种，受限于登陆机制和反抓站技术的限制，为实现YJ系统采集数亿条数据及实时性，需要伪装成大量微博用户并模拟用户行为。
　　第二种，伪装成微博客户端，即破解了微博产品密钥，直接向微博平台服务器调取后端数据。但这种方式本身仍然受到反抓站技术限制，不可能无限调用，更不能调用「已经删除」或者「被用户设置为不展示」的数据。
　　第三种，直接攻击微博平台服务器——这种方式可以实时、无限地调用平台后端数据，可以实现抓取「已经删除」或者「被用户设置为不展示」的数据。
　　这三种方式均具有不正当性，结合YJ系统展示情形，W公司认为第三种是最有可能采用的方式。
　　Y公司的主张 Y公司否认自己采用非法手段抓取数据，称自己是根据用户请求、使用网络爬虫技术，对平台前端数据进行搜索和抓取，而且过程中没发现微博对这部分数据采取了限制或技术保护措施。
　　需要注意的是，W公司定义的＂前端数据＂是指用户可以可视化地看到或者直接识别出的内容。Y公司定义的＂前端数据＂包括网页源代码。Y公司专家辅助人对YJ系统的操作流程进行说明：用户在搜索框输入关键词，选择微博平台并添加监测后，YJ系统根据关键词用网络爬虫到微博平台采集数据并缓存到用户账号项下。 当用户刷新搜索、发出新请求时，网络爬虫会随之不断地向微博平台服务器发出请求，从而实现数据更新。 如果用户没有刷新搜索，但是设置关键词后还是停留在页面，YJ系统就会自动识别为用户正在使用产品，网络爬虫也还是会继续向微博平台服务器发出请求，从而实现数据更新。 前述网络爬虫非搜索引擎类爬虫，但技术原理相同；只要符合HTTP协议和HTML数据规范的网络爬虫都可以通过访问微博平台网页访问平台服务器。 关于网络爬虫技术如何操作等内容，Y公司没有提交证据。
　　一审法院评议
　　一审法院对Y公司无法自圆其说之处的解析已在上篇写道，此处不再重复。简单总结，就是在W公司专家辅助人已从技术层面对网络爬虫无法实现用户行为触发后才能展示的结果进行合理解释的情况下，Y公司未就此做进一步回应或者提交相反证据，其所称的使用网络爬虫技术抓取数据缺乏事实证明，无法得到法院支持。
　　二审新增争议焦点：数据接口  上诉时，Y公司提出曾在2011年获得W公司提供的五个数据接口，可通过数据接口合法获取数据。
　　这个说法推翻了它在一审期间的陈述，一审期间，Y公司明确自己是通过网络爬虫技术抓取数据，并在法院询问是否有其他方式时，明确否认。 二审法院对Y公司上诉时提交的证据进行审查并评议如下：
　　第一，关于国新办工作人员、W公司工作人员和Y公司工作人员的沟通内容。
　　Y公司主张2011年时国新办工作人员、W公司工作人员和Y公司工作人员，曾就YJ系统使用新浪微博数据的问题进行沟通，并且提供Y公司员工之间的往来邮件作为证据。
　　但是这些邮件都是Y公司员工之间转发的邮件，法院认为 转发邮件时，被转发的内容可以被修改 ，因此要求Y公司提供原始邮件，但是Y公司既没有提供原始邮件，也没有做出任何合理解释。
　　第二，W公司、Y公司工作人员的沟通内容。
　　Y公司提供了2017年10-11月期间，其工作人员与W公司工作人员关于＂微博-Y数据业务合作问题＂的往来邮件，法院认为其为孤证，既没有关于合作事项前因后果的相关证据，也没有详细的合同文本予以确认。
　　法院进一步指出，邮件本身的内容没有明确YJ系统是否可以＂未经授权使用新浪微博的高权限数据＂， 反而证明了W公司非常明确地向Y公司提出＂将微博数据商业化提供给政务领域的客户＂不属于许可使用的范围 。
　　第三， 五个接口至今可以登陆的证据。
　　Y公司还提交了五个接口账号至今可以登录的证据，但不能证明以下内容： 五个接口账号是否可以下载数据 可以获取数据的权限大小和范围 上述接口的提供方式、目的以及是否与YJ系统存在关联。
　　补充一点，W公司指出这些接口返回的数据极为有限，返回数据不超过20条，明显不可能达到YJ系统的效果。综上，Y公司主张YJ系统可以通过数据接口合法获取微博数据的意见缺乏事实依据，法院不予支持。
　　二审法院对＂网络爬虫抓取＂进行评议  对于Y公司一直主张的自己是使用网络爬虫技术获取数据的说法，一审判决指出其存在无法自圆其说、矛盾之处。Y公司在上诉时提交证据对一审判决提出的问题作出解释：关于可以显示＂已删除微博＂的原因，解释为通过不同时间点收集微博信息、加以比对，可以判断该微博已删除。 关于网络爬虫具体采用何种方式抓取大量信息，解释为在未登陆状态下，通过网络爬虫技术对某一关键词不停抓取，可以获得足够的信息。 关于为何可以显示精确到秒的发布时间，解释为通过获取网页源代码、进行时间戳编译的方法，可查询到精确到秒的发布时间。 二审法院认为上述解释不能成立：
　　第一，关于通过比对识别＂已删除微博＂的解释。
　　法院指出，进行比对，需要用户开始使用（YJ系统）一段时间后、收集不同时间节点的微博信息才能实现。
　　Y公司在一审时，声称只有在用户发出指令后，YJ系统才开始收集微博数据，而 在案证据显示 ，用户在YJ系统输入某一个关键词后，相关微博就已经会出现＂转＂＂评＂＂删＂的内容，而此时并不具备Y公司所称的「相隔多天后进行数据对比」的条件，因此该解释不成立。
　　第二，关于不停网络爬虫不停抓取，所以可以获得足以支撑YJ系统运行的信息量的解释。
　　在案证据和现场勘验情况显示 ，用户未登陆时可以查看的微博内容非常有限，而在YJ系统内输入某一关键词后，监测到的微博数量，远远超过未登陆状态下可获取的内容。
　　比如在YJ系统输入＂XXXX＂关键词后出来的相关微博有15万余条，Y公司也声称YJ系统＂每天收集境内外博文3亿余条＂。
　　Y公司提交的证据不仅不能证明面对海量微博信息，YJ系统是如何选定关键词并将信息有效整合，反而证明的W公司确实设置了＂用户行为触发＂等访问权限。
　　Y公司无法证明为什么它的网络爬虫可以抓取需要＂用户触发行为＂才可以加载的信息。
　　勘验结果显示，即使网络爬虫可以模拟用户行为，每次用户行为触发信息加载，都需要一定时间，网络爬虫面对多次触发才可以完整收集的微博信息，其获取、显示过程显然无法达到Y公司宣传的＂秒级＂更新频率。
　　二审法院认为，在不通过技术手段破坏或者绕开W公司所作的技术限制的情况下，无法实现Y公司所宣称的YJ系统所具有的功能。
　　第三，关于＂精确到秒＂的解释。
　　法院认为Y公司说明了一种技术上实现的可能性，但是并未提交任何证据证明YJ系统是用这种方式实现的。即使YJ系统确实是通过这种方式实现＂精确到秒＂，在Y公司无法对其他不能自圆其说之处作出合理解释的情况下，也无法推翻一审法院的认定结论。 综上，二审法院不支持Y公司的上诉主张，判断一审法院作出以下结论，并无不当：网络爬虫技术不足以支撑YJ系统运行所需要的数据量 Y公司是通过不正当手段获取微博数据
　　可以说，一二审整个过程写满八个大字——＂打官司就是打证据＂。
　　参考：2021年02月02日北京知识产权法院民事判决书（2019）京73民终3789号

谷歌向德国反垄断部门妥协，拟从搜索结果中删除新闻服务来源新浪科技据报道，德国反垄断机构联邦卡特尔局（FCO）今日表示，为了避免遭到进一步的反垄断调查，谷歌已提议从搜索结果中删除其新闻服务NewsShowcase的内容。德国联邦卡特尔现在的教师简直丧心病狂，对学生拳打脚踢扇耳光现在的教师太恶劣了，对学生打骂，甚至拳打脚踢，扇耳光，不知道违法吗？建议所有学生佩戴随身录像机上学，录下来取证举报。外形外观整体不错，我是绑在头盔上做行车记录仪用的，拍的视屏放电脑冬奥会通信保障智慧大脑正式启动AR数字化创新运维模式无线固话技术公网对讲服务1月10日，位于首钢园区内的中国联通冬奥通信运行指挥中心（TTOC）正式对外启用，全面投入冬奥通信运行保障体系的指挥调度工作。冬奥会通NFT也许有助于加速Web3。0应用推广虽然区块链本身提供了促进网络交换所有权和信任的技术结构，但在价值元素的数字化中，资产代币化是必不可少的。代币化是将资产和财产权利转换为区块链网络上的数字表示或代币的过程。区分加密货Python进度条importtimeforiinrange（0，100）定义长度time。sleep（0。1）时间currenti10进度条progressstr0s1。0。format（（int亚马逊全球开店发布2022年战略重点，赋能中国卖家打造全球品牌中国商报（记者张涛）1月11日，亚马逊全球开店中国在当天举行的线上跨境峰会上宣布进行品牌升级，提出助力出口跨境电商企业打造全球品牌的新主张，并分享了2022年的战略重点，包括支持卖运行内存和手机CPU谁更重要？这几款手机告诉你答案众所周知，现在购买手机不再像以前的功能机时代，只看手机造型和售价，现在的智能手机，很多时候甚至超过了电脑，我们能在手机上完成很多以前只能在PC端才能完成的工作。也是因此，现在我们购未来国家发展中，我们普通人的财富通道在哪？今后，在国家未来发展中，我们普通人的财富通道在于第三产业和乡村振兴。因为，第三产业是服务行业，这里面有很多做生意和创业机会。另外，在农村机会很多，乡村振兴已经接替脱贫攻坚。而且，农前端图片压缩优化工具conversion介绍imageconversion是一个简单易用的JS图片转换工具，提供了多种ImageCanvasFile和dataURL之间的转换方法。另外，imageconversion可以不是PPT造车！恒大首款电车正式下线，对标宝马X1许家印能否逆风翻盘？恒大首款汽车真的来了。1月12日，恒大正式官宣，恒驰5首款汽车下线，比原计划提前12天在天津工厂下线，这是恒大汽车推出的第一款车型，也意味着恒驰进入量产倒计时。恒大汽车的车型规划显澎湃三分频高端设计，幻彩光影效果加持，华为SoundX2021全面评测在智能音箱的细分领域里面，让很多人更多的在乎的是智能，伴随着生活品质的提升，对于音乐的理解也越来越高，智能音箱给我们带来的不仅仅是智能那么简单，而且还要拥有好的音质。在专业的领域自

<<<<<<－>>>>>>

奇瑞QQ冰淇淋预售2。99万起，4座布局6种配色，最高续航170公里在刚刚过去的9月份，笔者在新能源榜单上，又看到了宏光MINIEV的收割市场能力，即便是特斯拉ModelY同学有着超常发挥，但依然没干过风头正旺的宏光MINIEV这款小神车。宏光MI长城汽车9月销量出炉，总销超10万，炮大狗欧拉过万坦克破万在即日前，我们通过长城汽车官方渠道获得了其10月份的销量数据。根据官方数据显示长城汽车在9月份销量再次突破10万辆大关，达到了100022辆，虽然受到缺芯影响，但终端市场依然有良好的势新车到店实拍，北京U5PLUS6。99万起，安全配置高双联屏太拉风家轿市场一直是各汽车厂商必争之地，抛开那些合资品牌不说，近几年，中国车企们也纷纷在轿车市场发力，纷纷推出新车来抢占市场份额。除了吉利帝豪和长安逸动之外，比亚迪奇瑞荣威一汽北汽等厂商5G套餐狂魔！民营运营商1元门槛，网友移动好之为之行业新老交战小编发现，每个行业都存在新势力与传统势力的竞争，滴滴的出现让出租车行业更新换代，外卖的出现对于传统餐饮行业也有冲击，如今在通信行业同样如此。中国移动是众所周知的老大，用女车主花40万买奔驰全新C级，新车上高速漏油，4S店先拆车检测奔驰这个品牌对于国内消费者来说，那是相当熟悉了，在国内市场上，奔驰是身份和地位的象征，而很多人买奔驰车，也是冲着它的名气和品牌去的，花钱买个放心图个省心，开出去还有面子，何乐而不为吉利旗下路特斯将国产，首款车与宝马X5相当，动力堪比兰博基尼对于路特斯这个豪华跑车品牌，玩跑车的朋友估计都很熟悉，旗下的Evija全球超跑更定价达到了2188万元，路特斯在国际市场上路特斯甚至与法拉利保时捷齐名，并称世界三大跑车制造商，但在上市三年卖45万辆的探岳为何如此热销？如果问起中国消费者心目中最会造神车的品牌，大众必然是其中之一。尤其是在大热的SUV市场，看起来后知后觉的一汽大众却迅速打开市场，后来居上，再一次创造了大众传奇。将时间倒转回2018博越X上市11。28万起售，全系标配1。8T动力，百公里油耗仅7。7L写在前面与自己喜爱的歌手在沙滩上，进行一场音乐狂欢是一种什么感受？今天我们就来说说。不仅你可以与你喜爱的歌手在一起音乐狂欢，还可以与自己的爱车共同分享，用户至上的吉利用一场新车上市苹果春季发布会汇总新iPhone12史诗级增强版iPadProiMac迟到了一个多月，今天凌晨100苹果终于召开了春季特别活动，发布了全新的iPadProiMacAirTagAppleTV4K，以及紫色的新iPhone12。此次新品颇多，不过备受期待样子生活有容收纳床，有容量任意放，给您舒适自如生活前言作为一名自媒体工作者每晚熬夜写稿可以说是一种常态，熬夜晚睡不说，如碰上有时睡眠不好导致第二天精神状态不佳，不仅影响工作还极大的损伤自己的身体。有科学表明晚上睡不好觉除了与自己的EBC英宝纯房间空气环境机全面守护家人健康新房装修完毕后续安排家电进场方面诸如空气净化器加湿器新风机空气消毒检测仪以及空调等都缺一不可，那么请问市场上有没有这样一款产品同时兼具净化空气增加空气湿度检测甲醛以及调控温度等功能