爸爸偷偷看的小姐姐视频,Python自动下载,一次看个够吧!
小朋友们好,大朋友们好!
好久不见了,猫妹很想念大家。
怎么样,大家春节过得快乐吗?
有没有放鞭炮啊?
放鞭炮,那叫一个刺激,那叫一个痛快,那叫一个放松!
有鞭炮才叫过年咧!
玩烟花爆竹一定要在大人的看护下进行,在高兴之余将风险降到最低,安全最重要。
有没有收到很多压岁钱?
这都是长辈对咱们的关爱,一定要对长辈好一些啊!
虽然是春节,猫妹我觉得猫爸也是手机不离手,有空就偷偷刷小视频看。
到底看什么呢?
搞得这么神秘!
有一次,被我以迅雷不及掩耳之势,将脑袋凑了过去,原来是一些漂亮小姐姐的视频。
Python有很多应用领域,比如科学计算、人工智能、爬虫等。
今天,咱们就简单了解下Python在爬虫领域的强势地位。
爬虫初体验:牛
如果没有安装requests库,先用pip install指令安装下requests库。
我们用这个库来下载视频。
建立一个video文件夹,用于存放下载的视频。
在video建立一个py文件,并将下面内容拷贝到该py文件中: import requests def fire(page): url = "https://api-tinyvideo-web.yy.com/home/tinyvideosv2" headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36"} for _ in range(page): response = requests.get(url=url, headers=headers) data = response.json() data_list = data["data"]["data"] for d in data_list: video_url = d["resurl"] video_title = str(d["yyNum"]) + ".mp4" video_content = requests.get(url=video_url, headers=headers).content with open("video" + video_title, mode="wb") as f: f.write(video_content) print("保存完成:", video_title) if __name__ == "__main__": fire(5) print("完成")
下载日志:
下载到的视频:
尝试播放一个文件试下:
什么是爬虫
在计算机领域上的爬虫,通常是指网络爬虫,英文名Spider(网络蜘蛛)。
通过互联网上一个个的网络节点,进行数据的提取、整合以及存储,从而获取我们想要的部分。
我们所处的计算机网络,如果可以上网,很多信息都可以获取得到,当然也可以查看和下载,用计算机将这些资源自动分析和下载下来,就是爬虫。
举个简单的例子,就像春节放的鞭炮。
包装上写着多少响,就代表有多少个小炮,比如10000响表示一共10000个小炮,它们通过导火索连接了起来。
如果这10000个小炮没有连起来,我们可以一个一个放。
一个一个放,如果10000个,要放到什么时候?
有了导火索,这10000个小炮就可以自动依次放了。
就像爬虫,如果不用爬虫技术,我们当然可以手动下载上面的小姐姐视频,但每次下一个,下得都没有看得快。
有了爬虫呢,分析了其中的关系,用代码模拟了手动访问网站的功能,并模拟了手动下载过程。
这样一来,分分钟给你下载很多视频,保证比你看得快。
手动下载
我们先看下不用爬虫技术,怎么下载视频的。
首先,有个保存了小姐姐视频信息的网站,这个可以通过多种途径获得,就像咱上面用到的这个网站。
咱们直接打开这个网站,可以看到如下信息:
这里面密密麻麻很多信息,视频的地址就在这里面。
刷下这个网站,这里面的数据会变化,也就是会有不同的视频地址。
下面的resurl也就是resource url,视频资源地址:
你可以打开试下,就是在线的视频,可以手动下载。
关键代码含义
我们用到了requests,它是大名鼎鼎的爬虫框架,需要导入它。
fire就是下载函数,需要将页面刷新多少次,参数就传入多少,参数越大,刷新下载的视频就越多。
url就是保存视频信息jason格式的网址。
res = requests.get(url,headers=headers,params,timeout)
参数说明如下: url:要抓取的 url 地址。 headers:用于包装请求头信息。 params:请求时携带的查询字符串参数。 timeout:超时的时间,超过时间会抛出异常。
通过URL去向服务器发出请求,服务器再把相关内容封装成一个Response对象返回给我们,这是通过requests.get()实现的。
我们获取到的Response对象下有四个常用的方法(status_code、content、text、encoding)。 r=requests.get("https://www.baidu.com") r.status_code r.headers["content-type"] r.encoding r.text r.json r.request.headers
headers可以在开发者模式下,手动刷新网站获取该网站的headers。
response.json()返回结果的JSON对象
如果结果是以JSON格式编写的,否则返回错误。
Python请求通常用于从特定资源URI中获取内容。每当我们通过Python向指定URI发出请求时,它都会返回一个响应对象。
for _ in range(page):有时循环不关心其中的计数值,我们可以用_。
response.content能把Response对象的内容以二进制数据的形式返回,适用于图片、音频、视频的下载。
video_url:视频的链接
video_title:视频保存到本地的名称
video_content:视频文件
免费群、收费群
猫妹和猫爸计划未来建立一个免费群,一个收费群。
你感兴趣吗?
好了,今天的分享就到这里,谢谢朋友们的阅读。
我是猫妹,咱们下次见!
瓦妮莎万圣节悼念科比,站在科比和gigi画像前神情落寞万圣节是一个值得开心的日子,但对于瓦妮莎来讲,今年的万圣节有着不一样的意义。瓦妮莎万圣节悼念科比,站在科比和gigi画像前神情落寞!瓦妮莎在万圣节当天一共是化了两套妆容,一套是分享
23!国乒再爆冷门3大世界冠军同日输球,争冠热门无缘八强北京时间2022年11月5日,全国乒乓球锦标赛已经结束第2比赛日争夺,在团体赛中,三位世界冠军爆冷输球,分别是陈梦王楚钦林高远。陈梦所在的山东女团本来是争冠热门,却被山西队淘汰,无
早上好朋友,立冬特别好看的早晨问候图片,早安祝福语录立冬刮南风,皮袄挂墙根立冬刮北风,皮袄贵如金冻笔新诗懒写,寒炉美酒时温。醉看墨花月白,恍疑雪满前村。唐李白立冬清晨的阳光绽放着笑脸,每一缕都为你灿烂树上的叶子旋转着思念,每一片都把
没有一番静气,人生就过得很忐忑静,是一种至味。至味才隽永绵长。就跟我们吃素一样,别人看你们吃素有什么好吃的,就是一些菜叶子,但是我们吃得津津有味,每一样菜都感觉吃得很开心。不静,就是五味杂陈,就像世间人,总是喜
为什么说钝感力比敏感更重要?我们究竟是不是怪物?转眼就到了深秋,可是谁还记得月初时微博上那条亿级浏览量的微博,为什么说钝感力比敏感更重要?其中一位网友的回答戳中了不少人的心,因为敏感让自己承受双份的痛苦,既讨厌别人,更讨厌自己。
人生八九不如意这些年放得下你放得下姑娘,就是放不下心里那个叫梦想的东西。再见到他时,他更瘦了。我一边笑着接过他手里的行李,一边逗他说你怎么越来越像只猴了?他突然停住脚,歪着头,眨了一下眼睛对我讲
深夜感悟短暂的解脱,你今天有吗?又是那熟悉的街景,每天上下班都要走的必经之路那个熟悉不过的过街天桥。生存在这个熟悉而又陌生的城市,时时刻刻感觉到透不过气来。一直生活在儿时就向往的城市,但越活越觉得失去了自我。有时
水煮人生是时候了,从问天开始问水仿佛屈原从汨罗江发来一条微信探明了水的底线找到了十万个为什么共同的答案那是天地良心发现了磁悬浮都是水的飞翔在并不存在的世界云蒸霞蔚骗自己的鸟儿没法领会在顺势
当infp遇上infj同样是inf类型的人相遇,结果就很好玩,如果单纯的当朋友还好说,一旦擦出了不该有的火花,那么结局可就是另外一回事了。首先,二者都是属于怕麻烦的人群,于是呢,冷着冷着,就凉了,各扫门
今日立冬,声声祝愿伴你行走过了春的温暖,拥过了夏的热情,醉过了秋的浪漫,轻轻的,冬天来了。细雨生寒未有霜,庭前木叶半青黄。今日,我们迎来,冬季的第一个节气立冬。寒风吹来,黄叶丹枫纷纷飘落,给大地铺上了一层
6换1,76人重启杜兰特交易!马克西首轮签能否打动蔡崇信?截止目前,如果评选NBA联盟中哪支球队是争夺法国天才中锋文班亚马的最大热门,那么非火箭队莫属。塞拉斯不愧是摆烂的高手,火箭队在不知不觉中,再次坐稳了联盟副班长的位置。斯通此前两个赛