范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Python带你采集抖音无水印视频内容,把你喜欢的视频保存

  前言
  嗨喽!大家好呀,这里是python茜吖~
  一个帮助用户表达自我,记录的视频平台。 记录美好、智能匹配音乐、一键卡点视频,超多原创、滤镜、场景切换帮你...
  今天我们就来用Python 采集无水印视频内容  环境介绍:python 3.8 解释器  pycharm 2021专业版 >>> 激活码 编辑器  谷歌浏览器  谷歌驱动  selenium >>> 驱动 >>> 浏览器  模块使用]:采集一个视频requests >>> pip install requests  re  采集多个视频selenium >>> pip install selenium==3.141.0 (3.141.0) 指定模块版本去安装
  使用这个模块安装浏览器驱动  time  模块安装问题:如果安装python第三方模块:    1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车     2. 在pycharm中点击Terminal(终端) 输入安装命令安装失败原因失败一: pip 不是内部命令
  解决方法: 设置环境变量
  失败二: 出现大量报红 (read time out)
  解决方法: 因为是网络链接超时, 需要切换镜像源
  清华:https://pypi.tuna.tsinghua.edu.cn/simple
  阿里云:https://mirrors.aliyun.com/pypi/simple/
  中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
  华中理工大学:https://pypi.hustunique.com/
  山东理工大学:https://pypi.sdutlinux.org/
  豆瓣:https://pypi.douban.com/simple/
  例如:pip3 install -i https://pypi.doubanio.com/simple/ 模块名
  失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入
  解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好
  或者你pycharm里面python解释器没有设置好  如何配置pycharm里面的python解释器?
  选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)点击齿轮, 选择add添加python安装路径pycharm如何安装插件?
  选择file(文件) >>> setting(设置) >>> Plugins(插件)点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese选择相应的插件点击 install(安装) 即可安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效  爬虫实现思路流程: (****)一. 数据来源分析确定爬取的内容是什么?
  爬取抖音视频内容通过开发者工具进行抓包分析 F12 或者 鼠标右键点击插件选择network
  I. 通过分析已经找到播放地址
  II. 去分析, 播放地址可以从什么获取
  对于视频播放url地址 进行一次转码 *** >>> 等会提取的时候 需要进行解码
  二. 代码实现步骤
  过程发送请求, 用python代码模拟浏览器去发送请求
  获取数据, 获取服务器返回响应数据
  解析数据, 提取视频url地址 以及 视频标题
  保存数据, 保存数据到本地开始我们的代码导入模块# 导入数据请求模块 import requests  # pip install requests  win + R 输入cmd # 导入正则 import re  # 内置模块 不需要大家去安装 import time  # 时间模块 from selenium import webdriver  # pip install selenium==3.141.0代码def drop_down():     """执行页面滚动的操作"""  # javascript     for x in range(1, 30, 4):  # 1 3 5 7 9  在你不断的下拉过程中, 页面高度也会变的         time.sleep(1)         j = x / 9  # 1/9  3/9  5/9  9/9         # document.documentElement.scrollTop  指定滚动条的位置         # document.documentElement.scrollHeight 获取浏览器页面的最大高度         js = "document.documentElement.scrollTop = document.documentElement.scrollHeight * %f" % j         driver.execute_script(js)   # 人怎么去操作浏览器的, 就怎么写代码... # 1. 打开一个浏览器或者下载一个浏览器吧 创建浏览器对象(实例化一个浏览器对象) driver = webdriver.Chrome() # 2. 输入一个网址 请求网址 driver.get("https://www.douyin.com/user/MS4wLjABAAAA4N4OrZzTSmCPp8vVAqCeyU215Kav2JgFv2Lfy4DNWRs") driver.implicitly_wait(10) # 3. 提取所有li标签 返回列表 # drop_down() lis = driver.find_elements_by_css_selector(".ECMy_Zdt") for li in lis:     html_url = li.find_element_by_css_selector("a").get_attribute("href")     print(html_url)     #  1. 发送请求, 用python代码模拟浏览器去发送请求     # url = "https://www.douyin.com/video/7066324040335592738"     # headers 作用 伪装python代码 伪装成浏览器 user-agent: 用户代理 浏览器基本身份标识  cookie 用于检测用户信息, 是否有登陆账号     headers = {         "cookie": "douyin.com; ttcid=444dfe8e89ff4d99b0662076ad171c8775; ttwid=1%7CTnFKlrGi3lHjKf5bshFdP9Nwu_Vsiwo-TxvX9NISgj8%7C1642083887%7Cfbfa904ea2900763eb6ac090bdd09014d80840da1ca485bbfea193d5401b330e; MONITOR_WEB_ID=6d75c626-96a0-4270-ac18-aa0090b5bdb8; MONITOR_DEVICE_ID=341246a2-17c2-4c11-9c70-3ffd2cda0ffa; MONITOR_WEB_ID=c27b9f4a-4917-4256-be93-e948308467e3; odin_tt=0510c3c4196f54b541a96ac64e8b585b3a755be85057da8a1f3fa068e3f7b75ca2de4345e2b856f1e7b3f9455d86079731fe7d07a9f10890f26855d3674858e1; _tea_utm_cache_6383=undefined; douyin.com; strategyABtestKey=1648291293.035; passport_csrf_token=e0b90cb756903c370592bd558c2b0cf5; passport_csrf_token_default=e0b90cb756903c370592bd558c2b0cf5; AB_LOGIN_GUIDE_TIMESTAMP=1648291292963; s_v_web_id=verify_l17q2u00_kNENOykG_BIPh_4VLs_AVDZ_yMj0GtFSNH1u; _tea_utm_cache_1300=undefined; _tea_utm_cache_2285=undefined; THEME_STAY_TIME=299042; IS_HIDE_THEME_CHANGE=1; msToken=5X5W_7rY6cmo_SaaiMyCREV1hCZs-Jd9b7whX5gNCZsd9FU0zCTWYYAl0VhqGGUCjKS3bQf0f191VXdWHPNgqUz08MHEhk6qWhu4wVOlxhLyh3Vliaw37NU=; __ac_nonce=0623f02e00009007ea9bb; __ac_signature=_02B4Z6wo00f010eZ3RAAAIDCJJMde2RciUNHvdmAALPkmrPh1wY1Ey-OtTubjdK69ub9bqUt9DNRx8aP7dPtbOjyxcxyyK6yToF.7c4e615hiM5fYGwFCq0x8jHiY7BYLt6JZLIH8y38eMikd9; home_can_add_dy_2_desktop=1; msToken=fSBhJysNLifNHon5sgM-8n_3ZzJD49mCn9GUHLQydo7g52tCvrhNEKMFhxKEKlAxdE-z7er6yxwoJyO7-C_RdyslJnPejx9AAnkluZ22tSxM4siS7FUuO8E=; tt_scid=T-Exmos8oZiW6Wkb0uEjKsqAdjzxSnn4nznfku9EUmnDmpgq6Me7VDpIiYW4Fv805451; pwa_guide_count=3",         "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.82 Safari/537.36"     }     response = requests.get(url=html_url, headers=headers)  #  表示的是响应对象 200状态码 请求成功     # 2. 获取数据     # print(response.text)  # 获取html字符串数据  服务器返回response响应文本数据     # 3. 解析数据     # findall 找到所有, 从什么哪里去找什么数据  正则匹配出来数据返回都是列表数据 [] 列表 [0] 取第一个元素     title = re.findall("(.*?) - 抖音", response.text)[0]     video_url = re.findall("src(.*?)vr%3D%2", response.text)[0]     # print(video_url)     video_url = requests.utils.unquote(video_url).replace("":"", "https:")  # 解码 并且使用replace字符串替换     # print(title)     # print(video_url)     # 4. 保存数据 视频数据内容     video_content = requests.get(url=video_url, headers=headers).content  # 对于视频播放地址发送请求,获取二进制数据内容     with open("video" + title + ".mp4", mode="wb") as f:         f.write(video_content)     print(title, "保存完成")视频地址
  python采集抖音孙一宁所发小视频~简单爬虫小案例_哔哩哔哩_bilibili尾语
  好了,我的这篇文章写到这里就结束啦!
  有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง
  喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

深夜静悄悄,辛勤劳累了一生的道尔顿躺下了,从此再也没有醒来风船计划2。0道尔顿,英国化学家物理学家。原子理论的提出者。他所提供的关键的学说,使化学领域自那时以来有了巨大的进展。道尔顿患有色盲症,这种病的症状引起了他的好奇心。他开始研究这个亚马逊上那些据说很好用的第三方工具软件真的好用吗?现在的亚马逊第三方管理软件有很多,但是真正好用的是决定于亚马逊卖家的业务情况和团队体量决定的,想要从采购到尾程全方面管理,还需要从软件中广告管理自动调价关键词布局等操作如何解决。比使用小米红米手机的感受历程本人是95年的年纪稍微大的大哥哥,小时候总想尝试一些新鲜事物,从小学时刚刚触碰的mp3再到初中时的诺基亚手机,然后再到使用性价比之王的小米红米手机,那时给与我的感觉就是红米手机带给别小看乡村大脚超市,一天营业额3000,京东华冠纷纷入局作为便利店的平替,农村的便民商业一直以来多以小卖部夫妻店的形式经营,难以品牌化和连锁化。不过,随着北京便民商业网点建设的进一步推进,大牌连锁便利店纷纷下沉,它们并非抢小卖部夫妻店的比亚迪海豹实车曝光零百加速仅需3。8秒,最大续航700kmIT之家4月25日消息,近日网上曝光了一组比亚迪海豹的实拍图,这款车型是比亚迪海洋网继海豚后的又一款车型,未来上市后竞争对手锁定特斯拉Model3等车型,从此前曝光的消息来看新车或又一款对标绿厂的高价低配机?简评小米Civi1S作为知名手机品牌,绿厂至今仍旧有很多款高价低配的机型,主要面向的往往是追求颜值和自拍的人群。而曾经主打性价比的小米,在经过多年的洗练后,也开始模仿绿厂推出一些高价低配的机型,比如小王毅先生,出任大树科技CEO近日,蔷薇大树科技有限公司(以下简称大树科技)高管层履新。4月22日,大树科技发布公告称,王毅先生出任大树科技CEO,全面负责公司日常经营管理。就任大树科技CEO之前,王毅曾是阿里一周科技精选奈飞的崩溃IBM的崛起以及马斯克对Twitter的持续运营本周科技板块的活跃程度因季度收益报告的发布而得到了突出的体现,奈飞遭受了打击,IBM得到了提振,ATT(T)和Verizon(VZ)等公司也进入了投资者的视线。哦,不过别担心特斯拉长安奔奔EStar国民版暂停接单缺芯少电下微型纯电市场全面溃缩?财联社4月22日讯(记者徐昊)外部成本的高企不小内部产品战略的调整,让长安汽车旗下奔奔EStar,成为继长城欧拉黑猫白猫等之后又一款暂停接单的A00级小车。4月24日,长安新能源发一季度国内手机市场出货量减少14,OPPO荣耀vivo位居前三4月25日,CINNOresearch发布了2022年第一季度国内智能手机市场的出货量情况。数据显示,在今年第一季度,国内手机市场共计出货7439万部,同比减少14。4,与此前市场苹果商店将下架长期不更新的应用程序据报道,苹果似乎将要开始逐渐下架长期不更新的App。在发送给受影响开发者的电子邮件中,苹果警告称,它将从应用程序商店中删除长时间内没有更新的应用程序,并给开发者30天的时间进行更新
中兴专注通信芯片设计并不具备芯片生产制造能力6月20日上午消息,中兴通讯今日发布声明称,自媒体针对中兴通讯7nm芯片规模量产5nm芯片开始导入的信息存在误读,在芯片设计领域,中兴通讯专注于通信芯片的设计,并不具备芯片生产制造LK分享自动驾驶能力验证的关键仿真测试详述自动驾驶汽车在进行规模化商用之前,必须进行充分的功能安全和性能安全试验验证,以确保驾驶员和其他交通参与者的安全。测试内容包括传感器算法执行器人机界面等。从应用功能性能的稳定性和鲁棒学习一些奇奇怪怪的金融魔法之SPAC0。引子前段时间抄的雪球大V陈达美股投资的作业。11刀进15刀出的PASC,据说是要定向收购FF的其实就是一个SPAC。SPAC就是众多奇奇怪怪金融手段中的一种。但是,金融的各种手名企头条全国6。5亿网民月收入不足5000元刘强东向瑞士捐赠物资全国6。5亿网民月收入不足5000元,超过八成网民学历低于大专4月28日,CNNIC发布第45次中国互联网络发展状况统计报告。报告显示,截至3月我国网民规模达9。04亿,中国网民人名企头条格力电器一季度少卖300亿元拼多多发布2019年年报董明珠透露格力电器近况一季度少卖300亿元,为呵护员工不会裁员格力电器董事长董明珠昨天完成了自己的直播首秀。对于昨天的直播表现,董明珠表示,主要还是以展示格力电器的产品为主,让网友自动驾驶要来了,智慧公路准备好了吗?近年来,汽车产业智能化变革备受瞩目,在自动驾驶技术落地过程中,单车智能发挥的作用有限,车路协同作为一种解决方案也逐渐成为业界共识。车联网发展,已从早期TSP平台发展到智能网联平台,力挺华为!中芯国际获国家注资200亿5月19日消息,近日,美国升级了对华为的制裁,甚至要限制台积电等供应商继续向华为供应芯片,以此来打击华为的半导体业务。而中芯国际是被广泛认为能够实现海思半导体芯片制造需求的企业。现名企头条贾跃亭破产重组方案通过贾跃亭在美资产或得以保全贾跃亭破产重组方案通过贾跃亭破产重组获超80投票债权人赞成备受关注的贾跃亭个人破产重组债权人投票结果正式出炉。据第三方计票网站EPIQ披露的信息显示,贾跃亭获得了超过80的已投票债贾跃亭仍为乐视网实际控制人,乐视网将继续向贾跃亭追偿贾跃亭仍为乐视网实际控制人,乐视网将继续向贾跃亭追偿5月12日,乐视网举行2019年度业绩网上说明会,乐视网董事武宝雨表示,如果公司退市,在老三板市场依然会持续经营,同时继续向相关名企头条董明珠快手直播3小时成交额达3。1亿董明珠快手直播3小时成交额达3。1亿,接近其去年线上店总交易额快手发布战报,董明珠,二驴平荣今晚为格力专场直播带货三小时,成交额达3。1亿。据悉,在去年格力电器举行的2019让世界名企头条华为回应美国允许参与5G标准建设阅文新合同即将出炉华为回应美或出台新规利好所有技术参与者,不涉及产品买卖路透社5月6日称,美国商务部可能接近达成一项新的规则,允许美国公司与华为重启谈判,在共同制定下一代通信技术5G标准方面进行合作