Easily download all the videos from TikTok.下载指定的抖音号的所有视频,爬虫
- python
- selenium
- BeautifulSoup
- redis
- 通过手机app分享链接直接爬取单个视频或者全部视频
- 新增web端,一键爬爬爬爬
- 爬取指定用户的所有视频
- 爬取包含指定搜索关键词的前1k个热门视频
- 爬取包含指定搜索关键词的前1k个热门用户
打开 https://www.douyin.com
,搜索你需要下载的up主,将up主主页链接粘贴至douyin_url.txt
文件中,可以同时下载多个up,每个up的链接独占一行,
文件最后一行用##end##
结尾
此处用冯提莫作为例子:
然后直接运行 python douyin.py 即可开始下载
直接修改_down_by_keyword
函数中间的key_word
变量即可
python http_server.py
- 爬虫首页: ip:8888
- 监控页面: ip:8888/q
- 抖音web版的html是由js生成,如果直接用requests获取html是没法获取到有效数据的,故而用selenium模拟浏览器获取html,然后再用BeautifulSoup解析url
- 抖音web版的数据是通过下滑鼠标刷新得到的,所以只用webdriver获取一次的话只能拿到前面十几条视频,所以此处用
js="var q=document.documentElement.scrollTop=100000"
模拟鼠标下滑,循环多次直到url的数量不再发生变化即视为已经获取到了所有视频播放页面的url - 拿到播放页面的url之后,通过正则
v26.douyinvod.com(.+?)%2F%3F
html拿到最终的视频链接(此处用selenium也可以实现)