前言

本文主要是关于我写的抖音爬虫与抖音去水印工具的介绍。本项目支持通过分享链接去水印以及获取某用户发布的所有视频,代码已经开源在我的GitHub上,欢迎大家star。

开源地址:https://github.com/imgyh/douyin

抖音去水印工具demo:https://dy.0941314.xyz/

抖音爬虫Feature

  • 通过抖音个人主页分享链接开始爬取
  • 爬取抖音博主基本信息(昵称,粉丝数,作品数,关注人数等)
  • 爬取抖音博主所有的视频信息(无水印视频链接,视频ID,作品点赞分享评论数等)
  • 下载所有视频到本地

抖音去水印Feature

  • 通过视频分享链接获取去水印视频
  • 基于Flask实现交互界面

使用方法

抖音爬虫

这部分功能实现主要在这个文件中user_video_test.py。在以前的测试版本中需要向请求的api中填入signature参数,由于最近抖音网页版改变了api,增加了很多功能和B站界面的风格差不多,对于 signature 参数,经测试可以不要这个参数。如何生成signature参数可以参考skygongque

该功能是在python3.8.8环境中开发的,需要安装第三方的requests库。主要实现了三个功能:第一个是爬取抖音博主基本信息(昵称,粉丝数,作品数,关注人数等)并保存在字典中,该功能由get_user_info方法实现;第二个是爬取抖音博主所有的视频信息(无水印视频链接,视频ID,作品点赞分享评论数等)并保存在字典中,该功能由get_user_video方法实现;第三个是下载所有视频到本地,该功能由download方法实现。

抖音去水印工具

该工具是基于Flask框架开发,去水印主要由static,templates,main.py,single_video_test.py四个部分组成。
single_video_test.py是本地调试所写的代码,如果本地有Python环境可以直接运行该文件进行单个文件去水印下载。
static templates main.py是使用requestsFlask部署服务器上的程序,static文件夹是一些网页的静态文件,templates是首页的HTML代码,main.py则是使用Python实现的功能。该程序运行在3000端口,在浏览器输入http://yourIP:3000即可访问。在输入框内输入复制的抖音分享链接(全部复制进去,程序会自动获取网址链接),稍等片刻浏览器就开始下载去水印视频了。

ToDo

  • 获取视频中的每一条评论
  • 获取博主的关注与粉丝基本信息
  • 爬取某个博主的粉丝与关注的信息
  • 将信息保存到数据库中
  • 对数据进行分析
最后修改:2021 年 08 月 18 日 10 : 16 PM
如果觉得我的文章对你有用,请随意赞赏