抖音视频评论采集软件C#源码客户端开发日志
因为太忙 就没有具体更新。因为最近DY更新的厉害,每次写好的提取端总是要用修改源代码的方式 更新 太麻烦了,所以花了点时间写成了活的。把标签存入数据库这样就不用每次修改源代码了。只需要更新数据库即可。(后面回给一个关于标签设置活的读取数据库中的代码)
系统包含了客户端和服务端。客户端就是给终端用户用的。服务端就是用来执行和解析提取客户提交的任务 进行评论提取和采集。
客户端内容包含:关键词评论提取设置,博主评论提取设置,单视频评论提取添加,实时搜索显示列表(实时搜索可以设置显示的评论时间段),历史记录任务搜索列表(历史任务搜索列表包含可以设置搜索地区)


提取段包含内容:
内容1:关键词评论提取 说明:是通过关键词搜索到的视频ID后开始逐个解析视频中的评论
解析内容包含:视频名称、视频作者名称、视频地址、视频日期、评论人昵称、评论日期、评论归属地、评论内容、评论人URL、评论人二维码。
内容2:博主评论提取 说明:通过另外一个程序解析博主的分享链接,进行获取博主视频的ID。将获取到的ID进行解析 解析内容包含:视频名称、视频作者名称、视频地址、视频日期、评论人昵称、评论日期、评论归属地、评论内容、评论人URL、评论人二维码。
内容3:单视频评论提取 说明:同样也是通过另外一个程序解析 单视频的分享链接,当然 这个解析分享链接 获取到视频ID要比博主解析 获取ID要简单的多。获取到后,将获取到的ID进行解析 解析内容包含:视频名称、视频作者名称、视频地址、视频日期、评论人昵称、评论日期、评论归属地、评论内容、评论人URL、评论人二维码。
内容4:关键评论监控,进行对提取过的视频ID进行24小时的网络监控评论。只监控最近时间内的,提取过的将不在提取。
内容5:博主评论监控。同样的道理 和关键词是一样的。
———————————————————————————————————————————
解析端包含内容:
解析端说明:用来解析通过客户端提交要解析的视频ID。只要先解析到ID才能解析对应的评论。
包含内容1:关键词ID搜索解析。 用于通过关键词和筛选条件进行视频ID的查询。
包含内容2:博主视频ID搜索和解析。用于通过客户端提交的博主分享链接和视频数量,进行博主的视频ID查询。(抖音)
包含内容3:视频ID解析
标签设置活后通过数据库读取。
标签读取内容包含:
标签1:视频名称标签 (用来获取视频名称)
标签2:视频作者标签(用来获取视频作者名称)
标签3:视频作者首页标签(用来获取视频作者的首页URL)
标签4:视频日期标签 (用来获取视频日期)
标签5:视频评论总体标签(用来获取评论大容器,用来怕判断评论是否正常显示)
标签6:视频评论总体2标签(用来获取每个评论的容器,用来循环容器数量获取标签容器中的评论数据)
标签7:评论人标签(用来获取评论人昵称)
标签8:评论内容标签(用来获取评论内容,图片和表情获取到的内容是空)
标签9:评论人URL开始标签(用来通过获取评论人的URL,获取开始标签)
标签10:评论人URL结束标签 用来通过获取评论人的URL,获取结束标签)通过正则表达式来获取这两个中间的Href
标签11:评论点击标签(用来判断是否加载出了评论图标)
标签12:确认点击评论标签 (用来自动点击评论容器,加载出视频评论)
标签13:评论下拉区域标签
————————————————
版权声明:本文为CSDN博主「爬虫,抖音视频,评论抓取」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/2503_92160904/article/details/151256795
浙公网安备 33010602011771号