Python爬虫实战,wordcloud模块,简单分析Chrome浏览器浏览记录

前言

利用Python简单分析一下Chrome浏览器的网页浏览记录,我们一起愉快的学习吧。

开发工具

Python版本:3.6.4

相关模块:

pyecharts模块;

wordcloud模块;

以及一些Python自带的模块。

DB.Browser版本:3.11.0

环境搭建

关于python:

安装Python并添加到环境变量,pip安装需要的相关模块即可。

关于DB.Browser:

下载地址:

https://github.com/sqlitebrowser/sqlitebrowser/releases

建议下载免安装版本的(相关文件中也提供了免安装版本)。

原理简介

Chrome浏览器的网页浏览历史记录一般保存在:

C:\Users<USERNAME>\AppData\Local\Google\Chrome\UserData\Default\history

利用DB.Browser打开它,发现与历史浏览记录相关的表有urlsvisits

打开观察一下表的结构:

了解了表的结构之后,我们就可以愉快地写代码提取历史浏览记录了:

将获取到的数据进行简单的可视化,结果如下:

文章到这里就结束了,喜欢的朋友可以点波关注我每天分享Python数据爬虫案例系列(https://www.jianshu.com/nb/45921843),下篇文章分享是监控比特币价格走势

posted @ 2021-07-03 16:09  楚_阳  阅读(93)  评论(0编辑  收藏  举报