林沁---第二次作业

这个作业属于哪个课程	https://edu.cnblogs.com/campus/fzzcxy/ZhichengSoftengineeringPracticeFclass
这个作业要求在哪里	https://edu.cnblogs.com/campus/fzzcxy/ZhichengSoftengineeringPracticeFclass/homework/12532
这个作业的目标	通过自身学习，初步掌握网络爬虫技术
Github 地址	https://gitee.com/xi-guaqin/GoodsPUPU.git

一、【必做】基础：使用 fiddler 抓包工具+代码，实时监控朴朴上某产品的详细价格信息

了解任务流程

在看到任务的第一眼，首先是迷茫，因为本身没有学习过python语言，并且从未了解过网上爬虫的任何信息。后只能经同学们的讨论中得知，python对于网上爬虫有着很好的效果，但是其他语言也不是不可以。于是我开始从爬虫最基本的步骤开始做起。首先就是抓包，从云班课上面下载下Fiddler的ppt文件，开始了解Fiddler软件的一些配置信息以及通过哔哩哔哩以及网上的教程来用Fiddler软件。
开始配置Fiddler软件

通过PPT了解到，需要完成配置如下图：
抓包
- 首先将校园网改成自己的热点（校园网网络与Fiddler代理冲突）
- 然后打开Fiddler
- 登入微信打开朴朴小程序中的商品链接
- 通过Fiddler软件的抓捕，得到该商品的网站以及头部文件
下定决心使用Java语言爬虫

抓包完毕后开始纠结使用python语言爬虫还是Java，python语言需要自己再进行学习，而Java语言并没有python语言爬取数据用起来方便，后来经过思考认为我们现在主学的是Java，应当先主要学好一门语言，最后选择了Java语言来进行爬虫。
开始网上翻阅有关Java爬虫方面的资料*

通过B站搜索，并且网上的翻阅，发现该博主的方法能够通过网站http获取到其中的信息：https://www.cnblogs.com/peachh/p/13658125.html 并且了解到JSON的能够对获取到的信息进行更深层次的解析。
开始实践

打开IDEA，先是登入上方网站进行代码的测试，成功得能够在控制台输出出需要爬取网站的内容，后进行将得到的String类型的网站内容无法解析成JSON格式的字符串内容，于是通过百度了解到

JSONSerializer.toJSON（）能够完美的解决该问题。之后就是通过获取网站的data首部键值后相当于打开了网站信息的钥匙。通过作业内容我爬取出了商品名字信息、商品规格、商品价格、商品原价、商品详细信息等内容：

后根据计时器每五秒更新一次网站信息，获取实时价格：
主要代码展示
结果展示
程序结构框架展示