01 2020 档案
摘要:最近在过年以及躲避疫情。。。。 汇报一下组一斤的收获吧,其实也不多,但是着实费了很大的力气,我现在正在修生养息阶段,接下来先着手一下其他方面的内容, 首先,关于webmagic的,获取下一页的操作,目前能够成功的是使用Selenium的操作,在几天这个就成功了,但是之后的操作由于缺少函数,我现在还未
阅读全文
摘要:现在算是有点小数据了,经过这些天的努力,我得到了第一页的数据,以及信件的内容: 实现代码: 1 package com.ms.test; 2 3 import java.util.List; 4 5 import us.codecraft.webmagic.Page; 6 import us.cod
阅读全文
摘要:今天在获取一个网页的具体内容时遇到了一些小麻烦, 源代码: 1 package com.ms.test; 2 3 import us.codecraft.webmagic.Page; 4 import us.codecraft.webmagic.Site; 5 import us.codecraft
阅读全文
摘要:这个呢,是我在写一个爬虫时遇到的问题,关于问题的描述是这样的,我有一个字符串,想得到其中的一段,即截取其中的一部分所用,方法如下: 使用substring(start,stop)方法,在W3中对于这个函数的解释链接:https://www.w3school.com.cn/js/jsref_subst
阅读全文
摘要:我的老天,这个问题可是困扰了我许久,问题呢是这样的:摘自本人博客,有兴趣的可以去看看:https://q.cnblogs.com/q/125446/ 问题呢大概是,我获取到了我想要的但又不是很准确的信息,现在呢,我想准确获取我想要的信息,由于困在了webmagic的思路里,我一直在想webmagic
阅读全文
摘要:在我们运行java程序时,如果没有配置好的话,你在运行时就会出现这个错误, 属实让人心慌,这个问题其实很好解决,产生的原因也只是因为自己没有log4j.properties这个文件。 在网上找了半天,虽然知道问题之所在,但是不能很好解决,那可能是因为你建错了位置,本人就曾尝试着在项目上建立这个log
阅读全文
摘要:今日整理webmagic的知识点。 所有的选择器返回的值都是seclectable的类型的值。 遇到的问题: 1.使用css选择器来找自己想要的东西的时候,要根据属性不同来切换选择器的标识,例如 “.”后面跟的是class,"#"跟的是id 原网页 第一次使用的是“.” 得到的值是null,而下面那
阅读全文
摘要:这几天断更了,实在是因为最近这几天太忙了,太太太事多了。 为了过年打扫屋子,擦窗户,做胃镜,(呕呕呕呕,难受的要死),继续打扫。今天终于有带点空闲时间来继续我的学习之路。 上次安装好了idea,但是在我第二次打开的时候,他说我的激活码不能用了,很纳闷,毕竟这是我少有的接触这个软件,所以我还不是很懂他
阅读全文
摘要:今天呢,算是完成昨天的一点小结尾,昨天按照教程爬了半天数据发现没有什么卵用,后来我想找到问题之所在,第一步锁定了网站的正确性上,发现这确实是一个问题,网站404了。后来我按照题目的提示找到首都之窗这个网站,但是寻找他的信件的网络源码的时候发现,他的排版跟以前大不一样了,并不是以前那种可以简单按照网页
阅读全文
摘要:今天算是寒假的第一天?也不算,如果按考试结束就是假期的化,那我这该是第三天,但如果按学校的放假时间来算的话,这是提前1天,好了,废话到此结束,下面进入正题,爬虫的学习。 之前我也是用过爬虫的男人,还爬到了不少有趣的东西,就如我的第一个完整例子里面是全国大学排名,第二个是一堆电影,下一次就是作业 航班
阅读全文
摘要:本书开头讲到,这本书是关于计算机原理的各种编码方法,并通过数字逻辑电路以及存储器,微处理器的形成,组织及发展阐述了编码的实现。 可以看出这本书是一个讲解面较为全面的书。 根据我的学习经验来看,了解计算机最基础的知识是非常繁琐与无聊的,往往会给我们带来大量的烦恼,从而降低我的学习兴趣。
阅读全文