摘要: 写在开头 在之前的三篇文章中,我尝试了使用python爬虫实现的对于特定站点的《剑来》小说的爬取,对于豆瓣的短评的爬取,也有对于爬取的短评数据进行的词云展示,期间运用了不少的知识,现在是时间回顾一下。在此之后,我会再关注一些爬虫框架的使用,以及更多的爬虫的优化方法,争取做到尽量多的吸收新知识,巩固旧 阅读全文
posted @ 2017-08-20 21:34 lart 阅读(817) 评论(1) 推荐(0) 编辑
摘要: 在之前的文章中,我们获得了豆瓣爬取的短评内容,汇总到了一个文件中,但是,没有被利用起来的数据是没有意义的。 前文提到,有一篇微信推文的关于词云制作的一个实践记录,准备照此试验一下。 思路分析 读文件 利用 将文件读进来。这里需要注意文件内容的大小。 分词 由于获取的是大量的短评文字,而制作词云需要的 阅读全文
posted @ 2017-08-18 17:59 lart 阅读(1198) 评论(0) 推荐(0) 编辑
摘要: 写在开头 豆瓣上有着大量的影视剧的评论,所以说,要是想要实现对广大人民群众的观点的分析,对一部片子的理解,综合来看大家的评论是很有必要的。而短评作为短小精干的快速评论入口,是值得一谈的。 所以先要实现对其的数据的爬取。 目前来看,基本内容是可以爬取的。最大的问题在于速度。后续考虑准备运用多线程的方式 阅读全文
posted @ 2017-08-17 16:52 lart 阅读(487) 评论(0) 推荐(0) 编辑
摘要: 写在开头 纪念我的第一个爬虫程序,一共写了三个白天,其中有两个上午没有看,中途遇到了各种奇怪的问题,伴随着他们的解决,对于一些基本的操作也弄清楚了。果然,对于这些东西的最号的学习方式,就是在使用中学习,通过解决问题的方式来搞定这些知识。按需索取,才能更有针对性。 大体记录下整个过程。 准备构思 出于 阅读全文
posted @ 2017-08-13 21:38 lart 阅读(446) 评论(0) 推荐(0) 编辑
摘要: 代码管理方式——集中与分散 集中型 以 Subversion 为代表的集中型,所示将仓库集中存放在服务器之中,所以只存在一个仓库。这就是为什么这种版本管理系统会被称作集中型。 集中型将所有数据集中存放在服务器当中,有便于管理的优点。但是一旦开发者所处的环境不能连接服务器,就无法获取最新的源代码,开发 阅读全文
posted @ 2017-08-10 10:07 lart 阅读(301) 评论(0) 推荐(0) 编辑
摘要: 初始设置本地Git 首先来设置使用 Git 时的姓名和邮箱地址。名字请用英文输入。 $ git config global user.name "Firstname Lastname" $ git config global user.email "your_email@example.com" 这 阅读全文
posted @ 2017-08-10 10:06 lart 阅读(328) 评论(0) 推荐(0) 编辑
摘要: 5s内15Hz4个LED闪烁,再两秒熄灭,循环往复。 引入en,可以使得4个LED灯全亮,以及恢复周期变化。 verilog module led(clk_27MHZ, en, led1, led2, led3, led4); input clk_27MHZ, en; output reg led1 阅读全文
posted @ 2017-07-13 20:41 lart 阅读(318) 评论(0) 推荐(0) 编辑
摘要: 发现了一个神奇的网站, "overleaf" 以下是基于默认模板写的。 latex \documentclass[a4paper]{article} %% Language and font encodings \usepackage[english]{babel} \usepackage[utf8 阅读全文
posted @ 2017-06-29 15:22 lart 阅读(1828) 评论(0) 推荐(0) 编辑
摘要: (因为我粗略学过C,C++,Python,了解过他们的一些语法,所以为了使得java的入门更为顺畅,便会忽略一些和C语法相类似的地方,着重点明一些java自己的特色之处。也减轻一下自己写文字的负担。) JAVA是一门 "静态的强类型" 的面向对象的重量级的编程语言。 一般写JAVA程序需要的组件是J 阅读全文
posted @ 2017-06-28 20:40 lart 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 关于Latex,收到网友的鼓励,决定好好整理下相关的信息。 在初次使用相关的程序时,遇到很多迷惑的概念,下面这篇帖子汇总得很详细。 "关于latex各种概念与理解" 帖子中提到了三个概念,引擎,宏集(即下面的格式),发行版。 1. 引擎(engine):pdfTeX,pTeX,LuaTeX和XeTe 阅读全文
posted @ 2017-06-10 23:53 lart 阅读(486) 评论(0) 推荐(0) 编辑
摘要: 基本的git操作 git config --global user.name "你的名字或昵称" git config --global user.email "你的邮箱" git init git remote add origin <你的项目地址> //注:项目地址形式为:http://git. 阅读全文
posted @ 2017-04-03 08:37 lart 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 3.0版本 c++ include include define TRUE 1 define FALSE 0 define OK 1 define ERROR 0 define INFEASIBLE 1 define OVERFLOW 2 define STACK_INIT_SIZE 100 def 阅读全文
posted @ 2017-03-30 11:25 lart 阅读(1209) 评论(0) 推荐(0) 编辑
摘要: 又改进了了一些问题 阅读全文
posted @ 2017-03-26 23:27 lart 阅读(241) 评论(1) 推荐(0) 编辑
摘要: ```c /* 栈采用顺序栈存储,试设计算法实现将表达式转换成后缀表达式输出。 例如,输入表达式: a+b/c-(d*e+f)*g 输出其后缀表达式: abc/+de*f+g*- */ #include #include #define TRUE 1 #define FALSE 0 #define OK 1 #define ERROR 0 #define INFEASIBLE -1 #de... 阅读全文
posted @ 2017-03-25 23:17 lart 阅读(428) 评论(1) 推荐(0) 编辑
摘要: 具体改进内容: 第一个输入为一的bug 给定密码序列的约瑟夫环 随机生成密码的约瑟夫环 阅读全文
posted @ 2017-03-25 17:00 lart 阅读(267) 评论(1) 推荐(0) 编辑
摘要: 给定数据版 随机数版本 阅读全文
posted @ 2017-03-21 19:29 lart 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 有细微修改 旧版 阅读全文
posted @ 2017-03-18 21:35 lart 阅读(285) 评论(0) 推荐(0) 编辑
摘要: default.custom.yaml luna_pinyin_simp.custom.yaml weasel.custom.yaml 阅读全文
posted @ 2017-03-18 21:32 lart 阅读(932) 评论(0) 推荐(0) 编辑
摘要: ```c++ / ADT 线性表(List) Data Operation InitList( L); ListEmpty(L); ClearList( L); GetElem(L,i, e); LocateElem(L,e); ListInsert( L,i,e); ListDelete( L,i 阅读全文
posted @ 2017-03-17 23:36 lart 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 修改的部分: 阅读全文
posted @ 2017-03-17 18:44 lart 阅读(840) 评论(1) 推荐(0) 编辑