实习第一月总结

    实习已经一个月了,如果不是这次阑尾炎病犯了,也不能够乖乖的休息一个星期,做了手术就乖乖的安心的休息了一个星期,放下了手头的所有工作。也还真是我是一个学生,所以才能够完完全全的安心的休息了一个星期,手术基本已经完全康复,这里就简单回忆一下11月实习学习的内容以及收获。

    刚刚来可能是各种熟悉环境吧,所以刚开始的这一个月基本上是杂乱的学习了很多的内容,属于全面了解。

    1.由于开发均在服务端实现,所以一个SSH客户端必不可少的,这里直接利用了当时并行程序设计课程中使用的两个SSH客户端,putty和bitvise两个软件。但是利用Bitvise的时候利用VIM的时候没有高亮显示,以为VIM配置的不对,真了解了一下VIM的配置,参照网上的配置一下仍然无高亮,只要还原VIM配置利用putty了,正常使用VIM。这部分了解到VIM其实是一个扩展性很强的编辑器,利用各种插件可以将其打造为一个非常完美的代码编辑器。

    2.linux命令行的熟悉,主要熟悉了一下awk,sed,grep,sort命令的用法,如果用于日志查找或者代码阅读,这些命令应该非常有用,但是这里仅仅简单的了解,后面没有多加练习,现在已经遗忘了它们的用法了。

    3.了解了一下搜索引擎设计的基本知识和基本需要考虑的问题。

    4.linux下面代码的编译、链接应该是makefile,但是由于makefile的复杂,所以催生了automake一系列工具的辅助,接下来就是了解automake一系列工具的搭配使用来为一个已经完好的项目产生相应的makefile文件。主要是configure.in文件的修改以及makefile.am文件的编辑。

    5.linux下面小的功能没必要写一个程序来完成,直接利用shell脚本完成程序设计就可以了,shell脚本的学习,主要是变量的使用和一些基本的程序结构。

    6.爬虫基本架构的了解,了解Scrapy的爬虫架构,根据官方文档利用Scrapy设计一个爬虫的demo,然后自己根据了解设计了一个抓取京东图书首页图书信息的爬虫。了解了Scrapy爬虫的数据流以及架构。

    7.Scrapy提取信息的部分是利用xpath进行提取的,然后顺便学习了一下xpath,如果xpath能够提取信息,但是xpath又比较专业,想能不能够可视化简单的生成xpath,然后就了解到了Chrome的xpathhelper插件。后面也了解到类似火车头采集器这样的非常强大的采集器,自身集成模板与采集功能于一身。

    8.自己想要设计一个可视化生成xpath的软件。xpathhelper开源,一些js脚本和html文件形成的chrome插件。源代码阅读。

    9.浏览器没有本地文件的操作权限,所以这里不能够利用chrome插件来形成一个模板管理系统,C#中的webbrowser插件提供了IE全部访问权限,所以这里考虑利用C#完成一个,提取xpath的时候像网页中注入计算xpath的js脚本,生成的xpath信息和xpath提取的内容反馈至客户端即可。这样就简单完成了xpath可视化的生成。

    以上基本是这一个月来的所有工作,均是简简单单的学习,第一次实习觉得实习挺微妙的,现在可能由于事情比较忙乱,mentor事情也比较多,根本无暇顾及我,所以任我自己随便学习一些知识,看一些内容方便后面更加快速的上手,但是有一些知识我觉得应该结合具体的东西更加容易的学习。

    接下来的一个月刚刚开始,难道还是漫无目的的学习吗,至少这个月了解下ACE,因为这个是基础,但又不能花太多的时间,简单先了解一下吧。第一次实习真的有些迷茫。

posted @ 2013-12-05 13:33  weixliu  阅读(1655)  评论(0编辑  收藏