实习第一月总结

实习已经一个月了，如果不是这次阑尾炎病犯了，也不能够乖乖的休息一个星期，做了手术就乖乖的安心的休息了一个星期，放下了手头的所有工作。也还真是我是一个学生，所以才能够完完全全的安心的休息了一个星期，手术基本已经完全康复，这里就简单回忆一下11月实习学习的内容以及收获。

刚刚来可能是各种熟悉环境吧，所以刚开始的这一个月基本上是杂乱的学习了很多的内容，属于全面了解。

1.由于开发均在服务端实现，所以一个SSH客户端必不可少的，这里直接利用了当时并行程序设计课程中使用的两个SSH客户端，putty和bitvise两个软件。但是利用Bitvise的时候利用VIM的时候没有高亮显示，以为VIM配置的不对，真了解了一下VIM的配置，参照网上的配置一下仍然无高亮，只要还原VIM配置利用putty了，正常使用VIM。这部分了解到VIM其实是一个扩展性很强的编辑器，利用各种插件可以将其打造为一个非常完美的代码编辑器。

2.linux命令行的熟悉，主要熟悉了一下awk，sed，grep，sort命令的用法，如果用于日志查找或者代码阅读，这些命令应该非常有用，但是这里仅仅简单的了解，后面没有多加练习，现在已经遗忘了它们的用法了。

3.了解了一下搜索引擎设计的基本知识和基本需要考虑的问题。

4.linux下面代码的编译、链接应该是makefile，但是由于makefile的复杂，所以催生了automake一系列工具的辅助，接下来就是了解automake一系列工具的搭配使用来为一个已经完好的项目产生相应的makefile文件。主要是configure.in文件的修改以及makefile.am文件的编辑。

5.linux下面小的功能没必要写一个程序来完成，直接利用shell脚本完成程序设计就可以了，shell脚本的学习，主要是变量的使用和一些基本的程序结构。

6.爬虫基本架构的了解，了解Scrapy的爬虫架构，根据官方文档利用Scrapy设计一个爬虫的demo，然后自己根据了解设计了一个抓取京东图书首页图书信息的爬虫。了解了Scrapy爬虫的数据流以及架构。

7.Scrapy提取信息的部分是利用xpath进行提取的，然后顺便学习了一下xpath，如果xpath能够提取信息，但是xpath又比较专业，想能不能够可视化简单的生成xpath，然后就了解到了Chrome的xpathhelper插件。后面也了解到类似火车头采集器这样的非常强大的采集器，自身集成模板与采集功能于一身。

8.自己想要设计一个可视化生成xpath的软件。xpathhelper开源，一些js脚本和html文件形成的chrome插件。源代码阅读。

9.浏览器没有本地文件的操作权限，所以这里不能够利用chrome插件来形成一个模板管理系统，C#中的webbrowser插件提供了IE全部访问权限，所以这里考虑利用C#完成一个，提取xpath的时候像网页中注入计算xpath的js脚本，生成的xpath信息和xpath提取的内容反馈至客户端即可。这样就简单完成了xpath可视化的生成。

以上基本是这一个月来的所有工作，均是简简单单的学习，第一次实习觉得实习挺微妙的，现在可能由于事情比较忙乱，mentor事情也比较多，根本无暇顾及我，所以任我自己随便学习一些知识，看一些内容方便后面更加快速的上手，但是有一些知识我觉得应该结合具体的东西更加容易的学习。

接下来的一个月刚刚开始，难道还是漫无目的的学习吗，至少这个月了解下ACE，因为这个是基础，但又不能花太多的时间，简单先了解一下吧。第一次实习真的有些迷茫。

posted @ 2013-12-05 13:33 weixliu 阅读(1896) 评论(0) 收藏举报

刷新页面返回顶部

weixliu

实习第一月总结

公告