Lei's Blog

关注机器学习、信息检索、数据挖掘和推荐系统等研究领域

  :: 首页 :: 博问 :: 闪存 :: 新随笔 :: :: 订阅 订阅 :: 管理 ::

http://blog.csdn.net/menxu_work/article/details/8819386

都是脚本语言, 不用编译, 直接写了就执行的

perl 是用来处理文本的 特别适合大量文本的解析

shell 则适合系统管理, 比如自动完成一系列linux命令

拿 perl 来说, 在 linux 下面创建一个文本文件 xx.pl, 

#!/usr/bin/perl 
print "hello!\n";
保存

chmod 755 xx.pl

./xx.pl


perl 的语法, 与 C 有点相似 但是, perl 的变量不像 C 的变量那么严格

 三种基本数据类型 你一看就知道大概
$var, @array, %hash

 

把这些文本处理成什么样的  

切分, 替换, 正则查找, 快速读入内存, 改变形式, 等等.

我没做过特别复杂的文本处理, 当年做的毕设, 是把 csdn 的博客解析成 标题 内容 关键词 这样的数据结构  然后做算法分析  看看那些博客是比较受大家推崇的

用perl,最大的好处也是有大量现成的库,都在 http://www.cpan.org/ 英语好的话, 这些库都可以随时取用, 我就用过许多

下载库文件到本地, 解压缩到 ./lib
然后 use lib-name; 就可以用了.

posted on 2013-04-20 14:06  Lei-Blog  阅读(309)  评论(0编辑  收藏  举报