抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的,以下就是几种常用的用php抓取网页中的内容的方法。1.file_get_contents 2.curl 3.fopen->fread->fclose Read More
posted @ 2015-10-23 16:55 一叶枯黄 Views(367) Comments(0) Diggs(0)
SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。1.下载scws官方提供的类(这里使用的是pscws第四版的)http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2下载... Read More
posted @ 2015-10-23 16:51 一叶枯黄 Views(1580) Comments(0) Diggs(1)