摘要: 利用HttpClient以post形式上传文件/** * created since 2012-4-6 */package com.yonge.http;import java.io.File;import org.apache.commons.httpclient.HttpClient;import org.apache.commons.httpclient.HttpStatus;import org.apache.commons.httpclient.methods.PostMethod;import org.apache.commons.httpclient.methods.multip 阅读全文
posted @ 2013-04-12 15:01 清新每一天 阅读(11533) 评论(0) 推荐(0)
摘要: meta标签是位于html代码的和内的标签,meta标签的作用其实有很多,但是确实很多初学html代码的站长最容易忽视的地方,meta标签的属性主要有两中:name和http-eauiv.meta标签是位于html代码的<head>和</head>内的标签,meta标签的作用其实有很多,但是确实很多初学html代码的站长最容易忽视的地方,meta标签的属性主要有两中:name和http-eauiv.name标签主要用于描述一个网页,为搜索引擎提供有关文档的一些信息,比如keyword(关键词)、description(网页内容的描述),等等;比较常用的name属性主要有 阅读全文
posted @ 2013-04-12 14:12 清新每一天 阅读(408) 评论(0) 推荐(0)
摘要: http://www.cnblogs.com/onlytiancai/archive/2008/05/11/1192780.html1.TF-IDF昨天给大家演示简单的文本聚类,但要给每个聚类再提取一两个关键词用于表示该聚类。我们还是用TFIDF算法来做,因为这是比较简单的提取特征算法,不过这里的TF是指某词在本聚类内所有文章的词频,而不是本文章内出现的次数,IDF还是在所有文章里出现的倒文档频率。原理:1、先给本聚类内的所有文档进行分词,然后用一个字典保存每个词出现的次数2、遍历每个词,得到每个词在所有文档里的IDF值,和在本聚类内出现的次数(TF)相乘的值3、用一个字典(key是词,val 阅读全文
posted @ 2013-04-12 14:09 清新每一天 阅读(926) 评论(0) 推荐(0)