摘要: 最近利用Apache Mina实现了一个http服务,发布到linux下发现无法访问,通过HttpClient来发送http请求时,报如下错误:Exception in thread "main" org.apache.http.conn.HttpHostConnectException: Connection to http://10.5.20.96:8011 refused at org.apache.http.impl.conn.DefaultClientConnectionOperator.openConnection(DefaultClientConnection 阅读全文
posted @ 2012-09-03 15:26 BrightSea 阅读(77463) 评论(1) 推荐(2) 编辑
摘要: 在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用于实现相似度计算的组件之间的关系:图1、项目相似度计算组件图2、用户相似度计算组件下面就几个重点相似度计算方法做介绍:皮尔森相关度类名:PearsonCorrelationSimilarity原理:用来反映两个变量线性相关程度的统计量范围:[-1,1],绝对值越大,说明相关性越强,负相关对于推荐的意义小。说明:1、. 阅读全文
posted @ 2012-06-20 09:57 BrightSea 阅读(11275) 评论(1) 推荐(1) 编辑
摘要: 首先,创建一张表:CREATE TABLE example(ID Number(4) NOT NULL PRIMARY KEY,NAME VARCHAR(25));然后,自定义一个序列(sequence):CREATE SEQUENCE example_sequenceINCREMENT BY 1 -- 每次加几个START WITH 1 -- 从1开始计数NOMAXVALUE -- 不设置最大值NOCYCLE -- 一直累加,不循环NOCACHE -- 不建缓冲区再创建一个触发器:CREATE TRIGGERexample_triger BEFOREINSERT ON example FOR 阅读全文
posted @ 2012-05-22 16:58 BrightSea 阅读(18586) 评论(0) 推荐(2) 编辑
摘要: 一、首先安装eclipse SDK,下载地址http://download.eclipse.org/eclipse/downloads/,该网页下可以找到任何一个版本的eclipse SDK,这里的SDK是指eclipse平台中带有典型开发插件的SDK,只能开发基于JDK的Java程序,前提是已经安装了JDK。打开下载页面后,选择如下图的包:(这里可以选择相应软硬件平台的安装包,我使用的是WindowsXP系统,CPU是32位的)二、下载eclipse后直接解压就可以使用,一般把eclipse保存在非系统盘,因为eclipse的使用不涉及修改注册表,所以即使重装系统,也不会影响eclipse的 阅读全文
posted @ 2011-10-11 11:40 BrightSea 阅读(1768) 评论(0) 推荐(1) 编辑
摘要: 对历史数据的保存是数据仓库的主要特征之一,在构建事实表时,通常都会有日期关键字来与日期维表进行关联,以实现对事实表基于日期特征的分析。如果数据仓库涉及的日期不是很长,简单可以通过excel工具手动来生成日期维表并导入到数据库中,但一般的数据仓库都会涉及很长时期的存储,所以手动方式的适用度并不强,当另外计算用VBA编程实现了日期维表数据的生成,也需要通过导入技术导入到数据库中,显得不是很方便。下面介绍两种利用数据库的一些小窍门,实现自动填充日期维表的方法,这两个方式在oracle 10g测试通过,可以直接拷贝代码使用。1、利用rownum,通过sql创建日期维表并直接生成数据rownum是数据表 阅读全文
posted @ 2011-10-01 01:03 BrightSea 阅读(5462) 评论(0) 推荐(0) 编辑
摘要: 1. Mahout构建的先决条件1) JDK,使用1.6版本。需要说明一下,因为要基于Eclipse构建,所以在设置path的值之前要先定义JAVA_HOME变量。2) Maven,使用2.0.11版本或以上。在eclipse上安装maven插件—m2eclipse。2. mahout源码获取与其他Apache下开源项目类似,可以有两种获取源码的方法:一是通过Subversion检出,检出命令和地址如下svn co http://svn.apache.org/repos/asf/mahout/trunk二是直接下载发行版本,下载地址:http://apache.etoak.com//mahou 阅读全文
posted @ 2011-09-13 16:49 BrightSea 阅读(8881) 评论(7) 推荐(0) 编辑
摘要: 数据源是数据库连接池里面的概念,连接池就是指当服务器启动时,先建立几个连接,在应用需要与数据库连接时,就从连接池里获取,使用完以后,不是将连接断掉,而是放回到池里面,这样就减少了数据连接创建的次数,大大提高了连接性能。而数据源就是给服务器一个配置信息,然服务器就知道怎么使用JDBC驱动,比如url参数,数据库实例名、用户名与密码等等。Java中的数据源就是javax.sql.DataSource。DataSource的创建可以有不同的实现。 阅读全文
posted @ 2011-09-08 11:30 BrightSea 阅读(13237) 评论(0) 推荐(0) 编辑
摘要: 搜索引擎是当前快速查找目标信息的最好途径。在用户对自己需求很明确时,用搜索引擎可以方便地通过关键字快速找到自己需要的信息。但搜索引擎并不能完全满足用户对信息发现的需求,因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述,又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统,与搜索引擎对应,大家也习惯称它为推荐引擎。 阅读全文
posted @ 2011-09-03 00:58 BrightSea 阅读(2405) 评论(0) 推荐(1) 编辑
摘要: Normal 0 false 7.8 磅 0 2 false false false EN-US ZH-CN X-NONE MicrosoftInternetExplorer4 ... 阅读全文
posted @ 2011-08-23 10:09 BrightSea 阅读(683) 评论(0) 推荐(0) 编辑
摘要: mahout项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,对源码目录进行简要的介绍和说明,了解各子项目的用途及相互关系。 阅读全文
posted @ 2011-08-23 10:06 BrightSea 阅读(5137) 评论(0) 推荐(0) 编辑