★P〓P★的随笔

纸上得来终觉浅,绝知此事要躬行。

08 2008 档案

如何做研究(MIT AI Lab)
摘要:1. 如何做研究(来自MIT AI实验室)?简评:这是一篇关于如何做研究的经验总结,全面阐述了研究过程中可能遇到的诸多问题,并给出了切实可行的建议!个人认为这个文章非常有价值,可媲美《孙子兵法》,对新加入我们课题组的研究生来说,第一件事情就是阅读这篇文章,并写出心得并指导他们选题。作者:人工智能实验室全体研究生 编辑:David Chapman 版本:1.3 时间:1988年9月 摘要 本文的主旨... 阅读全文

posted @ 2008-08-31 03:24 itolssy 阅读(1725) 评论(0) 推荐(0)

算法小结——qsort函数
摘要:六种qsort排序方法<本文中排序都是采用的从小到大排序>一、对int类型数组排序int num[100];Sample:int cmp ( const void *a , const void *b ){ return *(int *)a - *(int *)b;}qsort(num,100,sizeof(num[0]),cmp);二、对char类型数组排序(同int类型)char ... 阅读全文

posted @ 2008-08-28 14:25 itolssy 阅读(444) 评论(0) 推荐(0)

解决一台机器同时运行多个Tomcat服务
摘要:如果不加任何修改,在一台服务器上同时运行两个Tomcat服务显然会发生端口冲突。假设现在已经按照正常的方式安装配置好了第一个Tomcat,第二个如何设置呢?以下是使用Tomcat6.0.16解压版本所做的实验。解决办法:1.解压Tomcat到一个新的目录,比如d:\TomcatServer2;2.新建一个环境变量CATALINA_HOME2,路径为d:\TomcatServer2;3.编辑Tomc... 阅读全文

posted @ 2008-08-27 20:58 itolssy 阅读(5197) 评论(1) 推荐(0)

VS 2005 命令行cl编译配置 & Notepad++设置
摘要:1,添加vc的bin目录到path: PATH=D:"Program Files"Microsoft Visual Studio 8"VC"bin;%PATH%2,添加环境变量INCLUDE=D:"Program Files"Microsoft Visual Studio 8"VC"PlatformSDK"Include;D:"Program Files"Microsoft Visual Stud... 阅读全文

posted @ 2008-08-27 17:13 itolssy 阅读(3049) 评论(0) 推荐(0)

NOTEPAD++的C++环境配置
摘要:NOTEPAD++ :运行notpad++,点击“运行-》运行”菜单,出现一个弹出框。 编译源代码:cmd /k gcc -o $(NAME_PART).exe "$(FULL_CURRENT_PATH)" & PAUSE & EXIT 运行上一步生成的可执行文件:cmd /k "$(NAME_PART)" & PAUSE & EXIT注意事... 阅读全文

posted @ 2008-08-23 15:31 itolssy 阅读(1821) 评论(0) 推荐(0)

c_str() 函数
摘要:Syntax: #include <string> const char* c_str();The function c_str() returns a const pointer to a regular C string, identical to the current string. The returned string is null-terminated.Note th... 阅读全文

posted @ 2008-08-21 09:50 itolssy 阅读(1729) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.7 小结
摘要:《数据挖掘:概念与技术(原书第2版)》2.7 小结l数据预处理对于数据仓库和数据挖掘都是一个重要的问题,因为现实中的数据多半是不完整的、有噪声和不一致的。数据预处理包括数据清理、数据集成、数据变换和数据规约。l描述性数据汇总为数据预处理提供分析基础。数据汇总的基本统计学度量包括度量数据集中趋势的均值、加权平均、中位数和众数,度量数据离散程度的极差、四分位数、四分位数间距、方差和标准差。图形表示,如... 阅读全文

posted @ 2008-08-09 02:06 itolssy 阅读(624) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.6 数据离散化和概念分层产生
摘要:通过将属性值划分为区间,数据离散化技术可以用来减少给定连续属性值的个数。区间的标记可以替代实际的数据值。用少数区间标记替换连续属性的数值,从而减少和简化了原来的数据。这导致挖掘结果的简洁、易于使用的、知识层面的表示。 对于给定的数值属性,概念分层定义了该属性的一个离散化。通过收集较高层的概念(如青年、中年或老年)并用它们替换较低层的概念(如年龄的数值),概念分层可以用来规约数据。通过这种数据泛化,尽管细节丢失了,但是泛化后的数据更有意义、更容易解释。这有助于通常需要的多种挖掘任务的数据挖掘结果的一致表示。此外,与对大型未泛化的数据集挖掘相比,对规约的数据进行挖掘所需的I/O操作更少,并且更有效。正因为如此,离散化技术和概念分层作为预处理步骤,在数据挖掘之前而不是在挖掘过程进行。 阅读全文

posted @ 2008-08-09 01:35 itolssy 阅读(2347) 评论(1) 推荐(0)

Geoserver中去除重复的标注
摘要:在geoserver中,在为地图定义的style里,定义标注样式的部分中加上<VendorOption name=”group”>yes</VendorOption> 阅读全文

posted @ 2008-08-06 17:02 itolssy 阅读(1679) 评论(0) 推荐(0)

Geoserver 中文标注显示问题
摘要:极度怀疑自己的RP问题。。。看代码,上面的是中文显示正常的,下面的是中文显示不正常的。几个图层死活不正常,就从正常的里面考了段代码出来,结果就正常了。。。无语ING[代码]----------------------------------------------------------------------------------- 另外,tomcat+geoserver配置带中文featur... 阅读全文

posted @ 2008-08-05 13:53 itolssy 阅读(3556) 评论(1) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.5 数据规约
摘要:数据归约技术可以用来得到数据集的归约表示,它小得多,但仍接近保持原数据的完整性。这样,对归约后的数据集挖掘将更有效,并产生相同(或几乎相同)的分析结果。 数据归约的策略:数据立方体聚集、属性子集选择、维度归约、数值归约、离散化和概念分层产生。 阅读全文

posted @ 2008-08-05 01:50 itolssy 阅读(2785) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.4 数据集成和变换
摘要:数据挖掘经常需要数据集成—合并来自多个数据存储的数据。数据还可能需要转换成适于挖掘的形式。本节介绍数据集成和数据变换。 阅读全文

posted @ 2008-08-04 21:00 itolssy 阅读(573) 评论(0) 推荐(0)

Geoserver & Openlayers 学习笔记
摘要:Geoserver简介 Geoserver是一个功能齐全,遵循OGC开放标准的开源WFS-T和WMS服务器。利用Geoserver可以把数据作为maps/images来发布(利用WMS来实现)也可以直接发布实际的数据(利用WFS来实现),同时也提供了修改,删除和新增的功能(利用WFS-T)。 GeoServer, 顾名思义,是一个Server. 它是开源的 ,允许用户查看和编辑地理数据。这是地... 阅读全文

posted @ 2008-08-03 16:02 itolssy 阅读(13791) 评论(3) 推荐(1)

学习Geoserver图层样式控制(道路的样式)
摘要:geoserver允许我们写sld文件来控制图层样式,自带的样式生成太简单,往往不能满足需求,还需要修改或重写图层的sld 阅读全文

posted @ 2008-08-03 15:31 itolssy 阅读(2701) 评论(0) 推荐(0)

论文翻译《Object-Level Ranking: Bringing Order to Web Objects》
摘要:现在的网络搜索方法实际上是做文档级排名和检索,与之相对比,我们在探索一种新的聚合体以实现在对象级的网络检索。我们搜集与某一特定领域有关的对象的网络信息,并按照应答用户查询的相关性和流行度对这些对象进行排名。由于不同对象间不均匀性的存在,传统的PageRank模型在计算对象的popularity时不再有效。这篇论文介绍了PopRank,一种对一个特殊域的对象排名的域独立、对象级链接分析模型。我们明确的对每一类对象关系分配一个流行度传播因子(PPF),研究不同种类关系的不同PPF怎样影响popularity rangking。建议一种自动决定这些系数的途径。我们的实验使用一百万篇CS论文,试验结果表明,在对象图上使用PopRank可以获得比PageRank更好的排名结果。 阅读全文

posted @ 2008-08-03 02:32 itolssy 阅读(1088) 评论(0) 推荐(0)

读书摘要 算法的力量
摘要:真正学懂计算机的人(不只是“编程匠”)都对数学有相当的造诣,既能用科学家的严谨思维来求证,也能用工程师的务实手段来解决问题——而这种思维和手段的最佳演绎就是“算法”。 阅读全文

posted @ 2008-08-03 02:13 itolssy 阅读(445) 评论(0) 推荐(0)

WEKA rebuild
摘要:weka源码编译步骤 阅读全文

posted @ 2008-08-03 02:09 itolssy 阅读(677) 评论(0) 推荐(0)

读书笔记《A Categorization Scheme for Semantic Web Search Engines》
摘要:关于语义搜索引擎应该做什么,有一些不同的观点。本文中,介绍并详细阐述了一个语义垂直搜索引擎的分类方案。对每一类,根据所推荐的一般架构描述其组件,讨论了这些组件的各种使用途径。我们也建议了一些因子用于评估每一类系统。 阅读全文

posted @ 2008-08-03 02:03 itolssy 阅读(934) 评论(1) 推荐(0)

读书笔记 PMML (Predictive Model Markup Language)
摘要:PMML全称预言模型标记模型(Predictive Model Markup Language),利用XML描述和存储数据挖掘模型,是一个已经被W3C所接受的标准。PMML是一种基于XML的语言,用来定义预言模型。它为各个公司定义预言模型和在不同的应用程序之间共享模型提供了一种快速并且简单的方式。通过使用标准的XML解析器对PMML进行解析,应用程序能够决定模型输入和输出的数据类型,模型详细的格式... 阅读全文

posted @ 2008-08-03 01:51 itolssy 阅读(725) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.3 数据清理
摘要:现实世界的数据一般是不完整的、有噪声的和不一致的。数据清理例程试图填充缺失的值,光滑噪声并识别离群点,并纠正数据中的不一致。 阅读全文

posted @ 2008-08-02 19:04 itolssy 阅读(1088) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.2 描述性数据汇总
摘要:对于许多数据预处理任务,用户希望知道关于数据的中心趋势和离中趋势特征。中心趋势度量包括均值(mean)、中位数(median)、众数(mode)、中列数(midrange),而数据离中趋势度量包括四分位数(quartiles)、四分位数极差(interquartile range, IQR)和方差(variance)。 阅读全文

posted @ 2008-08-02 19:03 itolssy 阅读(1943) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.1 为什么要预处理数据
摘要:有大量数据预处理技术。数据清理可以去掉数据中的噪音,纠正不一致。数据集成将数据由多个源合并成一致的数据存储,如数据仓库。数据变换(如规范化)也可以使用。例如,规范化可以改进涉及距离度量的挖掘算法的精度和有效性。数据归约可以通过聚集、删除冗余特征或聚类等方法来压缩数据。这些技术不是互斥的,可以一起使用。这些数据处理技术在数据挖掘之前使用,可以大大提高数据挖掘模式的质量,降低实际挖掘所需要的时间。 阅读全文

posted @ 2008-08-02 19:02 itolssy 阅读(738) 评论(0) 推荐(0)

读书笔记《数据挖掘概念与技术》第1章 引言
摘要:数据挖掘是从大量数据中发现有趣模式,这些数据可以存放在数据库、数据仓库或其它信息存储中。这是一个年青的跨学科领域,源于诸如数据库系统、数据仓库、统计学、机器学习、数据可视化、信息检索和高性能计算。其它有贡献的领域包括神经网络、模式识别、空间数据分析、图像数据库、信号处理和许多应用领域,如商务、经济学和生物信息学。数据挖掘功能包括发现概念/类描述、关联和相关、分类、预测、聚类、趋势分析、离群点和偏差分析以及相似性分析。特征化和区分是数据汇总的形式。 阅读全文

posted @ 2008-08-02 18:55 itolssy 阅读(1722) 评论(1) 推荐(0)

【转载】Weka入门教程(2)
摘要:Source:http://forum.wekacn.org/viewtopic.php?f=2&t=9&sid=3e11f64d53cf134215bd69450412cdb9 5. 分类与回归 背景知识 WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中,这是有原因的。 在这两个任务中,都有一个目标属性(输出变量)。我们希... 阅读全文

posted @ 2008-08-02 18:50 itolssy 阅读(3729) 评论(0) 推荐(0)

【转载】Weka入门教程
摘要:Source: http://forum.wekacn.org/viewtopic.php?f=2&t=9&sid=3e11f64d53cf134215bd69450412cdb9 1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/m... 阅读全文

posted @ 2008-08-02 18:50 itolssy 阅读(2372) 评论(0) 推荐(0)

【转载】主要空间数据挖掘方法
摘要:主要空间数据挖掘方法 Source: http://jerry429.bokee.com/2993629.html 张新长 马林兵等,《地理信息系统数据库》[M],科学出版社,2005年2月 第二章第二节 空间数据 空间数据挖掘是多学科和多种技术交叉综合的新领域,其挖掘方法以人工智能、专家系统、机器学习、数据库... 阅读全文

posted @ 2008-08-02 18:45 itolssy 阅读(1014) 评论(0) 推荐(0)

导航