摘要:一、统计学习,统计机器学习statistical machine learning1、统计学习方法:给定训练数据training data,在假设空间hypothesis spase(假设要学习的模型属于某个函数的集合),应用某个评价准则evaluation criterion,从假设空间中选取一个最优的模型。最优模型的选取由算法实现。2、统计学习方法的三要素:模型的假设空间model,策略strategy(模型选择的准则),模型学习的算法algorithm。3、步骤:(1)得到training data(2)确定所有可能的模型的假设空间,即学习模型的集合(3)确定模型选择的准则,即学习的策略 阅读全文
【stanford】二、supervised learning:Linear Regression
2012-12-13 23:28 by Loull, 535 阅读, 0 推荐, 收藏,
摘要:supervised learning learn a function h : X → Y h is called a hypothesis. 一、Linear Regression 例子中,x是二维向量,x1代表living area,x2代表bedrooms functions/hypotheses h 设x0 = 1,变换得 Now, given ... 阅读全文
【stanford】梯度、梯度下降,随机梯度下降
2012-12-13 22:35 by Loull, 6999 阅读, 1 推荐, 收藏,
摘要:一、梯度gradient http://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6 在标量场f中的一点处存在一个矢量G,该矢量方向为f在该点处变化率最大的方向,其模也等于这个最大变化率的数值,则矢量G称为标量场f的梯度。 在向量微积分中,标量场的梯度是一个向量场。 标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。 更严格... 阅读全文
【top-k】Answering Topk Queries with MultiDimensional Selections: The Ranking Cube Approach
2012-12-13 15:21 by Loull, 303 阅读, 0 推荐, 收藏,
摘要:一、读的是一篇文献,06年的 Answering Top-k Queries with MultiDimensional Selections: The Ranking Cube Approach 在一个top-k查询中,两个度量反应了性能:a selection condition & a ranking function. selection condition维度可能很高,rankin... 阅读全文
【数据立方】数据立方体的有效计算、物化materialization,索引OLAP数据
2012-12-13 00:31 by Loull, 1347 阅读, 0 推荐, 收藏,
摘要:一、数据立方体的有效计算多维数据分析的核心是有效计算多个维度合上的聚集。按SQL术语,这些聚集称为group-by。对于n维的立方体,包括基本立方体总共有(2的n次幂)个方体。(假设每个维没有分层)curse of dimensionality 如果数据立方体中所有的方体都预先计算,所需的存储空间可能爆炸。二、物化materialization部分物化冰山立方体:是一个数据立方体,它只存放其聚集值(如计数)大于某个最小支持度阈值的立方体单元。一旦选定的方体已经物化,重要的是在查询处理时利用它们。三、索引OLAP数据大部分数据仓库系统支持索引结构和物化视图(使用方体)。位图索引,连接索引,位图连 阅读全文
【数据立方】由表和电子数据表到数据立方体,cuboid方体
2012-12-13 00:16 by Loull, 686 阅读, 0 推荐, 收藏,
摘要:一、数据立方体由维和事实定义。维是关于一个组织想要保存记录的透视图或实体。维对应模式中的一个或一组属性,这个模式应该就是事实表(中心表)。每个维都有一个表与之相关联,称为维表。它进一步表示维。维表可以由用户或专家设定,或者根据数据分布自动产生和调整。多维数据模型围绕中心主题组织。主题用事实表表示。事实是用数值度量的。事实表包括事实的名称或度量,以及每个相关维表的码。二、最流行的数据仓库数据模型是多维模型,可以是星形模型,雪花模型,事实星座模型。三、方体cuboid给定维的集合,可以对给定维的每个可能的子集产生一个方体给定n维,可以产生(2的n次幂)个方体(包括了all,即0-D cuboid) 阅读全文
【datamining】OLTP,OLAP,维度数据库,事实表,维度表、星形和雪花模式、数据立方体、概念分层
2012-12-12 19:59 by Loull, 3366 阅读, 0 推荐, 收藏,
摘要:一、联机事务处理(OLTP)OLTP系统是设计用来允许高并发性的,这样很多用户就能够访问同一个数据源并进行所需的处理。OLTP系统是面向在数据库上进行事务处理的理念的。而事务则进一步蕴含着发生在表中数据上的受控的变更,这些变更包括在商务运作过程中发生的插入、更新和删除操作。通常,一个OLTP系统将会有大量的客户端应用程序通过各种各样的方式(插入、更新、删除--实际上可以是任何操作)访问数据库以查询一小块信息。OLTP系统的实例包括数据输入程序,如银行处理、订票、联机销售和库存管理系统。二、联机分析处理(OLAP)联机分析处理(或OLAP)是一种广义上的决策支持系统(DSS),或者最近越来越流行 阅读全文
【数据立方cube】数据立方
2012-12-12 19:11 by Loull, 4894 阅读, 0 推荐, 收藏,
摘要:一、数据立方体的基本概念 数据立方体是多维数据库的基本结构,并作为在多维数据库上定义的所有操作符的输入输出基本单位。将它定义为一个四元组<D,M,A,f>,这四个组件分别表示数据立方体的特征: 1. n 个维的集合D={d1 ,d2,。。。 ,dn },其中每个di 为从维域中抽取的维名。 2. K 个度量的集合M={ m1 ,m2,。。。 ,mn },其中每个mi 为从度量域中抽取的... 阅读全文
【MachineLeaning】stanford lesson one
2012-12-10 16:39 by Loull, 288 阅读, 0 推荐, 收藏,
摘要:http://hi.baidu.com/group609/item/00e99d1597f986e49d778a69 1.什么是机器学习? 从一些经验(E)中学习,来完成某种任务(T),通过某种评价方式(P)判断,发现perform得更好了,就算是学习了。因此对于机器学习,需要三方面的内容,一些经验+一个任务+一个评价方式。它能够教会计算机去做一些事情,但是!但是!这些事情却不是 hard c... 阅读全文
【computer theory】一、集合、关系和语言
2012-12-06 21:53 by Loull, 380 阅读, 0 推荐, 收藏,
摘要:1.1集合 1.2关系和函数 1.2.1数学研究关于对象以及它们之间的关系和陈述。 关系本身看作集合。属于关系的对象在本质上是是的关系成立的个体的组合。 因而小于关系式第一个数小于第二个数的所有数对组合的集合。 1.2.2有序对、笛卡尔积,有序组 函数,满射,单射,双射 1.3特设类型的二元关系 有向图,边,顶点 自反、对称、反对称、传递 把自反、对称和传递的关系叫做等价关系。... 阅读全文
【crawler】heritrix 3 使用
2012-11-30 15:50 by Loull, 393 阅读, 0 推荐, 收藏,
摘要:https://webarchive.jira.com/wiki/display/Heritrix/A+Quick+Guide+to+Running+Your+First+Crawl+Job 1、下载heritrix3后解压 2、命令行到bin目录 >heritrix.cmd –a admin:ad 阅读全文
[philosophy]空间
2012-11-30 10:40 by Loull, 418 阅读, 0 推荐, 收藏,
摘要:一、好像哲学意义上的时间空间与近代物理中的时间空间不是一回事 哲学意义上的时间空间,更接近于经典物理中的时空观——空间提供物质存在,运动,变化的场所,而本身并不发生任何改变,永远保持无边无际。时间绝对地独立于空间,并且自身不受任何影响地均匀流逝着,时间箭头的方向永远指向未来。而且还有个很重要的看法:这种意义下的时间和空间,都是平直的,或曰平坦的。空间的平坦就表现在“牛顿第一定律”上:不受外力作用的物体,在平坦空间中的运动轨迹是直线。我看过有个人的留言,他说他老师说过一个观点:“牛顿第一定律其实就是第二定律的特例,只要让加速度为0就可以了,那么为什么还要单独写出来呢?实际上第一定律的主要作用就是 阅读全文
【database】database domain knowledge
2012-11-29 16:11 by Loull, 333 阅读, 0 推荐, 收藏,
摘要:Database Principles Database Systems Design Advanced Database Technology 一、Database principles Relational data model – relational algebra SQL – DDL, DML, DCL, ODBC(JDBC) Database design —... 阅读全文
【java】Java异常处理总结
2012-11-28 20:36 by Loull, 202 阅读, 0 推荐, 收藏,
摘要:java方法中,代码抛出异常,如果没有catch和finally语句,则直接跳出方法,不执行异常代码后面的代码。 若有catch并捕获了异常,则执行catch代码块。若没有捕获,就跳出方法。 若有finally,不论是否捕获了异常,都执行finally代码块。 转自 http://lavasoft.blog.51cto.com/62575/18920/ Java异常处理总结 ... 阅读全文
【java】ubuntu部署web项目war包到tomcat上
2012-11-24 14:31 by Loull, 2016 阅读, 0 推荐, 收藏,
摘要:一、安装配置tomcat1、下载tomcat,不用apt-get install tomcat7, 因为好像这种方式安装的tomcat依赖的是open-jdk,而不是自己之前安装的jdk。tomcat可以放在home下面的个人目录中,不过这样明显不好,个人账户退出后,tomcat服务也会退出。解压出... 阅读全文