11 2012 档案
摘要:Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。在Mahout实现的机器学习算法见下表:算法类算法名中文名分类算法Logistic Regression逻辑回归Bayesian贝叶斯SVM支持向量机Perceptron感知器算法Neural Network神经网络Random Forests随机森林Restrict
阅读全文
摘要:一、MySQL 获得当前日期时间 函数1.1 获得当前日期+时间(date + time)函数:now()mysql> select now();+---------------------+| now() |+---------------------+| 2008-08-08 22:20:46 |+---------------------+除了 now() 函数能获得当前的日期时间外,MySQL 中还有下面的函数: current_timestamp(),current_timestamp,localtime(),localtime,localtimestam...
阅读全文
摘要:参考自:《SPSS12高级教程》,张文彤《Clementine数据挖掘方法及应用》,薛薇采用聚类分析的数据挖掘技术进行电信市场客户分群电子商城的用户分析运用——客户细分(CustomerSegmentation)的相关问题列表!站内文章推荐:用SPSS因子分析结果进行聚类分析SPSS聚类分析——一个案例演示聚类分析全过程资源推荐阅读:移动客户细分模型项目报告(一份84页的PPT资源)本文案例数据源下载:数据小兵新浪微盘原创文章,转载或者分享,请注明来自数据小兵博客谢谢合作文章原创地址:http://hi.baidu.com/datasoldier/item/e0dc74e5f7f9d41658
阅读全文
摘要:决策树概念决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。决策树的实现首先要有一些先验(已经知道结果的历史)数据做训练,通过分析训练数据得到每个属性对结果的影响的大小,这里我们通过一种叫做信息增益的理论去描述它,期间也涉及到熵的概念。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。从数据产生决策树的机器
阅读全文
摘要:【编者注】大数据来了,受益于便宜的硬件存储、强大的计算机技术和云计算技术,企业手中获取了越来越多的数据。对大多数企业来说,数据分析不是可有可无,而是一个生存问题。但是面对大数据,我们有什么问题呢?本文作者赛仕软件研究开发(北京)有限公司总经理@刘政-SAS,在微博上分享的大数据的10个核心问题,中国统计网做个整理汇总,希望大家一起来交流讨论。大数据十大核心问题:1、大数据的分析模式大数据分析与传统分析的区别,特点是什么?2、分析速度分析速度是否能够跟上数据量和数据格式变化的速度,是否能达到实时分析?3、多种格式数据的分析技术声频、视频、图片、文本等等格式,如何混合分析?4、存储问题,存储和分析
阅读全文
摘要:回归分析概念 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。通过这种方法可以确定,许多领域中各个因素(数据)之间的关系,从而可以通过其用来预测,分析数据。 方差齐...
阅读全文
摘要:机器有两块网卡,接到两台交换机上 internet地址:192.168.1.8,子网掩码:255.255.255.0,网关:192.168.1.1 内部网地址:172.23.1.8,子网掩码:255.255.255.0,网关:172.23.1.1 如果按正常的设置方法设置每块网卡的ip地址和网关,再cmd下使用route print查看时会看到 Network Destination Netmask Gateway Interface Metric 0.0.0.0 0.0.0.0 192.168.1.1 192.168.1.8 0.0.0.0 0.0...
阅读全文
摘要:一个小小的换行,其实在不同的平台有着不同的实现,为什么要这样,可以是世界是多样的。本来在unix世界换行就用/n来代替,但是windows为了体现他的不同,就用/r/n,更有意思的是在mac中用/r。因此unix系列用 /n,windows系列用 /r/n,mac用 /r,这样就用你写的程序在不同的平台上运行有着不少的麻烦。下面是PHP去除换行符的一些常见方法。第一种写法:$content=str_replace("\n","",$content);echo $content;第二种写法:str_replace("\r\n",&quo
阅读全文
摘要:一、安装反向代理服务器1.下载反向代理服务器软件采用squid,下载地址:http://www.squid-cache.org/Versions/v2/2.2/squid-2.2.STABLE5-src.tar.gz下载后存放在/usr/local/squid/src目录里,文件名是squid-2.2.STABLE5-src.tar.gz ;2.解压代理服务器软件包:进入/usr/local/squid/src目录,键入如下命令:gzip -dc squid-2.2.STABLE5-src.tar.gz | tar -xvf -这个命令将代理服务器软件包解开,建立一个目录叫作squid-2.2
阅读全文
摘要:原文:http://netevil.org/node.php?nid=280转载:http://hi.baidu.com/sch362017466/blog/item/f7a8f7f5085aeaf07709d746.html问题:有没有办法在php中实现多线程呢?假设你正在写一个基于多台服务器的php应用,理想的情况时同时向多台服务器发送请求,而不是一台接一台。可以实现吗?回答:当有人想要实现并发功能时,他们通常会想到用fork或者spawn threads,但是当他们发现php不支持多线程的时候,大概会转换思路去用一些不够好的语言,比如perl。其实的是大多数情况下,你大可不必使用fork
阅读全文
摘要:说到php连mongoDB,不得不先介绍一下php的官方手册,网址在:http://us.php.net/manual/en/book.mongo.php在php的mongo扩展中,提供了4类接口(对象):1,针对mongoDB连接的操作:Mongohttp://us.php.net/manual/en/class.mongo.php2,针对mongoDB中数据库的操作:MongoDBhttp://us.php.net/manual/en/class.mongodb.php3,针对mongoDB中collection的操作:MongoCollectionhttp://us.php.net/ma
阅读全文
摘要:SQL StatementMongo Query Language StatementCREATE TABLE USERS (a Number, b Number)Implicit or useMongoDB::createCollection().INSERT INTO USERS VALUES(1,1)$db->users->insert(array("a" => 1, "b" => 1));SELECT a,b FROM users$db->users->find(array(), array("a&q
阅读全文
摘要:新开发的项目中,财务系统的数据报表需要导出EXCEL 并且需要在excel里加一些格式,所以就研究了一下phpExcel类,在这里记录一下PHPEXCEL类的使用方法,以便已后查看:phpExcel,操作excel很方便,尤其是可以方便的加入图片,支持jpg gif png格式。下载地址:http://www.codeplex.com/PHPExcel下面是总结的几个使用方法include ‘PHPExcel.php’;include ‘PHPExcel/Writer/Excel2007.php’;//或者include ‘PHPExcel/Writer/Excel5.php’; 用于输出.x
阅读全文
摘要:一,ping它是用来检查网络是否通畅或者网络连接速度的命令。作为一个生活在网络上的管理员或者黑客来说,ping命令是第一个必须掌握的DOS命令,它所利用的原理是这样的:网络上的机器都有唯一确定的IP地址,我们给目标IP地址发送一个数据包,对方就要返回一个同样大小的数据包,根据返回的数据包我们可以确定目标主机的存在,可以初步判断目标主机的操作系统等。下面就来看看它的一些常用的操作。先看看帮助吧,在DOS窗口中键入:ping /? 回车,出现如图1。所示的帮助画面。在此,我们只掌握一些基本的很有用的参数就可以了(下同)。-t 表示将不间断向目标IP发送数据包,直到我们强迫其停止。试想,如果你使用1
阅读全文
摘要:test命令用法。功能:检查文件和比较值1)判断表达式if test(表达式为真)if test !表达式为假test表达式1 –a表达式2 两个表达式都为真test表达式1 –o表达式2两个表达式有一个为真2)判断字符串test –n字符串 字符串的长度非零test –z字符串 字符串的长度为零test字符串1=字符串2字符串相等test字符串1!=字符串2 字符串不等3)判断整数test整数1 –eq整数2 整数相等test整数1 –ge整数2 整数1大于等于整数2test整...
阅读全文
摘要:转载:http://kan.weibo.com/con/3514428268963004?_from=image一、什么是用户模型?Persona([pə:'səunə]):(Persona是用户模型的的简称)是虚构出的一个用户用来代表一个用户群。一个persona可以比任何一个真实的个体都更有代表性。一个代表典型用户的persona的资料有性别、年纪、收入、地域、情感、所有浏览过的URL、以及这些URL包含的内容、关键词等等。一个产品通常会设计3~6个用户模型代表所有的用户群体。Persona Web人物角色介绍用户模型(任人物角色)不是用户细分用户模型看起来比较像用户市场细分。用户
阅读全文
摘要:转载:http://blog.digitalforest.cn/webanalytics-basic-catalogue?banner_id=wabasic维度与度量 网站分析基础概念之维度与度量基本要素 网站分析基础概念之网页与网页浏览数 网站分析基础概念之访问数 网站分析基础概念之事件访问特征 网站分析基础概念之进入页 网站分析基础概念之登陆页 网站分析基础概念之退出页 网站分析基础概念之访问持续时间 网站分析基础概念之引用与引用页 网站分析基础概念之会话引用与访问者引用 网站分析基础概念之广告点击数与广告点击率访问者特征 网站分析基础概念之初访者 网站分析基础概...
阅读全文
摘要:转载:http://kan.weibo.com/con/3486584322221287?_from=title使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买金额,再对销售毛利率、关系营销费用进行推算,就能按年、按季、按月分析出今后几期的客户价值。 在这里,客户价值指CRM毛利。CRM毛利 = 购买金额 - 产品成本 - 关系营销费用。 RFM方法是国际上最成熟、最为接受的客户价值分析方法,RFM实际上是一整套分析方法中的部分内容,但最具代表性,其它还包括客户购买行为随机模型、马可
阅读全文
摘要:转载:http://kan.weibo.com/con/3490308298224239?_from=image统计分析的八种方法一、 指标对比分析法 指标对比分析法,又称比较分析法——是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法。有比较才能鉴别。单独看一些指标,只能说明总体的某些数量特征,得不出什么结论性的认识; 指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。这两种方法既可单独使用,也可结合...
阅读全文
浙公网安备 33010602011771号