摘要:章苏阳、李丰等48位创投大咖与你有约! 全球名校创业创投大赛 复旦大学中国风险投资研究中心牵头联合上海市虹口区人力资源与社会保障局、AngelsGlobal跨境天使平台、AlumX全球名校创客会和全球20余所名校共同发起创业创投大赛,是本年度最有价值的创投盛会。l 创业项目都有新颖而强大的科技作支撑
阅读全文
11 2016 档案
摘要:区块链技术与数据库技术 IBM是最早介入区块链研发的国际大公司之一,例如去年大家熟知的IBM和三星的区块链合作项目以及Linux/IBM联合项目。作为IBM区块链技术中国区的负责人和专利评审委员会的联合主席,我和团队也在去年10月就提交并获得区块链的美国专利。这是中国人获取的第一个区块链国际专利。紧
阅读全文
摘要:Facebook内部分享:25个高效工作的小技巧 Facebook 内部分享:不论你如何富有,你都赚不到更多的时间,你也回不到过去。没有那么多的假如,只有指针滴答的时光飞逝和你应该好好把握的现在,以下25张PPT的分享将为您带来时间价值管理的技巧。 1、时间常有,时间优先。 2、时间总会有的: 每天只计划 4~5 小时真正的工作。 3、当你在状态时,就多干点;不然就好好休息: 有时候会...
阅读全文
摘要:最牛逼的开源机器学习框架,你知道几个 机器学习毫无疑问是当今最热的话题,它已经渗透到生活的方方面面,在移动互联网中混不懂点机器学习都不好意思,说几个能看的到的,经常用邮箱吧,是不是感觉垃圾邮件比N年前变少了,无聊了和siri聊过天不,想坐一下无人驾驶汽车吗,手累了用脸解个锁,智能化产品推荐是不是让你
阅读全文
摘要:广告行业的大数据处理架构实践 如果您希望阅读更多的大数据机器学习的文章,请关注公众号:QCon大数据机器学习 时间:2015年5月26日 晚20点 讲师介绍:AdMaster技术副总裁,资深大数据技术专家。关注高可靠、高可用、高扩展、高性能系统服务,关注Hadoop/Storm/Spark/Elas
阅读全文
摘要:交谈10要素, 上面图片我也是抄来的,哈哈,原谅我的技术不行哦 Celeste Headlee 讲师 如果成为一个更好的交谈者? 交谈需要平衡讲述和倾听 所以我接下来的十分钟来教你们如何谈话,以及如何倾听 大部分都知道的部分,看着对方的眼睛、提前想好可以讨论的有趣话题或者注视,点头,以及微笑来表明你
阅读全文
摘要:注:代价函数(有的地方也叫损失函数,Loss Function)在机器学习中的每一种算法中都很重要,因为训练模型的过程就是优化代价函数的过程,代价函数对每个参数的偏导数就是梯度下降中提到的梯度,防止过拟合时添加的正则化项也是加在代价函数后面的。在学习相关算法的过程中,对代价函数的理解也在不断的加深,
阅读全文
摘要:流失预测模型的应用 一、概述 对于一个互联网企业来说,用户流失是一个不可避免的问题。一定范围内的用户流失率是可以被接受的,因为并不是所有的用户都是我们的目标用户。但是当用户的流失率超出我们的预期时,就应该思考用户为什么会离开?有没有办法预测出具有流失倾向的用户?并通过针对性的挽留工作避免其流失。 本
阅读全文
摘要:基于Spark ALS构建商品推荐引擎 一般来讲,推荐引擎试图对用户与某类物品之间的联系建模,其想法是预测人们可能喜好的物品并通过探索物品之间的联系来辅助这个过程,让用户能更快速、更准确的获得所需要的信息,提升用户的体验、参与度以及物品对用户的吸引力。 在开始之前,先了解一下推荐模型的分类: 1、基
阅读全文
摘要:作为程序员的个人发展 作为一名软件工程师,说实话,写文章要比写代码难多了。 要说发展,知乎,CSDN,博客园里很多专业的建议。这里只是写出自己细微的经验,希望能给同样境遇的人一些对照。 相信很多软(Ma)件(Nong)从业者和我一样,大学时学了一堆理论基础: 计算机原理,OOSAD,网络基础,软件工
阅读全文
摘要:机器学习常见算法优缺点总结 K近邻:算法采用测量不同特征值之间的距离的方法进行分类。 优点: 1.简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归; 2.可用于数值型数据和离散型数据; 3.训练时间复杂度为O(n);无数据输入假定; 4.对异常值不敏感 缺点: 1.计算复杂性高
阅读全文
摘要:博士应该怎样读 ——从我自身的经验谈起 2016-09-16 上海交大 宫辰 博士应该怎样读 ——从我自身的经验谈起 宫 辰 (goodgongchen@sjtu.edu.cn) 上海交通大学电子信息与电气工程学院图像处理与模式识别研究所 关于如何读博士,如何成为一名优秀的博士,网上类似的帖子或文章
阅读全文
摘要:我的分布式机器学习故事 从毕业加入Google开始做分布式机器学习,到后来转战腾讯广告业务,至今已经七年了。我想说说我见到的故事和我自己的实践经历。这段经历给我的感觉是:虽然在验证一个新的并行算法的正确性的时候,我们可以利用现有框架,尽量快速实现,但是任何一个有价值的机器学习思路,都值得拥有自己独特
阅读全文
摘要:机器学习——统计与计算之恋 编辑部按:本文是从张志华老师在第九届中国R语言会议和上海交通大学的两次讲座中整理出来的。张志华老师是上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和
阅读全文
摘要:注:在吴恩达老师讲的【机器学习】课程中,最开始介绍神经网络的应用时就介绍了含有一个隐藏层的神经网络可以解决异或问题,而这是单层神经网络(也叫感知机)做不到了,当时就觉得非常神奇,之后就一直打算自己实现一下,一直到一周前才开始动手实现。自己参考【机器学习】课程中数字识别的作业题写了代码,对于作业题中给
阅读全文
摘要:Gradient Boosted Regression Trees 2 Regularization GBRT provide three knobs to control overfitting: tree structure, shrinkage, and randomization. Tree
阅读全文
摘要:机器学习十大算法之KNN算法 前段时间一直在搞tkinter,机器学习荒废了一阵子。如今想重新写一个,发现遇到不少问题,不过最终还是解决了。希望与大家共同进步。 闲话少说,进入正题。 KNN算法也称最近邻居算法,是一种分类算法。 算法的基本思想:假设已存在一个数据集,数据集有多个数值属性和一个标签属
阅读全文
摘要:Data Science 和 Finance 两个领域的融合是什么样子的? 2015-05-24 董可人 现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这种工作里又有很大一部分是涉及随机过程微分方程等偏理论的数学,对数据分析要求不高;只有另外一部分基于统
阅读全文
摘要:R 语言的优劣势是什么? 2015-05-27 程序员 大数据小分析 R,不仅仅是一种语言 本文原载于《程序员》杂志2010年第8期,因篇幅所限,有所删减,这里刊登的是全文。 工欲善其事,必先利其器,作为一个战斗在IT界第一线的工程师,C/C++、java、perl、python、ruby、php、
阅读全文
摘要:SAS Annotated Output GLM 在使用SAS过程中,proc glm步输出离差平方和有4种算法,分别是SS1 SS2 SS3 SS4 下面文章介绍了其中SS3的具体计算步骤和例子。 This page shows an example of analysis of variance
阅读全文
摘要:统计学的领域 作者注:本文是为中国人民大学统计学院本科院刊所写的稿件。走过了四年本科,觉得应该对后来人讲一些负责任的话,以使大家能更高效地学习。我认为人生的奋斗,怕的不是没有动力,而是有动力却不知道方向。因此,我把我所了解的统计学的领域介绍给大家,让大家早日了解一下统计学的基本内容,早日找到自己的方
阅读全文
摘要:解码阿里数据:对外数据产品也浮出水面 2014-05-21 大数据时代,阿里巴巴[微博]集团是最有资本进行烂漫遥想的公司之一,阿里数据平台事业部的服务器上,攒下了超过100PB已“清洗”的数据。 马云[微博]曾在2012年公开宣称,“平台、数据、金融”是阿里集团和阿里小微集团未来的指导路线。在此前后
阅读全文
摘要:大数据分析的几个新角色:数据科学家、数据分析师、数据(算法)工程师 数学科学家:(发明算法) 运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据应用服务的人才。 对享有的模型进行优化、改进,所以涉及到对具体算法的精通和理解,并不
阅读全文
摘要:漫谈 Greenplum 开源背后的动机 Greenplum是一家总部位于美国加利福尼亚州,为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司,在全球已有:纳斯达克,纽约证券交易所,Skype. FOX,T-Mobile;中国已有
阅读全文
摘要:阿里云大数据三次技术突围:Greenplum、Hadoop和“飞天” 阿里云大数据三次技术突围:Greenplum、Hadoop和“飞天” 对于企业来说,到底什么是云计算?相信很多企业都有这样的困惑,让我们一起回到这个原始的起点探讨究竟什么是云计算?云计算对于企业而言到底意味什么? 云计算的三条发展
阅读全文
摘要:7款优秀的开源数据挖掘工具 IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的
阅读全文
摘要:数据挖掘中分类算法小结 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势的模型。分类方法(Classification)用于预测数据对象的离散类别(Categorical La
阅读全文
摘要:数据挖掘入门——分词 谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不
阅读全文
摘要:HBase介绍及简易安装(转) HBase简介 HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问,是Google的BigTable的开源实现。HBase的目标是存储并处理大型的数据,更具体地说仅用普通的硬件配置,能够处理成千上万的行和列所组成的大型数据库。HBa
阅读全文
摘要:HttpClient的CircularRedirectException异常原因及解决办法 HttpClient的CircularRedirectException异常原因及解决办法 这两天在使用我自己爬虫抓取网页的时候总是出现 org.apache.http.client.ClientProtoc
阅读全文
摘要:当你在函数定义内声明变量的时候,它们与函数外具有相同名称的其他变量没有任何关系,即变量名称对于函数来说是 局部 的。这称为变量的 作用域 。所有变量的作用域是它们被定义的块,从它们的名称被定义的那点开始。 使用局部变量 例7.3 使用局部变量 #!/usr/bin/Python# Filename:
阅读全文
摘要:org.apache.http.client.CircularRedirectException: Circular redirect to "http://xxx"问题解决 用HttpClient的时候遇到一个问题:org.apache.http.client.CircularRedirectEx
阅读全文
摘要:使用Spring Boot来加速Java web项目的开发 我想,现在企业级的Java web项目应该或多或少都会使用到Spring框架的。 回首我们以前使用Spring框架的时候,我们需要首先在(如果你使用Maven的话)pom文件中增加对相关的的依赖(使用gradle来构建的话基本也一样)然后新
阅读全文
摘要:分辨真假数据科学家的20个问题及回答 2016-11-14 大数据文摘 【导语】本文分为两个部分,第一部分是quora上很火的一篇问答--【20个分辨真假数据科学家的问题】中赞赏数最高的回答,第二部分则是KDnuggets阅读量非常高的一篇文章【KDnuggets编辑们针对这20个问题给出的回答】。
阅读全文
摘要:一、2009年院数学建模竞赛 08年9月我来到**大学,就读于数学与应用数学专业。军训完了社团招新,最好接触数学建模的机会就是学校的数学建模协会,但是我太懒了,什么社团都没有参加,所以几乎没有接触过数学建模,只知道我的班主任助理(2006级数学专业**学长)拿了08年全国赛的湖北省二等奖,但是对其中
阅读全文
摘要:计算机科学中最重要的32个算法 2016-11-22 超级数学建模 全世界只有3.14 % 的人关注了 数据与算法之美 奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面
阅读全文
摘要:期权交易基本原理——买进看跌期权(Long Put),卖出看跌期权(Short Put) 来源:中电投先融期货—青岛 浏览:13508次2014-07-25 14:25:55 3 期权交易基本原理——买进看跌期权(Long Put),卖出看跌期权(Short Put) 来源:中电投先融期货—青岛 浏
阅读全文
摘要:期货交易术语 A Abandon 放弃:确认期权失效 Actuals 现货(LME普遍使用physical) Arbitrage 市场间套利 Assay 检验分析 Ask 要价,喊价 At-the-Money 相等价值:期权履约价与当前期权期货合约的现价完全相同 B Backpricing 有效时间
阅读全文
摘要:(一)——安装配置、第一个程序 (一)——安装配置、第一个程序 标签: imagebuildincludeinputpathcmd 2011-10-21 16:16 41132人阅读 评论(50) 收藏 举报 标签: imagebuildincludeinputpathcmd 2011-10-21
阅读全文
摘要:安装yum install pciutils usbutils [root@server09 ~]# [root@server09 ~]# lspci00:00.0 Host bridge: Intel Corporation Xeon E7 v2/Xeon E5 v2/Core i7 DMI2 (
阅读全文
摘要:[user@username home]$ lspci00:00.0 Host bridge: Intel Corporation 4th Gen Core Processor DRAM Controller (rev 06)00:01.0 PCI bridge: Intel Corporation
阅读全文
摘要:各类专业英语 http://www.dictall.com/zt/D/D6/w42.htm
阅读全文
摘要:http://wenku.baidu.com/search?word=%E6%88%BF%E5%9C%B0%E4%BA%A7%E8%8B%B1%E8%AF%AD&ie=utf-8&lm=0&od=0 http://www.24en.com/esp/realty/ http://www.51test.
阅读全文
摘要:一、深圳目前的深圳是中国第四大城市,四大一线城市之一,作为改革开放的前沿阵地,深圳已经完成了国家赋予他的使命,三十年后的深圳,将不会再作为所谓的四大一线展现给大家,目测未来将至少被天津、重庆等非常具有潜力的城市超过,在大陆将跌出前四,排名在六到十名左右。 二、北京目前唱衰北京的人很多,但我不敢苟同,
阅读全文
摘要:http://wenku.baidu.com/view/eaca9ab9f121dd36a32d82f1.html
阅读全文
摘要:使用基于Apache Spark的随机森林方法预测贷款风险 使用基于Apache Spark的随机森林方法预测贷款风险 原文:Predicting Loan Credit Risk using Apache Spark Machine Learning Random Forests 作者:Carol
阅读全文
摘要:信用评分怎么算出来的?偷偷给你一份客户信用等级简易评估模型....... 2016-06-20 信用知识公益平台 对于像葵花君这样的菜鸟而言,心中始终萦绕着一个硕大的问号 信用等级到底是怎么评估出来的? 难道是夜观星象么? 今天偷偷给你一份客户信用等级简易评估模型....... 客户的信用等级简易评
阅读全文
摘要:高收益债券信用风险评估:预期损失率模型 2015-12-07 袁志辉 人民币交易与研究 作者袁志辉,任职于安信证券固定收益部。 摘要 自今年3月份债券刚性兑付打破以来,信用风险受到市场广泛关注,多只债券评级下调,信用利差剧烈波动。本文建立预期损失率模型,然后对交易所高收益债券的信用风险进行实证分析,
阅读全文
摘要:评分模型的检验方法和标准通常有:K-S指标、交换曲线、AR值、Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。 例如,K-
阅读全文
摘要:信用评分卡模型入门 2016-07-26 智能算法 智能算法 一、背景介绍: 4.数据整理(数据清理过程) 大量取样的数据要真正最后进入模型,必须经过数据整理。在数据处理时应注意检查数据的逻辑性、区分“数据缺失”和“0”、根据逻辑推断某些值、寻找反常数据、评估是否真实。可以通过求最小值、最大值和平均
阅读全文
摘要:信用评分卡模型开发中双峰分布原因及解决方案 文: 郑旻圻 邹钰 刘巧莉 转自: 数信互融 在信用评分卡模型开发过程中,正态性是检验模型信用评分分布是否有效的一个重要指标。正常情况下,标准的正态分布是单峰分布;但是在实际建模过程中,会遇到信用评分分布出现双峰的情况。 双峰分布出现时,数据规律一致性的假
阅读全文
摘要:WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老、中、青三组,一般的做法是ROC或者X-tile等等。今天介绍一种在信用卡评分系统中常用的连续变量离散化方法。目的是给大家在临床数据分析中提供一种借鉴思路
阅读全文
摘要:消费贷款信用评分及模型原理解析 2016-02-20 高利金服 消费信贷一直是推动世界领先国家经济转型的主要力量。在过去的50年里,消费开支也因此有所增加。根据纽约联邦储备银行家庭债务和信用季度报告,2014年8月,消费者负债总额为11.63万亿美元,其中74%为按揭和净值贷款,10%为学生贷款,8
阅读全文
摘要:评估信用评级模型,反思K-S指标 2015-12-05 KPMG大数据团队 KPMG大数据挖掘 “信用评级”的概念听起来可以十分直截了当。比如一天早上你接到电话,有个熟人跟你借钱,而你将在半睡半醒间迅速做出决定:借,还是不借。在灵光闪现的一秒里,你或许考虑了对方的脾气秉性、经济实力、家庭住址、种种黑
阅读全文
摘要:信用评级模型实例分析(以消费金融为例)-中 原创 2016-10-13 单良 亚联大数据 点击“亚联大数据”可关注我们! 第五章 自变量的初步分析与处理 模型变量有两种类型,分别是连续型变量 。连续型变数系指该变数为观察数据所得的实际数值,并没有经过群组处理 。间断型变数则系指质性变量或类别型变量
阅读全文
摘要:信用评分及模型原理解析 2014-10-16 明智大数据 本系列博文将针对消费贷款领域的信用评分及其模型进行相关研究探讨。虽然人人都可以通过对借款方在LendingClub和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷行为、评分机制和贷款决策背后的工作原理可以帮助投资人更好的在市场
阅读全文
摘要:互联网金融与大数据风控相结合的九大维度 2016-10-12 首席数据官联盟 大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务
阅读全文
摘要:“元方”系统刷新风控极限 钱牛牛(原名“钱升钱”)是中国较早自主开展智能化评估模型的少数平台之一。在平台刚起步仍在做票据及担保贷业务时,钱牛牛的研发团队就开始尝试通过数学化建模的方式,对借款人的信用进行综合化评估及打分。 而这家从一开始便给自己植入“风控DNA”的平台也在近日对风控体系做了全方位的升
阅读全文
摘要:百分点是一个推荐服务的提供商,但是已经转型为大数据解决方案的提供商。 首先看一下大数据与应用画像的关系,现在大数据是炙手可热的,大数据的4个V都比较了解,大数据应该说是信息技术的自然延伸,意味的无所不在的数据。我们先看下数据地位发生转变的历史,在传统的IT时代,it系统围绕这业务服务,在这个服务的过
阅读全文
摘要:用户画像的具体应用包括售前的精准营销,售中的个性化推荐以及售后的增值服务等。用户的标签纬度和应用是相互相城的关系,一面可以根据现有的标签纬度开发应用,另一方面可以通过应用需求扩展维度,两者互相促进。 我们在这里举的列子分为3类,第一类是售前的精准营销,比如电商客户和企业客户,需要经过精准营销,把站外
阅读全文
摘要:1 booststraping:意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。 其核心思想和基本步骤如下: (1)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。 (2)根据抽出的样本计
阅读全文
摘要:机器学习算法一览,应用建议与解决思路 机器学习算法一览,应用建议与解决思路 作者:寒小阳 时间:2016年1月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出处 1.引言 提起笔来写
阅读全文
摘要:MATLAB常用函数 MATLAB常用函数 1、常用取整函数 round(x):四舍五入函数 floor(x) : 向下取整, 即 floor(1.2)=1, floor(1.8) = 1 ceil(x) : 向上取整,即 ceil(1.2) = 2, ceil(1.8) = 2 2、取模函数 mo
阅读全文
摘要:scala资料总结,一些小技巧 1、得到每种数据类型所表示的范围 Short.MaxValue 32767 Short.MinValue -32768 Int.MaxValue 2147483647 Int.MinValue -2147483648 Double.MaxValue 1.7976931
阅读全文
摘要:使用java实现CNN的实战 使用java实现CNN的实战 1、要实现CNN,其中包括 卷积、池化(下采样)、分类器、优化方法、分类器、反向传播 2、可以使用一个三维数组来表示一张图片(通道、行、列) 3、卷积,卷积的方式有三种:valid,full,same,在CNN中我们用到了两种:前向传播时,
阅读全文
摘要:神经网络编程入门 本文主要内容包括: (1) 介绍神经网络基本原理,(2) AForge.NET实现前向神经网络的方法,(3) Matlab实现前向神经网络的方法 。 第0节、引例 本文以Fisher的Iris数据集作为神经网络程序的测试数据集。Iris数据集可以在http://en.wikiped
阅读全文
摘要:RBF神经网络通用函数 newrb, newrbe 1、newrb 其中P为输入向量,T为输出向量,GOAL为均方误差的目标,SPREED为径向基的扩展速度。返回值是一个构建好的网络,用newrb()创建的RBF网络是一个不断尝试的过程,在创建中不断的增加中间层的数量和神经元的数目,直到满足输出的误
阅读全文
摘要:机器学习-RBF高斯核函数处理 SVM高斯核函数-RBF优化 重要了解数学的部分: 协方差矩阵,高斯核函数公式。 个人建议具体的求法还是看下面的核心代码吧,更好理解,反正就我个人而言,烦躁的公式,还不如一段代码来的实际。本来想用Java的一个叫jblas的矩阵包,但是想了想,还是自己动手写一下吧。加
阅读全文
摘要:直接conda install libsvm安装的不完整,缺几个.py文件。 第一种安装方法: 下载:http://www.csie.ntu.edu.tw/~cjlin/cgi-bin/libsvm.cgi?+http://www.csie.ntu.edu.tw/~cjlin/libsvm+tar.
阅读全文
摘要:径向基神经网络 径向基神经网络 1、径向基函数 (Radial Basis Function,RBF) 神经网络是一种性能良好的前向网络,具有最佳逼近、训练简洁、学习收敛速度快以及克服局部最小值问题的性能,目前已经证明径向基网络能够以任意精度逼近任意连续的函数。因此它已经被广泛应用于模式识别、非线性
阅读全文
摘要:MLlib: RDD-based API This page documents sections of the MLlib guide for the RDD-based API (the spark.mllib package). Please see the MLlib Main Guide
阅读全文
摘要:目前所有的ANN神经网络算法大全 目前所有的ANN神经网络算法大全 概述 1 BP神经网络 1.1 主要功能 1.2 优点及其局限性 2 RBF(径向基)神经网络 2.1 主要功能 2.2 优点及其局限性 3 感知器神经网络 3.1 主要功能 3.2 优点及其局限性 4 线性神经网络 4.1 主要功
阅读全文
摘要:Spark1.6.1 MLlib 特征抽取和变换 1 TF-IDF TF-IDF是一种特征向量化方法,这种方法多用于文本挖掘,通过算法可以反应出词在语料库中某个文档中的重要性。文档中词记为t,文档记为d , 语料库记为D . 词频TF(t,d) 是词t 在文档d 中出现的次数。文档频次DF(t,D)
阅读全文
摘要:【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、MLlib实例 1.1 聚类实例 1.1.1 算法说明 聚类(Cluster analysis)有时也被翻译为簇类,其核心任务是:将一组目标object划分为若干个簇,每个簇之间的object尽可能相
阅读全文
摘要:Spark入门实战系列--8.Spark MLlib(上)--机器学习及SparkMLlib简介 1、机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: l“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 l“机
阅读全文
摘要:excel中如何筛选功能的使用 excel中如何筛选功能的使用 excel是一款数据处理工具,可以在众多的数据中找到想要的经过处理之后的数据,而最直接方便的功能就是筛选。请阅读下文,了解如何对数据进行筛选。 如下图所示的学生成绩中,我们要达到的目的是,找出所有王姓同学的相关成绩: 依次单击“数据,筛
阅读全文
摘要:机器学习降维方法概括 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u014772862/article/details/52335970 最近刷题看到特征降维相关试题,发现自己了解的真是太少啦,只知道最简单的降维方法,这里列出了常见的降维方法,有
阅读全文
摘要:七个用于数据科学(data science)的命令行工具 七个用于数据科学(data science)的命令行工具 数据科学是OSEMN(和 awesome 相同发音),它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNte
阅读全文
摘要:2015年3月:联迪商用获得2014-2015中国金融POS机市场年度成功企业奖; 2014年5月:联迪商用入选2013年福州市纳税百强企业; 2013年12月:联迪商用入选2013年度中国电子商务物流最佳技术装备企业; 2013年12月:联迪商用被列入第一批国家级知识产权优势企业; 2013年12
阅读全文
摘要:1:在NN训练中我们很常用的是训练集合以及测试集合,在训练集合上训练模型(我个人认为模型就是训练的方法以及对应的参数值,更偏重于参数值吧),训练好之后拿到测试集合上验证模型的泛华(就是该模型可以拿去实战的效果)的能力。 2:但是对于上述情况,举个例子,比如是在训练一个多层网络,我们用类似minFUN
阅读全文
摘要:立足GitHub学编程:13个不容错过的Java项目 立足GitHub学编程:13个不容错过的Java项目 今天我们将整理一大波干货满满的Java示例代码与能力展示素材。 GitHub可谓一座程序开发的大宝库,有些素材值得fork,有些则能帮助我们改进自有代码或者学习编程技能。无论如何,开发工作当中
阅读全文
摘要:31页PPT:基于Spark的移动大数据挖掘 31页PPT:基于Spark的移动大数据挖掘 数盟11.16 Data Science Meetup(DSM北京)分享:基于Spark的移动大数据挖掘分享嘉宾:张夏天(TalkingData首席数据科学家) @张夏天_机器学习 内容提要: Talking
阅读全文
摘要:教你如何成为Spark大数据高手? 教你如何成为Spark大数据高手? Spark目前被越来越多的企业使用,和Hadoop一样,Spark也是以作业的形式向集群提交任务,那么如何成为Spark大数据高手?下面就来个深度教程。 Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足
阅读全文
摘要:新手福利:Apache Spark入门攻略 新手福利:Apache Spark入门攻略 作者Ashwini Kuntamukkala 出处:CSDN 本文聚焦Apache Spark入门,了解其在大数据领域的地位,覆盖Apache Spark的安装及应用程序的建立,并解释一些常见的行为和操作。 一、
阅读全文
摘要:网易大数据平台的Spark技术实践 网易大数据平台的Spark技术实践 作者 王健宗 网易的实时计算需求 对于大多数的大数据而言,实时性是其所应具备的重要属性,信息的到达和获取应满足实时性的要求,而信息的价值需在其到达那刻展现才能利益最大化,例如电商网站,网站推荐系统期望能实时根据顾客的点击行为分析
阅读全文
摘要:7种最常见的Hadoop和Spark项目 7种最常见的Hadoop和Spark项目 如果您的Hadoop项目将有新的突破,那么它必定与下边介绍的七种常见项目很相像。 有一句古老的格言是这样说的,如果你向某人提供你的全部支持和金融支持去做一些不同的和创新的事情,他们最终却会做别人正在做的事情。如比较火
阅读全文
摘要:信贷业务流程——贷前、贷中、贷后(收藏吧!) 2016-05-10 孙自通 信贷风险管理 点击上面的蓝色字体“信贷风险管理”一键关注本平台 作者 | 孙自通 出品 | 信贷风险管理(ID:minjianjinronglawyer) 本文由本平台原创,转载需注明作者及出处 阅读提示:本期文章为一套完整
阅读全文
摘要:信贷八大要素及二十五大主要风险点(赶紧收藏吧)! 原创 2016-05-12 孙自通 信贷风险管理 点击上方蓝字免费订阅! 作者 | 孙自通 出品 | 信贷风险管理(ID:minjianjinronglawyer) 本文由本平台原创,转载请注明出处和作者 笔者一直认为,要想做好信贷业务,对一些基础的
阅读全文
摘要:企业会计准则第24号——套期保值 2015-12-28来源: 财政部网站 企业会计准则第24号——套期保值 财会[2006]3号 第一章 总则 第一条 为了规范套期保值的确认和计量,根据《企业会计准则——基本准则》,制定本准则。 第二条 套期保值(以下简称套期),是指企业为规避外汇风险、利率风险、商
阅读全文
摘要:企业会计准则第23号——金融资产转移 2015-12-27来源: 财政部网站 企业会计准则第23号——金融资产转移 财会[2006]3号 第一章 总则 第一条 为了规范金融资产(含单项或一组类似金融资产)转移的确认和计量,根据《企业会计准则——基本准则》,制定本准则。 第二条 金融资产转移,是指企业
阅读全文
摘要:企业会计准则第37号——金融工具列报 2015-12-28来源: 财政部网站 企业会计准则第37号——金融工具列报 财会[2014]23号 第一章 总则 第一条 为了规范金融工具的列报,根据《企业会计准则——基本准则》,制定本准则。 金融工具列报,包括金融工具列示和金融工具披露。 第二条 金融工具信
阅读全文
摘要:企业会计准则第39号——公允价值计量 财会[2014]6号 第一章 总则 第一条 为了规范公允价值的计量和披露,根据《企业会计准则——基本准则》,制定本准则。 第二条 公允价值,是指市场参与者在计量日发生的有序交易中,出售一项资产所能收到或者转移一项负债所需支付的价格。 第三条 本准则适用于其他相关
阅读全文
摘要:中央银行资产负债表 中央银行在履行职能时业务活动所形成的债权债务存量表。中央银行资产负债业务的种类、规模和结构都综合地反映在资产负债表上。 中央银行在履行职能时业务活动所形成的债权债务存量表。中央银行资产负债业务的种类、规模和结构都综合地反映在资产负债表上。 中文名中央银行资产负债表履 行职能时业务
阅读全文
摘要:Tomcat停,图片名字中文显示不出来 Tomcat停,图片名字中文显示不出来 Tomcat下,图片名字中文显示不出来在tomcat的server.xml中加入URIEncoding="utf-8"<Connector port="8080" connectionTimeout="20000" di
阅读全文
摘要:Linux下的实用工具——计算器 Linux下的实用工具——计算器 1. bc指令算加法,如图: 4. bc指令算除法(进阶),如图示,10/3之所以为3,是因为我们没有指定小数点后取几位,默认取到整数部分;而10/100之所以为零,道理同上,只取到整数0部分。使用“scale=[number]”指
阅读全文
摘要:买房的贷款时间是否是越长越好?https://www.zhihu.com/question/20842791
阅读全文
摘要:java replaceAll() 方法要用 4 个反斜杠,表示一个反斜杠 例如 str1="aa\bbb"; str2="aa'bbb"; 要想替换成 str1="aa\\bbb";str2="aa\'bbb"; 必须这样替换: str1 = str1.replaceAll("\\\\", "\\
阅读全文
摘要:http://v.youmi.cn/yanyanqiu.shtml http://blog.sina.com.cn/s/blog_162ab25640102wicj.html http://www.managershare.com/2014/02/20/learn-to-reporting-are-
阅读全文
摘要:公司组织调整来调整去,我周围有两位同事兄弟从单纯干活的,摇身一变成为带小队伍的。 然后就发生故事了。 最初都从单纯做事情,只用考虑给上司交差就好了,关键KPI一项项完成了,再对领导投其所好一下,基本就没问题了。 然而,要站出来带队伍了,方方面面事情就多了。对上级要积极争取资源,有资源才方便干活;对下
阅读全文
浙公网安备 33010602011771号