文章分类 - 数据挖掘
摘要:I have been playing around with spatial modelling in the R INLA package. This blog just records a few thoughts I have had about using INLA for kriging
阅读全文
摘要:1、背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变
阅读全文
摘要:Many introductions to Bayesian analysis use relatively simple didactic examples (e.g. making inference about the probability of success given bernoull
阅读全文
摘要:In my last posts ([here](http://flovv.github.io/Logo_detection_deep_learning/ and here, I described how one can detect logos in images with R. The fir
阅读全文
摘要:In this post, I'd like to focus on data munging, e.g. the process of acquiring and arranging data (typically in a tidymanner) prior to data analysis.
阅读全文
摘要:In the third part in a series on Tidy Time Series Analysis, we’ll use the runCor function from TTRto investigate rolling (dynamic) correlations. We’ll
阅读全文
摘要:For R users, there hasn’t been a production grade solution for deep learning (sorryMXNET). This post introduces the Keras interface for R and how it c
阅读全文
摘要:推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。 什么是Bandit算法 为选择而生 我们会
阅读全文
摘要:本文要介绍的这一篇paper是ICML2016上一篇关于 CNN 在图(graph)上的应用。ICML 是机器学习方面的顶级会议,这篇文章--<< Learning CNNs for Graphs>>--所研究的内容也具有非常好的理论和实用的价值。如果您对于图的数据结构并不是很熟悉建议您先参考本文末
阅读全文
摘要:1. 引言 偶尔遇到了这样一个问题,如何进行图片分类。最近deep learning很火,我们就试着用了一把,效果不错。Mxnet里面有很多训练的例子,可是如何拿训练好的模型去预测,如何生成训练数据,都没有实际的例子。这个就做一个实际的例子,来看看mxnet如何在我们工作中被使用。这个应用可以用来分
阅读全文
摘要:卷积神经网络原理浅析 卷积神经网络(Convolutional Neural Network,CNN)最初是为解决图像识别等问题设计的,当然其现在的应用不仅限于图像和视频,也可用于时间序列信号,比如音频信号、文本数据等。在早期的图像识别研究中,最大的挑战是如何组织特征,因为图像数据不像其他类型的数据
阅读全文
摘要:亚马逊将MXNet指定为官方深度学习平台,1月23日MXNet成为Apache的卵化项目。 无疑,这些将MXNet推向深度学习的热潮中,成为热捧的项目。当然,学习MXNet也是很有必要的。哈哈,加油深度学习。 目前支持以下的语言: Python R C++ Julia Scala Python R
阅读全文
摘要:Increasing amount of data is available on the web. Web scraping is a technique developed to extract data from web pages automatically and transforming
阅读全文
Feature Engineering in IoT Age – How to deal with IoT data and create features for machine learning?
摘要:Introduction If you ask any experienced analytics or data science professional, what differentiates a good model from a bad model – chances are that y
阅读全文
摘要:Introduction Reinforcement learning has recently gained a great deal of traction in studies that call for human-like learning. In settings where an ex
阅读全文
摘要:Machine learning uses so called features (i.e. variables or attributes) to generate predictive models. Using a suitable combination of features is ess
阅读全文
摘要:Introduction Over the last 12 months, I have been participating in a number of machine learning hackathons on Analytics Vidhya and Kaggle competitions
阅读全文
摘要:互动演讲版本请点这里 # dir <- 'F:/Projects/Rpackage/streamlineR' dir <- 'C:/Users/Jianhua/Dropbox/work_doc/Rpackage/streamlineR' knitr::opts_chunk$set(echo = TR
阅读全文
摘要:分类模型是数据挖掘中应用非常广泛的算法之一,常用的分类算法有Logistic模型、决策树、随机森林、神经网络、Boosting等。针对同一个数据集,可以有这么多的算法进行分析,那如何评估什么样的模型比较合理呢?本文就讲讲常用的模型验证武器,主要包括混淆矩阵、ROC曲线、提升度、增益法和KS统计量。
阅读全文
摘要:我们有一期的文章讲述了如何使用caret包进行数据的预处理,其中内容包括哑变量的创建、近零方差变了的筛选、数据标准化、缺失值处理、数据分割等。可以在教你使用caret包(一)--数据预处理获取更详细的内容介绍。下面我们接着讲讲如何使用caret包实现特征选择的任务。 特征选择的实质就是在已有的变量基
阅读全文

浙公网安备 33010602011771号