随笔档案「2016年6月」 - python挖掘

multiGraph

摘要：阅读全文

posted @ 2016-06-21 19:05 python挖掘阅读(343) 评论(0) 推荐(0)

手册框架

摘要：3.2 Basic graph types基本的图类型 Graph – Undirected graphs with self loops（有自环的无向图） DiGraph - Directed graphs with self loops（有自环的有向图） MultiGraph - Undirec 阅读全文

posted @ 2016-06-19 20:42 python挖掘阅读(209) 评论(0) 推荐(0)

深度强化学习

摘要：鼓捣smartcab项目遇到点坎儿，搜罗资料时发现一篇很好的博文，mark一下~ http://wanghaitao8118.blog.163.com/blog/static/13986977220153811210319/(好像链接失效了！下次要将关键点摘录出来！) 阅读全文

posted @ 2016-06-19 18:25 python挖掘阅读(990) 评论(0) 推荐(0)

概览

摘要：SVR、岭回归、Lasso K-means、谱聚类、均值偏移 PCA、特征选择、NMF（非负矩阵分解）（方法）网格搜索、交叉验证、metrics preprocessing、feature extraction 阅读全文

posted @ 2016-06-19 18:15 python挖掘阅读(156) 评论(0) 推荐(0)

加权网络置乱算法

摘要：在社交网络中个体之间存在着强、弱链接，不同连接的功能和作用不同；在新陈代谢网络中各条路径中存在着不均匀的通量；在食物链网络中不同物种之间的相互作用强度也不同。相对于无权网络，加权网络增加了权重这一重要属性，为研究网络中节点间关系和相互作用提供了更加细致的刻画手段，是复杂网络系统的一个重要分支。复阅读全文

posted @ 2016-06-19 11:48 python挖掘阅读(562) 评论(0) 推荐(0)

时变网络置乱算法实现

摘要：疑问及纠错边上的所以接触值是唯一存在的么（比如说AB边的时序是1，2，3，AC边的时序是2，4，5可以吗）？不是，不同边上可以有相同的接触（这也是之后置乱要强调单个边上不允许出现两个相同时间点的原因）等权置乱算法叫做等时权置乱算法是不更好，因为是在时权置乱的基础上加了等权条件（而且此处的置乱不改阅读全文

posted @ 2016-06-19 11:33 python挖掘阅读(670) 评论(0) 推荐(0)

应该常去的网站

摘要：https://docs.python.org/2/tutorial/ http://pandas.pydata.org/ http://matplotlib.org/ http://networkx.github.io/ http://scikit-learn.org/stable/ http:/ 阅读全文

posted @ 2016-06-18 21:48 python挖掘阅读(177) 评论(0) 推荐(0)

Reinforcement Learning

摘要：the differences are between the three types of learning（supervised, unsupervised and reinforcement）监督学习、无监督学习和强化学习的区别 supervised learning sort of tak 阅读全文

posted @ 2016-06-17 09:28 python挖掘阅读(975) 评论(0) 推荐(0)

无人驾驶汽车

摘要：需再看 https://classroom.udacity.com/courses/cs373/lessons/48684821/concepts/487362110923 https://classroom.udacity.com/courses/cs373/lessons/48704330/co 阅读全文

posted @ 2016-06-14 12:03 python挖掘阅读(617) 评论(0) 推荐(0)

A/B测试

摘要：参考链接http://oldj.net/article/ab-testing-basic-concept/ A/B测试的核心的思想： 1、多个方案并行测试；2、每个方案只有一个变量不同；3、以某种规则优胜劣汰测试原则之一便是单变量测试，每一变量编写一个测试用例，这样才有可比性阅读全文

posted @ 2016-06-13 11:11 python挖掘阅读(403) 评论(0) 推荐(0)

Udacity_数据分析

摘要：correlation does not prove causation相关性不等于因果关系问卷调查的利弊阅读全文

posted @ 2016-06-11 16:14 python挖掘阅读(269) 评论(0) 推荐(0)

计算传播学在电子商务中的应用

摘要：口碑传播用户评论内容的文本分析广告受众的精准定向阅读全文

posted @ 2016-06-11 14:07 python挖掘阅读(258) 评论(0) 推荐(0)

常用算法梳理-决策树

摘要：决策树决策树是一种基本的分类与回归方法，通常包括三个步骤：特征选择、决策树的生成和决策树的修剪。树由节点和有向边组成，节点分内部节点（特征或属性）和叶节点（表示一个类）用决策树分类，从根节点开始，对实例的某一特征进行测试，根据测试结果，将实例分配到其子节点。重复上述过程，直到达到叶节点。首先阅读全文

posted @ 2016-06-11 09:11 python挖掘阅读(1496) 评论(0) 推荐(0)

Indexing and Selecting Data

摘要：where< >mask query 阅读全文

posted @ 2016-06-11 08:20 python挖掘阅读(152) 评论(0) 推荐(0)

Python的可视化图表工具集

摘要：Matplotlib Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity.强大但相对复杂 Seabo 阅读全文

posted @ 2016-06-08 16:31 python挖掘阅读(643) 评论(0) 推荐(0)

seaborn学习笔记

摘要：Seaborn的优点：（摘自http://www.tuicool.com/articles/7NzaEvq）默认情况下就能创建赏心悦目的图表创建具有统计意义的图能理解pandas的DataFrame类型 Seaborn将matplotlib的参数划分为两个组，第一组控制图表的样式和图的度量尺度阅读全文

posted @ 2016-06-07 21:19 python挖掘阅读(242) 评论(0) 推荐(0)

Udacity_Project:Building a Student Intervention System

摘要：模型预测流程(Predictive Modelling Process)：评估矩阵：对于不均衡样本，我们选用F1值而非准确性（accuracy score）来评估，精确度和召回率也可用于本分类问题。逻辑回归是一种广义的线性回归分析模型。回归就是表明自变量x与因变量y的关系，即y=f(x)。如医阅读全文

posted @ 2016-06-07 19:53 python挖掘阅读(313) 评论(0) 推荐(0)

d3.js学习笔记

摘要：入门好文：http://www.ourd3js.com/wordpress/?p=51 d3.js和d3.min.js内容一样，后者是压缩过的，适合发行版本，前者适合开发人员。 1.选择集(满足css选择符的要求)主要和数据绑定一起使用 d3.select() d3.selectAll() var 阅读全文

posted @ 2016-06-07 18:02 python挖掘阅读(3054) 评论(0) 推荐(0)

计算传播学在新闻和公共舆论领域的应用

摘要：我们将社会成员按其参与社会化媒体的程度分为5类：意见领袖、活跃发言者、被动跟随者、纯粹旁观者、非用户公众注意力指公众对于某些社会议题进行思考的过程中所投入的时间和认知资源。（近来以搜索词来测量）沉默的螺旋理论认为：人们是否表达意愿取决于他们对周围环境的看法。当人们认为在其所处的外部环境中自己的观阅读全文

posted @ 2016-06-06 10:04 python挖掘阅读(724) 评论(0) 推荐(0)

信息扩散模型

摘要：P84 协调博弈介绍部分重复、啰嗦信息扩散影响因素：网络结构、人们传播信息的意愿经典的信息扩散模型创新扩散模型（S型曲线）局部相互作用的博弈模型阈值模型级联模型 Markov随机场图模型传染病模型数据驱动的信息扩散模型分支过程模型（可用来预测口碑在网络社区中的传播）侧重于信息扩散阅读全文

posted @ 2016-06-06 09:27 python挖掘阅读(3881) 评论(0) 推荐(0)

节点传播能力的测量

摘要：意见领袖三种定量测量用户在线影响力的方法： 1）激发回复，即用户发布一条帖子后收到的回复数 2）激发对话，即该用户回复帖子后，所激发他人的讨论 2）语言扩散，即他人是否沿用该用户所使用的词语基于网络结构节点传播能力的测量局部属性指标：度值、局部中心性等全局属性指标：特征向量中心性、Katz指阅读全文

posted @ 2016-06-05 22:08 python挖掘阅读(592) 评论(0) 推荐(0)

博弈论

摘要：为啥a有4个策略而b有3个策略？看到下面（树->矩阵）这个就了然了：强化学习的根本目的在于最大化奖励【optimize your long term expected reward(获得更多的奖励)】 MiniMAx 假设所有人都在寻求最优，达到最大化奖励来吧，再加点不确定性进来~~愉快的玩耍阅读全文

posted @ 2016-06-05 18:10 python挖掘阅读(2333) 评论(0) 推荐(0)

影响信息传播的可计算因素分析

摘要：四大方面：网络结构、用户行为和信息属性、用户属性网络的连通性网络的连通性对信息传播（传播速度、扩散规模）有较大影响。度相关性：一条边连接的两个节点度值之间的相关性（一般使用度值的Pearson相关系数来刻画）度大节点趋于和度大节点相连，则该网络为同配的度大节点趋于和度小节点相连，则该网络为阅读全文

posted @ 2016-06-05 16:26 python挖掘阅读(691) 评论(0) 推荐(0)

单条信息传播的多维度测量

摘要：P8l5 一系列动词后加了个名词，建议把“转发次数”变成“转发”，或者把其他也改为次数描述（如浏览量、点击次数等）。 P12l3 说同一主题内不同标签的级联模式不同，后文仅简单介绍了有哪些不同标签，没有提及有什么不同级联模式。重点不是要说级联模式么？ P11l2 信件链扩散数位窄深的原因是他们所选择阅读全文

posted @ 2016-06-05 11:44 python挖掘阅读(559) 评论(0) 推荐(0)

增强式学习

摘要：非常好的一个导入例子如图在每一个格子中我们都有四种移动策略（action:U,D,L,R）,但理想总是美好的，现实总是骨干的。有些时候，我们想着的方向并不一定是我们移动的方向，所以我们引入概率。正确移动的概率为0.8，错误移动的概率各为0.1（不允许倒退） MArkov决策过程（MDP）：特性— 阅读全文

posted @ 2016-06-04 20:23 python挖掘阅读(340) 评论(0) 推荐(0)

散布矩阵

摘要：统计学基本概念之均值、方差、协方差等，参看http://pinkyjie.com/2010/08/31/covariance/ 散布矩阵前乘以系数1/n就可以得到协方差矩阵，可以利用散度矩阵做PCA 阅读全文

posted @ 2016-06-04 17:45 python挖掘阅读(1202) 评论(0) 推荐(0)

特征选择

摘要：特征选择是指从全部特征中选取一个特征子集，剔除不相关(irrelevant)或冗余(redundant )特征，可以减少特征个数，提高模型精确度，从而减少运行时间。此外，较少的特征使研究人员易于理解数据产生的过程。特征选择全过程：进行特征选择前需要先给出一个评价函数（即评价一个特征子集好坏程度阅读全文

posted @ 2016-06-04 15:44 python挖掘阅读(538) 评论(0) 推荐(0)

CouchDB

摘要：Apache CouchDB是一个开源数据库，专注于易用性和成为"完全拥抱web的数据库"。它是一个使用JSON作为存储格式，JavaScript作为查询语言，MapReduce和HTTP作为API的NoSQL数据库。其中一个显著的功能就是多主复制。CouchDB的第一个版本发布在2005年，在20 阅读全文

posted @ 2016-06-03 10:41 python挖掘阅读(365) 评论(0) 推荐(0)

echarts和matplotlib

摘要：echarts是百度研发的一款开源的JS图表库，提供商业产品常用图表，底层基于ZRender（一个全新的轻量级canvas类库），创建了坐标系，图例，提示，工具箱等基础组件，并在此上构建出折线图、柱状图、散点图、K线图、饼图、雷达图、地图、和弦图、力导向布局图、仪表盘以及漏斗图，同时支持任意维度的堆阅读全文

posted @ 2016-06-03 10:07 python挖掘阅读(1946) 评论(0) 推荐(0)

特征缩放

摘要：如上图，我们直到右边两个人的身高体重以及穿衣尺码，想要知道左边人的穿衣尺码，若单纯将身高体重数值相加，得到与预期相悖的结论。这是由于身高范围在[115,175],而体重范围在[5,7]，两者范围相差较大，应该先归一化。缩放公式： sklearn中相关实现：阅读全文

posted @ 2016-06-01 14:44 python挖掘阅读(510) 评论(0) 推荐(0)

K-means、SLC、EM

摘要：http://www.naftaliharris.com/blog/visualizing-k-means-clustering/ 一片不错的博文：http://coolshell.cn/articles/7779.html K-means算法如下： K-Means主要有两个最重大的缺陷： k是事先阅读全文

posted @ 2016-06-01 13:30 python挖掘阅读(253) 评论(0) 推荐(0)

职责要求

摘要：理解机器学习基本算法的设计思想和求解手段，如SVM, LR, RF, Boosting等 SVM支持向量机寻找最大分割平面为过拟合，应该增加惩罚项 LR逻辑回归：一种线性分类器 RF随机森林 Boosting 朴素贝叶斯：决策树：阅读全文

posted @ 2016-06-01 09:39 python挖掘阅读(178) 评论(0) 推荐(0)

come_on

06 2016 档案

公告