会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
ZacksTang
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
10
11
12
13
14
15
下一页
2018年11月13日
HBase架构
摘要: HBase Architectural Components HBase 的主从结构主要由三部分组成。Region Server 用于服务数据的读写,当访问数据时,客户端直接与 HBase RegionServer 交互。Region 的分配(region assignment),DDL(creat
阅读全文
posted @ 2018-11-13 15:32 ZacksTang
阅读(1880)
评论(0)
推荐(0)
2018年9月2日
用GraphX分析伴生网络(二)
摘要: 8. 过滤噪声边 在当前的伴生关系中,边的权重是基于一对概念同时出现在一篇论文中的频率来计算的。这种简单的权重机制的问题在于:它并没有对一对概念同时出现的原因加以区分,有时一对概念同时出现是由于它们具有某种值得我们关注的语义关系,但有时一对概念同时出现只是因为都频繁地出现在所有文档中,同时出现只是碰
阅读全文
posted @ 2018-09-02 16:15 ZacksTang
阅读(886)
评论(0)
推荐(0)
2018年8月25日
用GraphX分析伴生网络(一)
摘要: 1. 图论与GraphX 图论是一个数学学科,研究一组实体(称为顶点)之间两两关系(称为边)的特点。通过构建关系图谱,并对关系进行分析,可以实现更好的投放广告,推荐关系等。随着关系图谱越来越强大,计算量也越来越大,于是不断有新的并行图处理框架被开发出来。如谷歌的Pregel、雅虎的 Giraph 和
阅读全文
posted @ 2018-08-25 19:15 ZacksTang
阅读(1222)
评论(0)
推荐(0)
2018年8月12日
决策树预测森林植被
摘要: 1. 决策树和决策森林 决策树算法家族能自然地处理类别型和数值型特征 决策树算法容易并行化 它们对数据中的离群点(outlier)具有鲁棒性(robust),这意味着一些极端或可能错误的数据点根本不会对预测产生影响 2. Covtype数据集 https://archive.ics.uci.edu/
阅读全文
posted @ 2018-08-12 17:35 ZacksTang
阅读(1452)
评论(0)
推荐(0)
2018年8月5日
音乐推荐与Audioscrobbler数据集
摘要: 1. Audioscrobbler数据集 数据下载地址: http://www.iro.umontreal.ca/~lisa/datasets/profiledata_06-May-2005.tar.gz Audioscrobbler 数据集只记录了播放数据,如“Bob 播放了一首Prince 的歌
阅读全文
posted @ 2018-08-05 13:59 ZacksTang
阅读(2847)
评论(0)
推荐(0)
2018年8月1日
Spark数据分析-记录关联问题
摘要: 1. 问题描述 记录关联问题(Record Linkage):有大量从一个或多个源系统来的记录,其中有些记录可能代表了相同的基础实体。 每个实体有若干个属性,比如姓名、地址、生日。我们需要根据这些属性找到那些代表相同实体的记录。 不幸的是,有些属性值有问题:格式不一致,或有笔误,或信息缺失。如果简单
阅读全文
posted @ 2018-08-01 22:38 ZacksTang
阅读(2771)
评论(0)
推荐(0)
2018年5月8日
如何使用 Deepfakes 换脸
摘要: 如何使用 Deepfakes 换脸 1. 获取deepfakes工具包 git clone https://github.com/deepfakes/faceswap.git 2. 补齐依赖包: pip install tqdm pip install cv2 pip install opencv-
阅读全文
posted @ 2018-05-08 23:44 ZacksTang
阅读(68309)
评论(0)
推荐(6)
2018年1月19日
使用Python访问微信
摘要: itchat是一个开源的微信个人号接口,使用它我们可以很方便的访问我们个人微信号里的信息。itchat的github地址如下: https://github.com/littlecodersh/itchat 在通过 pip install itchat安装此模块后,我们即可以通过使用python访问
阅读全文
posted @ 2018-01-19 21:34 ZacksTang
阅读(6025)
评论(0)
推荐(0)
2018年1月7日
自然语言处理-介绍、入门与应用
摘要: 自然语言处理-介绍、入门与应用 根据工业界的估计,仅仅只有21%的数据是以结构化的形式展现的。数据由说话,发微博,发消息等各种方式产生。数据主要是以文本形式存在,而这种方式却是高度无结构化的。使用这些文本消息的例子包括:社交网络上的发言,聊天记录,新闻,博客,文章等等。 尽管我们会有一些高维的数据,
阅读全文
posted @ 2018-01-07 23:44 ZacksTang
阅读(20805)
评论(0)
推荐(0)
2018年1月5日
XGBoost介绍
摘要:
阅读全文
posted @ 2018-01-05 22:57 ZacksTang
阅读(404)
评论(0)
推荐(0)
上一页
1
···
10
11
12
13
14
15
下一页
公告