会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dy9776
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
···
40
下一页
2018年5月29日
拯救者y720 双显卡, nvidia 1060 ,Ubuntu16.04 安装 Nvidia 显卡驱动
摘要: 为了能够记录,下次可以有参考的东西,就记录如此 多谢网上大牛的帖子,我都是安装您们的才顺利的一次性,无黑屏现象的完成了安装 1. 参考: 1、secure boot option ( 开机进入bios) 应设置为disable,否则就算安装好NVIDIA驱动,调取ctrl+alt+F2, 输入sud
阅读全文
posted @ 2018-05-29 09:35 dy9776
阅读(952)
评论(0)
推荐(0)
2018年5月19日
文本挖掘之 文本相似度判定
摘要: 转载: 简介 针对文本相似判定,本文提供余弦相似度和SimHash两种算法,并根据实际项目遇到的一些问题,给出相应的解决方法。经过实际测试表明:余弦相似度算法适合于短文本,而SimHash算法适合于长文本,并且能应用于大数据环境中。 余弦相似度 余弦定理: 图-1 余弦定理图示 性质: 余弦值的范围
阅读全文
posted @ 2018-05-19 11:46 dy9776
阅读(915)
评论(0)
推荐(0)
2018年5月7日
集成学习
摘要: 集成学习最重要的两种类型:装袋(Bagging)与提升(Boosting),从其两大算法入手:Random Forest、GBDT。 集成学习包括元算法和模型融合两方面 从图中可以看出,元算法提供了从个体弱学习器到集成强学习器的实现,模型融合则在强学习器的基础上,设计结合策略进一步提升性能,元算法按
阅读全文
posted @ 2018-05-07 15:56 dy9776
阅读(376)
评论(0)
推荐(0)
模型融合
摘要: 1.线性加权融合方法 从算法的角度来看,则最常用的是采用加权型的混合推荐技术,即将来自不同推荐算法生成的候选结果及结果的分数,进一步进行组合(Ensemble)加权,生成最终的推荐排序结果。 具体来看,比较原始的加权型的方法是根据推荐效果,固定赋予各个子算法输出结果的权重,然后得到最终结果。很显然这
阅读全文
posted @ 2018-05-07 15:52 dy9776
阅读(4747)
评论(0)
推荐(3)
2018年5月4日
高并发
摘要: 一、什么是高并发 高并发(High Concurrency)是互联网分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计保证系统能够同时并行处理很多请求。 高并发相关常用的一些指标有响应时间(Response Time),吞吐量(Throughput),每秒查询率QPS(Query Per
阅读全文
posted @ 2018-05-04 11:12 dy9776
阅读(208)
评论(0)
推荐(0)
2018年4月26日
uml中活动图与流程图的区别
摘要: 活动图定义: 活动图是UML用于对系统的动态行为建模的另一种常用工具,它描述活动的顺序,展现从一个活动到另一个活动的控制流。活动图在本质上是一种流程图。 它是UML中用于对系统动态活动建模的图形,反映系统中一个活动到另一个活动的流程,常常用于描述业务过程和并行处理过程。活动图中包括泳道、活动开始、活
阅读全文
posted @ 2018-04-26 11:07 dy9776
阅读(905)
评论(0)
推荐(0)
2018年4月9日
六大主流开源SQL引擎总结
摘要: 本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calcite、Kylin、Phoenix、Tajo 和Trafodion。以及2个商业化选择Oracle Big Data SQL 和IBM Big SQL,IBM 尚未将后者更名为
阅读全文
posted @ 2018-04-09 12:12 dy9776
阅读(4820)
评论(0)
推荐(0)
2018年4月4日
有关文档的记录
摘要: 1. 数据流图: visio 2.详细分析中: 用EA或者rose 3.数据库画图:powerDesigner
阅读全文
posted @ 2018-04-04 09:32 dy9776
阅读(143)
评论(0)
推荐(0)
2018年3月30日
使用mapreduce来分析网站的log日志
摘要: 之前,就写过,但是忘了总结了,找了半天也没有找到,看了以后要将东西整理了。 无奈,在网上收拾,看到这个人写的,索性,就搬过来,待我找到我写的,在一块补充一下! 所有网站的服务器上都会保留访问的log日志。这些log日志记录的其他机器访问服务器的ip,时间,http协议,状态码等信息。 比如这样: i
阅读全文
posted @ 2018-03-30 17:44 dy9776
阅读(693)
评论(0)
推荐(0)
2018年3月27日
UML - EA 序列图
摘要: 序列图中的 Fragment 的类型(Loop、Opt、Par和Alt) (还有: ) 序列图主要用于展示对象之间交互的顺序。 序列图将交互关系表示为一个二维图。纵向是时间轴,时间沿竖线向下延伸。横向轴代表了在协作中各独立对象的类元角色。类元角色用生命线表示。当对象存在时,角色用一条虚线表示,当对象
阅读全文
posted @ 2018-03-27 11:28 dy9776
阅读(5517)
评论(0)
推荐(1)
上一页
1
2
3
4
5
6
7
···
40
下一页
公告