上一页 1 ··· 403 404 405 406 407 408 409 410 411 ··· 423 下一页
摘要: 原文链接:http://tecdat.cn/?p=6608 介绍 大多数时候,我能够破解特征工程部分,但可能没有使用多个模型的集合。 在本文中,我将向您介绍集成建模的基础知识。 另外,为了向您提供有关集合建模的实践经验,我们将使用R对hackathon问题进行集成。 1.什么是集成? 通常,集成是一 阅读全文
posted @ 2019-06-25 15:20 拓端tecdat 阅读(414) 评论(0) 推荐(0)
摘要: 目标 本文的目的是对如何在R中进行生存分析进行简短而全面的评估。关于该主题的文献很广泛,仅涉及有限数量的(常见)问题/特征。可用的R包数量反映了对该主题的研究范围。 R包 可以使用各种R包来解决特定问题,并且还有替代功能来解决常见问题。以下是本次审查中用于读取,管理,分析和显示数据的软件包。运行以下 阅读全文
posted @ 2019-06-24 17:00 拓端tecdat 阅读(1950) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=5299 首先,自从雅虎的雅虎决定关闭他们的免费数据以来,免费的日常数据世界已经处于一个黑暗的时代。 Quantom的最新版本(可以从CRAN安装)现在包含了从2000年以来从AlphaVantage获得免费财务数据的一种方法,通常对于大多数后测来说 阅读全文
posted @ 2019-06-24 16:24 拓端tecdat 阅读(314) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=4612 贝叶斯分析的许多介绍都使用了相对简单的教学实例(例如,根据伯努利数据给出成功概率的推理)。虽然这很好地介绍了贝叶斯原理,但是这些原则的扩展并不是直截了当的。 这篇文章将概述这些原理如何扩展到简单的线性回归。一路上,我将导出感兴趣参数的后验条 阅读全文
posted @ 2019-06-24 16:13 拓端tecdat 阅读(731) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=5136 library(hrbrthemes) 关于数据的一个技巧; 原始数据只有选定代表的分数(自然)。这意味着,在任何一年中,都会有几个州(每个党约8-10人)没有民主党或共和党代表。因为这些是行缺失而不是NA,如果你按原样绘制它们,那些状态将 阅读全文
posted @ 2019-06-24 16:02 拓端tecdat 阅读(473) 评论(0) 推荐(0)
摘要: 原文:http://tecdat.cn/?p=387 Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。本文是关于如何使用Twitter R包获取twitter数据并将其导入R,然后对它进行一些有趣的数据分析。 第一步是 阅读全文
posted @ 2019-06-24 15:40 拓端tecdat 阅读(396) 评论(0) 推荐(0)
摘要: 看看就业市场中深度学习/人工智能趋势如何广泛流行。 我从网站上挖掘了可用的职位空缺数量:Monster,Stepstone和Indeed正在搜索术语“数据科学家”。 为了把这些数字看得很清楚,在2015年12月,我在Indeed上找到65个工作,在Monster找到36个,在Stepstone找到3 阅读全文
posted @ 2019-06-24 15:19 拓端tecdat 阅读(305) 评论(0) 推荐(0)
摘要: 原文链接 http://tecdat.cn/?p=1951 随着智能手机的普及和手机用户的激增,共享单车作为城市交通系统的一个重要组成部分,以绿色环保、便捷高效、经济环保为特征蓬勃发展。 作为城市共享交通系统的一个重要组成部分,以绿色环保、便捷高效、经济环保为特征的自行车共享行业在2016年用户总数 阅读全文
posted @ 2019-06-21 17:09 拓端tecdat 阅读(4060) 评论(0) 推荐(0)
摘要: 原文链接: http://tecdat.cn/?p=3784 了解不同的市场状况如何影响您的策略表现可能会对您的回报产生巨大的影响。 某些策略在波动剧烈的市场中表现良好,而其他策略则需要强劲而平稳的趋势,否则将面临长时间的下跌风险。搞清楚什么时候开始或停止交易策略,调整风险和资金管理技巧,甚至设置进 阅读全文
posted @ 2019-06-21 17:02 拓端tecdat 阅读(315) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=5354 维度的诅咒是一种现象,即数据集维度的增加导致产生该数据集的代表性样本所需的指数级更多的数据。 为了对抗维度的诅咒,已经开发了许多线性和非线性降维技术。这些技术旨在通过特征选择或特征提取来减少数据集中维度(变量)的数量, 而不会显着丢失信息。 阅读全文
posted @ 2019-06-21 16:44 拓端tecdat 阅读(455) 评论(0) 推荐(0)
上一页 1 ··· 403 404 405 406 407 408 409 410 411 ··· 423 下一页