随笔分类 - 数据挖掘
摘要:现在上手总是有点惶恐,东西太多也不知道从何下手,这一篇主要记录准备要学习的东西,希望等到明年,会长成一棵大大的技能树。 内容校正调整:寒小阳 && 龙心尘 时间:2016年4月 出处:http://blog.csdn.net/han_xiaoyang/article/details/51191386
阅读全文
摘要:总结一下自己对python常用包:Numpy,Pandas,Matplotlib,Scipy,Scikit-learn 一. Numpy: 标准安装的Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指 针。这样为了保存一个
阅读全文
摘要:1. 数据元 data element(数据元素),单个数据单元,是数据的基本单位。参阅data field(数据字段)。 2. 元数据 首先,我们举个例子来看看什么叫做“元”,在后现代主义文学中有一种小说叫作“元小说”,也就是“关于小说的小说”。传统小说就是围绕着主人公描述一系列发生的事件。而元小
阅读全文
摘要:数据预处理 1. 数据质量的三个要素:准确性、完整性、一致性 2. 数据预处理的主要任务: 数据清理、数据集成、数据归约、数据变换 一. 数据清理 数据清理主要:填补缺失的值,光滑噪声同时识别离群点,并纠正数据的不一致性。 通常是一个两步的迭代过程,包括偏差检测和数据变换 注意:在某些情况下,缺失值
阅读全文
摘要:一. 各公司的数据挖掘岗位要求: 1. 2017年深信服校园招聘 算法工程师: 2. 2016年滴滴(大数据算法工程师) 3. 2016年腾讯(基础研究) 自然语言处理、多媒体、分布式网络、数据分析、智能计算、安全等互联网相关技术具有较深的研究和专业积累, 具有较好的创新能力和编程开发能力,具备较强
阅读全文

浙公网安备 33010602011771号