随笔分类 -  数据分析

摘要:常见概念 数据挖掘的定义与意义 定义:数据挖掘是数据模型的发现过程 模型的含义:统计建模(高斯分布等)/机器学习(贝叶斯网络/SVM/决策树等)/数据汇总(PageRank)/特征抽取(频繁项/相似项,例如协同过滤) 在大数据领域常使用非精确(统计)方法实现快速的计算 非精确过滤器:布隆过滤器;非精 阅读全文
posted @ 2021-03-02 11:25 jiahu 阅读(811) 评论(0) 推荐(0)
摘要:线性代数基础 参考资料: 3blue1brown,从几何的角度介绍线代,推荐观看,一共十几个视频,每个视频不到 15分钟。官方地址 https://www.patreon.com/3blue1brown/posts 《线性代数及其应用》,工科强烈推荐阅读 immersivemath,交互式线性代数学 阅读全文
posted @ 2021-01-28 21:55 jiahu 阅读(1136) 评论(0) 推荐(0)
摘要: 搜索引擎简介 [TOC] 本文为阅读《这就是搜索引擎:核心技术详解》的读书笔记 搜索引擎是互联网重要的组成部分,搜索引擎技术也是当前解决信息过载问题主要的手段 可以按照使用的技术将搜索引擎的发展分为四个阶段: 1. 分类目录,和 PC 机上的文件目录类似,相同种类的网址由人工整理并汇聚在一起 2 阅读全文
posted @ 2019-10-04 12:17 jiahu 阅读(1158) 评论(0) 推荐(0)