摘要: This checklist can guide you through your Machine Learning projects. There are eight main steps: 这个清单可以指导你完成机器学习项目。主要有如下8个步骤 1. Frame the problem and 阅读全文
posted @ 2020-05-07 18:12 1101011 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 机器学习可以根据训练时的量和类进行分类: 监督学习 在监督学习中,用来训练的数据包含了答案,成为标签 实例: 一个典型的监督学习任务是分类。垃圾邮件过滤器就是一个很好的例子:用许多带有归类 (垃圾邮件或普通邮件)的邮件样本进行训练,过滤器必须还能对新邮件进行分类。 另一个典型任务是预测目标数值,例如 阅读全文
posted @ 2020-05-07 18:08 1101011 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 命名规则: 数仓层级 + 主题 + 表名 数仓主题: dqm 数据质量管理 tb 数据基本信息 sii 脚本信息 bir bi报表信息 bs 业务信息 阅读全文
posted @ 2020-05-07 18:02 1101011 阅读(188) 评论(0) 推荐(0) 编辑
摘要: 数据结构最大的作用应该是如何将现实虚拟化,将某些特征数字化,量化。 如果你对数据库或高级数据结构感兴趣,请研究如下数据结构: B树、红黑树、堆、伸展树 如果你对搜索感兴趣,从 反向索引 着手是个不错的选择。 如果你对音乐识别软件感兴趣,可以了解傅里叶变化 对分布式感兴趣,可以了解MapReduce 阅读全文
posted @ 2020-04-14 17:11 1101011 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 完美是优秀最大的敌人 贪婪算法很简单:每步都采取最有的做法 贪婪算法寻找局部最优解,企图以这种方式获得全局最优解。 贪婪算法易于实现、运行速度快,是不错的近似算法。 # 表示需要覆盖的州 states_needed = set(["mt", "wa", "or", "id", "nv", "ut", 阅读全文
posted @ 2020-04-02 16:05 1101011 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 狄克斯特拉算法用于在加权图中查找最短路径。 仅当权重为时算法才管用,如果图中包含负权边,请使用贝尔曼-福得算法。 # 有向无环图 graph = {} graph["start"] = {} graph["start"]["a"] = 6 graph["start"]["b"] = 2 graph[ 阅读全文
posted @ 2020-04-02 15:11 1101011 阅读(197) 评论(0) 推荐(0) 编辑
摘要: from collections import deque graph = {} graph["you"] = ["alice", "bob", "claire"] graph["bob"] = ["anuj", "peggy"] graph["alice"] = ["peggy"] graph[" 阅读全文
posted @ 2020-04-02 10:19 1101011 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 快速排序的独特之处在于,它的速度取决于选择的基准值。 平均情况下其运行时间为O(n log n),最糟糕情况下,其运行时间为O( n2 ) def quicksort(array): if len(array) < 2: return array # 基线条件:为空或只包含一个元素的数组是“有序”的 阅读全文
posted @ 2020-04-01 16:42 1101011 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 递归指的是调用自己的函数每个递归都有两个条件:基线条件和递归条件。所有函数调用都会进入调用栈,栈有两种操作:压入和弹出。 def countdown(i): print(i) if i <= 1: return countdown(i-1) def fact(x): if x == 1: retur 阅读全文
posted @ 2020-04-01 15:43 1101011 阅读(102) 评论(0) 推荐(0) 编辑
摘要: def findSmallest(arr): smallest = arr[0] # 存储最小值 smallest_index = 0 # 存储最小值的索引 for i in range(1, len(arr)): if arr[i] < smallest: smallest = arr[i] sm 阅读全文
posted @ 2020-03-31 16:21 1101011 阅读(88) 评论(0) 推荐(0) 编辑