随笔分类 -  算法

摘要:DeepFM就是FM模型结合DNN的产物,模型结构及原理详见:https://mp.weixin.qq.com/s/Hb6tKk1sw9pZ7qysO765nw,代码逻辑:Hive取数➡️生成onehot编码字典➡️转换数据➡️输入以训练模型 模型代码见github:https://github.c 阅读全文
posted @ 2020-01-06 15:00 zwtzz 阅读(1043) 评论(0) 推荐(0)
摘要:二分法开根号,通过二分法在[0,n]之间寻找合适的数(n>1时),而n<1时,需要将上限设为1,即使用二分法在[0,1]之间寻找合适的数,最终达到一定精度跳出循环,但迭代很慢。 牛顿法可以快速迭代(牛顿法介绍) 阅读全文
posted @ 2019-09-05 22:01 zwtzz 阅读(4146) 评论(0) 推荐(0)
摘要:问题:给出一个整数数组,要找出元素之和最大的子数组。 如有列表A 算法1: 分析:外层循环变量j迭代n次,内层循环变量k最多迭代n次,最内层循环变量i最多迭代n次,因此算法复杂度为O(n3) 算法2: 考虑Si为前i个元素之和(前缀和),则Aj加到Ak可表示为Sk - Sj-1,则有以下算法 分析: 阅读全文
posted @ 2019-07-08 14:19 zwtzz 阅读(264) 评论(0) 推荐(0)
摘要:https://www.cnblogs.com/willnote/p/6801496.html 阅读全文
posted @ 2019-07-03 20:37 zwtzz 阅读(256) 评论(0) 推荐(0)
摘要:https://www.cnblogs.com/zy230530/p/7029025.html k-means算法中的k表示聚类为k个簇,means代表取每一个聚类中数据的均值作为该簇的中心(质心)即用每一个类的质心对该簇进行描述。k-means算法的原理比较简单,但它有缺陷,即其可能收敛到局部最优 阅读全文
posted @ 2019-04-17 20:25 zwtzz 阅读(2753) 评论(0) 推荐(0)
摘要:4.1 不含有特征向量相同但标记不同的冲突数据 and 决策树按照属性特征来划分,相同属性特征的样本最终会进入同一个叶子节点 >- 如果含有特征向量相同但标记不同的冲突数据 >- 必然至少存在一对样本,属性相同而分类不同,即产生了训练误差 >- 不含有特征向量相同但标记不同的冲突数据 4.2 简单的 阅读全文
posted @ 2019-04-15 21:10 zwtzz 阅读(2935) 评论(0) 推荐(0)
摘要:梯度下降法 https://www.jianshu.com/p/c7e642877b0e 牛顿法 https://blog.csdn.net/sigai_csdn/article/details/80678812 https://blog.csdn.net/ccnt_2012/article/det 阅读全文
posted @ 2019-04-13 21:26 zwtzz 阅读(271) 评论(0) 推荐(0)
摘要:首先,算法的时间复杂度和空间复杂度合称为算法的复杂度。 时间复杂度 (1)时间频度:一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的 阅读全文
posted @ 2019-04-01 13:55 zwtzz 阅读(950) 评论(0) 推荐(0)
摘要:排序算法经过长时间演变,大体可以分为两类:内排序和外排序。在排序过程中,全部记录存放在内存,则成为内排序;如果排序过程中需要使用外存,则称为外排序,本文讲的都属于内排序。 内排序有可以分为以下几类: (1)插入排序:直接插入排序、二分法插入排序、希尔排序 (2)选择排序:直接选择排序、堆排序 (3) 阅读全文
posted @ 2019-03-31 19:28 zwtzz 阅读(81755) 评论(5) 推荐(8)