摘要: 恢复内容开始 数据库恢复技术 事务:是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。 事物的 ACID 特性:原子性、一致性、隔离性、持续性。 恢复的实现技术:建立冗余数据 -> 利用冗余数据实施数据库恢复。 建立冗余数据常用技术:数据转储(动态海量转储、动态 阅读全文
posted @ 2019-09-20 15:50 Z_W 阅读(3078) 评论(0) 推荐(0) 编辑
摘要: 关系数据理论 数据依赖是一个关系内部属性与属性之间的一种约束关系,是通过属性间值的相等与否体现出来的数据间相关联系。 最重要的数据依赖:函数依赖、多值依赖。 函数依赖是指关系中属性间(或者说是表中字段间)的对应关系。定义:设 R 为任一给定关系,如果对于 R 中属性 X 的每一个值,R 中的属性 Y 阅读全文
posted @ 2019-09-19 16:32 Z_W 阅读(1282) 评论(0) 推荐(0) 编辑
摘要: 数据结构和算法基础 索引的本质:数据结构,帮助高效获取数据 数据库的查询:最基本的查询算法当然是顺序查找(linear search)、二分查找(binary search)、二叉树查找(binary tree search)每种查找算法都只能应用于特定的数据结构之上,例如二分查找要求被检索数据有序 阅读全文
posted @ 2019-09-19 15:30 Z_W 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 1 介绍一下项目:项目背景,使用的方法 1.1 特征组合如何组合的 1.2 如何选择的特征,GBDT如何选择特征?(没懂什么意思,gbdt训练的时候应该是用的所有的特征,为什么还会有特征选择) 1.3 介绍一下blending方法。 1.4 介绍一下所有的模型各自使用的特征? 2 介绍一下特征提取的 阅读全文
posted @ 2019-09-17 21:49 Z_W 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 本文致力于对机器学习的相关模型进行学习总结,每个模型大概分成几个部分:模型简介,应用场景,优缺点,优化方法。以及实现demo。 首先介绍一下特征工程: 特征工程是完成一个机器学习的项目或者比赛的必备知识。 特征工程通常包括数据预处理,特征选择,降维等过程。 数据预处理: 阅读全文
posted @ 2019-09-10 18:38 Z_W 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 深度学习框架与应用 DNN CNN RNN Google Tensorflow, 社区发展资源多 facebook Pytorch, Caffe2 伯克利 Caffe, 亚马逊 MxNet Caffe Caffe 针对图像方面的任务,用于CNN 有 python 和 mathlab 的接口 通过不同 阅读全文
posted @ 2019-09-09 16:54 Z_W 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 1 数岛个数 1 1 1 0 1 1 1 0 0 1 1 0 1 0 0 0 0 0 0 0 结果为3 DFS:深度优先搜索,使用递归的遍历 BFS:广度优先遍历,使用队列记录 遍历:按照某种顺序访问“图”中所有的节点 顺序:深度优先(找最深的):栈 广度优先(找最近的):队列 时间复杂度 O(n+ 阅读全文
posted @ 2019-08-17 22:45 Z_W 阅读(195) 评论(0) 推荐(0) 编辑
摘要: (搬运工) 逻辑回归(LR)与SVM的联系与区别 LR 和 SVM 都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况下可以处理多分类问题,如LR的Softmax回归用在深度学习的多分类中) 区别: 1、LR 是 参数模型,SVM是非参数模型,(svm中的 linear 和 rbf 是 阅读全文
posted @ 2019-08-09 11:33 Z_W 阅读(1190) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 Softmax Regression 可以看做是 LR 算法在多分类上的推广,即类标签 y 的取值大于或者等于 2。 假设数据样本集为:$\left \{ \left ( X^{(1)},y ^{(1)} \right ) ,\left ( X^{(2)},y ^{(2)} \righ 阅读全文
posted @ 2019-08-07 15:20 Z_W 阅读(1279) 评论(0) 推荐(0) 编辑
摘要: 不均衡数据的重采样 在实际应用中,我们拿到的数据往往是正负样本比不均衡的,如:医疗诊断、网络入侵检测、信用卡反诈骗、推荐系统推荐等。而许多算法在面对不均衡的样本时往往会出现问题。 比如,最简单的,如果正负样本比例达到1:99,那么分类器将所有的样本都划分为负样本时的正确率能够达到99%,然而这并不是 阅读全文
posted @ 2019-08-06 16:19 Z_W 阅读(673) 评论(0) 推荐(0) 编辑