07 2021 档案
摘要:21/7/31 读书笔记 数据库系统概论 数据依赖的公理系统 上节说到,数据依赖包括函数依赖和多值依赖,其中函数依赖可以看做多值依赖的一种特殊情况。 Armstrong公理系统与相关符号定义 我们首先讨论函数依赖下的一个有效的公理系统——Armstrong公理系统: 蕴涵:对关系模式R(U,F),如
阅读全文
摘要:21/7/30 读书笔记 数据库系统概论 关系数据理论与规范化 在数据库设计中,我们最常考虑的一件事情就是如何构造合适的数据模式。在关系数据库中,这一问题转变为如何构造合适的关键模型,进一步来说就是如何设计关系表。 我们如何评价一系列(相关的)关系表的好坏呢?或者说,我们如何评价一个模式的好坏?我们
阅读全文
摘要:21/7/29 读书笔记 数据库系统导论 数据库完整性 数据库的完整性是指数据的正确性和相容性: 正确性:数据中的对象应当能够正确描述现实世界。比如人的身高不应该超过3m。 相容性:数据中的对象在不同关系表中表现出的数据应当符合逻辑。比如同一个人不能在两张关系表中具有不同的性别。 SQL在数据定义语
阅读全文
摘要:21/7/28 读书笔记 数据库系统概论 数据存取控制 数据库安全最重要的一点在于数据的存取控制,确保只有授权的人能够获取与修改数据库中特定的信息。其主要由用户权限登记和用户合法权限检查两部分组成。 按照对权限的定义与检查方式不同,分为**自主存取控制(DAC)**和 强制存取控制(MAC)。前者允
阅读全文
摘要:21/7/27 读书笔记 数据库系统概论 SQL数据更新 SQL中对数据的更新操作主要基于INSERT插入、UPDATE修改、DELETE删除三种子句。 **注意,对基本表的增删改查可能破坏参照完整性!**需要进行参照完整性检查和控制。 INSERT 插入 搭配INTO与VALUE,插入操作分为插入
阅读全文
摘要:21/7/26 读书笔记 数据库系统概论 SQL数据查询 SQL数据查询功能主要依赖SELECT……FROM……的语法结构来执行。我们可以将一条查询语句分割为多条子句,包括: SELECT子句:指明目标列表达式 FROM子句:指明数据来源的基本表、视图、派生表 FROM中指明的名称,在当做数据来源分
阅读全文
摘要:21/7/25 读书笔记 数据库系统概论 SQL基本概念 结构化查询语言(Structured Query Language,SQL)是关系数据库的标准语言。SQL是关系数据库的语言标准,但是所有的关系数据库厂商都没能支持SQL标准的所有概念与特性,同时这些厂商还会在标准上添加各自的拓展。 SQL的
阅读全文
摘要:21/7/24 读书笔记 数据库系统概论 关系代数 关系代数是一种语言,其利用对于关系的运算来表示查询。在关系代数中,运算对象和运算结果都是关系,形式上都表现为二维表。 关系代数中的运算符可以按集合运算和关系运算分为两类: 集合运算:交$\bigcap$、并$\bigcup$、差$-\(、笛卡儿积\
阅读全文
摘要:21/7/23 读书笔记 数据挖掘导论 关系模型的基本概念 关系模型的数据结构——关系 模型一般由数据结构、操作集合和约束性条件构成。关系,就是关系模型的数据结构。 关系是动态的,我们认为在关系数据库系统中关系就是数据,因此数据更新时发生改变,关系也会随之改变。 对于关系的形式化定义,基于以下概念:
阅读全文
摘要:21/7/22 读书笔记 数据库系统概论 概念模型 概念模型是将现实世界反映到机器世界的第一层抽象,其描述了解决问题所需的数据模型所应有的结构。概念模型一方面需要能够有语义表达能力,直观表达出应用程序中所需的语义概念,另一方面需要通俗简单,方便人理解。 概念模型中的基本概念包括: 实体:我们称客观存
阅读全文
摘要:21/7/21 读书笔记 今天回家,耶~ 在机场的麦当劳写的,巨无霸真的难吃 数据库系统概论 数据库系统的意义 数据管理技术经过了人工管理、文件系统、数据库系统的进化。人工管理阶段没有直接存取的存储设备,数据与应用软件本身都是实时输入使用的,可以想象老式机上靠插卡片的方式控制数据。而文件系统出现后,
阅读全文
摘要:21/7/20 读书笔记 明天返乡,今明两天也不忘水一水博客 数据挖掘导论 读后感 框架介绍 《数据挖掘导论》中第一章“数据”首先以“什么是数据”为主要问题,系统介绍了对于数据属性、度量、质量的定义,以及介绍了数据预处理的技术以及数据相似性与相异性的概念与度量。这部分是之后详细学习数据挖掘的基础,定
阅读全文
摘要:21/7/19 读书笔记 数据挖掘导论 异常检测 异常对象通常被称为离群点(outlier),这些数据点明显得偏离其他数据点。异常的挖掘又被称为“例外挖掘(exception mining)”和“偏差检测(deviation detection)”。 异常对象出现概率小,但是同时也可能具有较高的挖掘
阅读全文
摘要:21/7/18 读书笔记 数据挖掘导论 基于密度的聚类 之前学习的DBSCAN是一种基础的基于密度的聚类方法。本节中讨论其他基于密度的聚类方法,主要包括基于网格的聚类方法和基于核函数的聚类方法。本节探讨的主要问题有: 密度的定义带来的若干问题 对于子空间簇的搜索问题 基于网格的聚类优化 基于网格的聚
阅读全文
摘要:21/7/17 读书笔记 数据挖掘导论 数据、簇、聚类算法自身特性对于聚类问题的影响因素 本节中主要探讨数据、簇、聚类算法本身的一些性质对于聚类问题会有什么样的影响,以及简要介绍一下解决办法,详细的解决办法将会在我们接下来的学习中成为重点内容。 数据特性 高维性:数据的高维性带来的一个最显著的问题就
阅读全文
摘要:21/7/16 读书笔记 数据挖掘导论 簇评估概述 我们需要意识到聚类分析本身是一项试探性的数据分析工作,即我们并不知道什么是最优的聚类结果(数据中甚至并不存在聚类模式),因此对于簇的质量的评估是一个尴尬的过程,我们自以为得出了高质量的簇,但是实际上原数据可能只是随机分布的点。尽管如此,我们依然希望
阅读全文
摘要:21/7/15 读书笔记 数据挖掘导论 聚类分析的基本概念 聚类分析,就是将数据划分为多个具有一定意义的子集(称为簇)。与分类问题不同,聚类分析中“类标签”的概念是需要自行进行挖掘的,即进行聚类前并不知道需要分成哪些类。聚类分析的根本目标是找到一种分组方式,将数据对象分组,并使得同组的对象之间相似性
阅读全文
摘要:21/7/14 读书笔记 数据挖掘导论 频繁子图挖掘 在拓扑结构中进行频繁子图的挖掘需要与以往不同的计算方法,但是整体上还是可以遵从Apriori算法的基本框架,即: 候选产生:通过合并频繁(k-1)子图对得到候选k子图 候选剪枝:丢弃含有非频繁(k-1)子图的候选k子图 支持度计数:统计所有给定图
阅读全文
摘要:21//7/12 读书笔记 数据分析导论 处理分类属性 我们之前所探讨的都是非对称二元属性的关联模式挖掘,即事务数据。在事务数据中,我们将一个项“有”和“无”并不等价看待,我们更重视“有”之间的联系。因此接下来我们对于对称二元属性和多分类属性进行讨论拓展: 对于一个对称二元属性,比如男/女,我们将其
阅读全文
摘要:21/7/12 读书笔记 Online Mobile Micro-Task Allocation in Spatial Crowdsourcing 阅读总结 前提知识 什么是Spatial Crowdsourcing? 众包(Crowdsourcing)是一种商业行为。有别于传统雇佣关系的商业外包,
阅读全文
摘要:SMCSQL:一种用于安全查询的联合数据库 ps:这篇目前还读得不透彻 摘要 在数据信息异常发达的当下,许多需要涉及数据的应用被公众关于隐私安全和安全监管的担忧阻碍。本文中定义了两个主要概念,其一是Private Data Network,PDN,描述一个用于在多方互不信任的参与者之间的联合数据库(
阅读全文
摘要:21/7/10 读书笔记 暂停一下,我简单讲两句,昨天突然生病了,导致这几天身体都比较虚弱,头疼不已,所以工作量会减少一点。另外这周会有论文阅读任务,到时候一并放到读书笔记里 数据挖掘导论 倾斜支持度分布的影响 倾斜支持度分布,指在输入的事务数据中,大多数的项具有较低或中等频率,而少数项具有很高的频
阅读全文
摘要:21/7/9 读书笔记 数据挖掘导论 关联模式的评估 即使我们对支持度和置信度设定合理的阈值,关联分析算法仍然能够产生大量的关联规则。这些规则或许都是有效的,但是却不一定是我们需要的。将代表感兴趣的方向的主观论据引入模式的评价,从而对以量化的方式从主观需求上进行模式的评估。本节中我们探讨如何分析提取
阅读全文
摘要:21/7/8 读书笔记 数据挖掘导论 规则的产生 在昨天我们探讨了如何从事务数据中提取出符合一定支持度的频繁项集,接下来我们需要从这些频繁项集中提取出相应的关联规则。我们将一个频繁项集$A$分为两个非空的不相交的子集$X$和$A-Y$,忽略哪些$\boldsymbol X\to \empty$或者$
阅读全文
摘要:21/7/7 读书笔记 数据挖掘导论 关联规则挖掘简介 以分析购物篮事务为例,我们将这些数据描述为多行事务,每行事务对应一个标识和一个用户购买的商品的集合。我们需要发掘这些集合间的关系,从而找到一些关联性来指导工作。 数据的表现方法:每条事务为一行,每种商品为一列,当该商品在该事务的集合中出现时,记
阅读全文
摘要:21/7/6 读书笔记 数据挖掘导论 组合方法 组合方法是一种聚集多个单分类器来提高预测准确率的方法。其基本思想在于利用训练数据构造一组基分类器,然后根据基分类器的结果进行投票表决。 从预测概率上讲,在基分类器相互独立时,组合方法最大程度降低了预测失误的发生可能。因此我们主要讨论的就是如何降低基分类
阅读全文
摘要:有时间再补上(大概率自己会忘了)
阅读全文
摘要:21/7/4 读书笔记 数据挖掘导论 人工神经网络ANN概念 人工神经网络(Artificial Neural Network)是模拟神经元之间联系的一种结构。对于一个分类问题来讲,每个输入属性都与最终输出间拥有着或多或少的联系,ANN将其描述为神经元间的神经键的不同强度,通过调整各个节点间的联系的
阅读全文
摘要:21/7/3 读书笔记 安全计算导论 优化电路结构 电路的执行开销与电路的规模线性相关,尽可能减少电路的规模是提升电路效率的直觉选择。而在FreeXOR中,我们知道了XOR们对于MPC的重要意义,应用FreeXOR技术能够将XOR门的混淆开销降低到忽略不计的程度,故提升XOR门所占比例对于提升效率来
阅读全文
摘要:21/7/2 读书笔记 安全计算导论 隐私集合求交(Private-Set Intersection,PSI) MPC通用协议虽然能够利用电路解决通用的问题,但是对于一些特殊的问题来说,采用通用的方法将带来不可接受的性能损失。故有很多针对特殊使用场景的协议被提出,其较通用协议的效率更高,但是在安全性
阅读全文
摘要:1/7/21 读书笔记 安全多方计算 不经意传输(OT)的具体实现及拓展协议的简要介绍 在我们之前的学习中,我们将OT描述为一个黑箱的过程,在这个过程中发送者Sed能够告诉接收者Rec特定信息,同时保证Sed不知道特定信息的具体内容,而Rec不知道Sed所持有的其他信息的具体内容。接下来,我们将探讨
阅读全文

浙公网安备 33010602011771号