11 2018 档案

摘要:faker可以仿造各种各样的信息,可以使用faker去构造一个User-Agent 阅读全文
posted @ 2018-11-28 16:43 时间带着假象流淌 阅读(307) 评论(0) 推荐(0)
摘要:数据库设计三大范式 原文:https://www.cnblogs.com/linjiqin/archive/2012/04/01/2428695.html 为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计 阅读全文
posted @ 2018-11-28 11:14 时间带着假象流淌 阅读(225) 评论(0) 推荐(0)
摘要:1.索引的目的是什么 2.索引的缺点 3.建立索引的原则 4.什么情况下不宜建立索引? 阅读全文
posted @ 2018-11-28 10:28 时间带着假象流淌 阅读(735) 评论(0) 推荐(0)
摘要:1.Innodb日志: 2.Innodb事务: 3.innodb引擎的4大特性: 4.事务是如何通过日志实现的: 阅读全文
posted @ 2018-11-28 09:34 时间带着假象流淌 阅读(693) 评论(0) 推荐(0)
摘要:原文出处:https://www.cnblogs.com/pinard/p/6131423.html 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集 阅读全文
posted @ 2018-11-27 15:34 时间带着假象流淌 阅读(699) 评论(0) 推荐(0)
摘要:Mysql: MySQL 3.22 限制的表大小为4GB。 MyISAM 存储引擎: 最大表尺寸增加到了65536TB(2567 – 1字节)。由于允许的表尺寸更大,MySQL数据库的最大有效表尺寸通常是由操作系统对文件大小的限制决定的,而不是由MySQL内部限制决定的。 InnoDB 存储引擎 I 阅读全文
posted @ 2018-11-27 10:50 时间带着假象流淌 阅读(5466) 评论(0) 推荐(0)
摘要:varchar与char的区别: varchar(50)代表的含义: int(20)中20的含义: 阅读全文
posted @ 2018-11-27 09:37 时间带着假象流淌 阅读(8943) 评论(0) 推荐(0)
摘要:1. myisam与innodb的5点不同 2.innodb引擎的4大特性 3.selectcount(*)哪个更快,为什么? 阅读全文
posted @ 2018-11-27 09:24 时间带着假象流淌 阅读(1519) 评论(0) 推荐(0)
摘要:1、如果A表TID是自增长,并且是连续的,B表的ID为索引 select * from a,b where a.tid = b.id and a.tid>500000 limit 200; 2、如果A表的TID不是连续的,那么就需要使用覆盖索引.TID要么是主键,要么是辅助索引,B表ID也需要有索引 阅读全文
posted @ 2018-11-26 09:55 时间带着假象流淌 阅读(1708) 评论(0) 推荐(0)
摘要:复制表的俩种方式: 第一、只复制表结构到新表 create table 新表 select * from 旧表 where 1=2 或者 create table 新表 like 旧表 第二、复制表结构及数据到新表 create table新表 select * from 旧表 复制表的原理和流程: 阅读全文
posted @ 2018-11-26 09:38 时间带着假象流淌 阅读(485) 评论(0) 推荐(0)
摘要:1.赋值(=),就是创建了对象的一个新的引用,修改其中任意一个变量都会影响到另一个。 2.浅拷贝:创建一个新的对象,但它包含的是对原始对象中包含项的引用(copy模块的copy()函数) 3.深拷贝:创建一个新的对象,并且递归的复制它所包含的对象(修改其中一个,另外一个不会改变)(copy模块的de 阅读全文
posted @ 2018-11-23 20:21 时间带着假象流淌 阅读(1350) 评论(0) 推荐(0)
摘要:*args :当我们不知道要有多少个参数传给函数,或者我们想把一个列表或者tuple存起来以后传给函数。 **kwargs:当我们不知道有多少个关键字参数要传给函数,或者我们想把字典存起来以后传给函数 阅读全文
posted @ 2018-11-23 19:54 时间带着假象流淌 阅读(175) 评论(0) 推荐(0)
摘要:1.使用set函数 2.使用字典函数 阅读全文
posted @ 2018-11-23 11:01 时间带着假象流淌 阅读(794) 评论(0) 推荐(0)
摘要:三个方面:一对象的引用计数机制,二垃圾回收机制,三内存池机制 一、对象的引用计数机制 Python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。 引用计数增加的情况: 1,一个对象分配一个新名称 2,将其放入一个容器中(如列表、元组或字典) 引用计数减少的情况: 1,使用del语句 阅读全文
posted @ 2018-11-23 10:51 时间带着假象流淌 阅读(264) 评论(0) 推荐(0)
摘要:在Python中,lambda的语法是形式: lambda argument_list: expression lambda是Python预留的关键字,argument_list和expression由用户自定义。 这里的argument_list是参数列表。它的结构与Python中函数(funct 阅读全文
posted @ 2018-11-22 22:24 时间带着假象流淌 阅读(1956) 评论(0) 推荐(0)
摘要:filter()函数 是 Python 内置的另一个有用的高阶函数,filter()函数接收一个函数 和一个list,这个函数的作用是对每个元素进行判断,返回 True或 False,filter()根据判断结果自动过滤掉不符合条件的元素,返回由符合条件元素组成的新list。 例如:要从一个list 阅读全文
posted @ 2018-11-22 21:54 时间带着假象流淌 阅读(226) 评论(0) 推荐(0)
摘要:map函数的原型是map(function, iterable, …),它的返回结果是一个列表。 参数function传的是一个函数名,可以是python内置的,也可以是自定义的。 参数iterable传的是一个可以迭代的对象,例如列表,元组,字符串这样的。 这个函数的意思就是将function应用 阅读全文
posted @ 2018-11-22 21:19 时间带着假象流淌 阅读(12879) 评论(0) 推荐(0)
摘要:python在学习过程中吗,由于常常会出现代码运行没报错,但输出的却不是我们想要的结果(图表,列表等等),而出现类似 <filter object at 0x01DB75F0>的情况,比如: 输出: <filter object at 0x01DB75F0> Process finished wit 阅读全文
posted @ 2018-11-22 20:48 时间带着假象流淌 阅读(1617) 评论(0) 推荐(0)
摘要:建立本地仓库: 创建新仓库的指令: git init //把这个目录变成Git可以管理的仓库 git add README.md //文件添加到仓库 git add . //不但可以跟单一文件,还可以跟通配符,更可以跟目录。一个点就把当前目录下所有未追踪的文件全部add了 git commit "f 阅读全文
posted @ 2018-11-21 15:31 时间带着假象流淌 阅读(541) 评论(0) 推荐(0)
摘要:使用用git add . 出现这样错误: fatal: not a git repository (or any of the parent directories): .git 意思是说:.git没有这样的仓库 解决办法 git init 成功解决! 阅读全文
posted @ 2018-11-21 14:31 时间带着假象流淌 阅读(13446) 评论(0) 推荐(0)
摘要:首先,建立一个项目#可在github账户下载完整代码:https://github.com/connordb/scrapy-jiandan2 scrapy startproject jiandan2 打开pycharm,把建立的此项目的文件打开,在中断新建一个爬虫文件 scrapy genspide 阅读全文
posted @ 2018-11-21 09:46 时间带着假象流淌 阅读(1192) 评论(0) 推荐(0)
摘要:什么事触发器: 触发器是一中特殊的存储过程,主要是通过事件来触发而被执行的。它可以强化约束,来维护数据的完整性和一致性,可以跟踪数据库内的操作从而不允许未经许可的更新和变化。可以联级运算。如,某表上的触发器上包含对另一个表的数据操作,而该操作又会导致该表触发器被触发。 什么叫视图?游标是什么? 视图 阅读全文
posted @ 2018-11-19 11:07 时间带着假象流淌 阅读(329) 评论(0) 推荐(0)
摘要:1、锁简介 数据库中的锁是指一种软件机制,用来控制防止某个用户(进程会话)在已经占用了某种数据资源时,其他用户做出影响本用户数据操作或导致数据非完整性和非一致性问题发生的手段。 2、锁的级别 按照锁级别划分,锁可分为共享锁、排他锁。A、共享锁(读锁) 针对同一块数据,多个读操作可以同时进行而不会互相 阅读全文
posted @ 2018-11-19 10:54 时间带着假象流淌 阅读(579) 评论(0) 推荐(0)
摘要:曼哈顿距离只计算水平或垂直距离,有维度的限制。另一方面,欧氏距离可用于任何空间的距离计算问题。 因为,数据点可以存在于任何空间,欧氏距离是更可行的选择。例如:想象一下国际象棋棋盘,象或车所 做的移动是由曼哈顿距离计算的,因为它们是在各自的水平和垂直方向做的运动 阅读全文
posted @ 2018-11-16 14:23 时间带着假象流淌 阅读(3882) 评论(0) 推荐(0)
摘要:1.什么是存储过程?有哪些优缺点? 存储过程是一些预编译的SQL语句(存储过程(Stored Procedure)是一组为了完成某种特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给定参数(如果该存储过程带有参数)来调用执行它)。 1)存储过程是预编译过的,执行效率高。2 阅读全文
posted @ 2018-11-16 10:16 时间带着假象流淌 阅读(355) 评论(0) 推荐(0)
摘要:目前使用Request+正则表达式,爬取猫眼电影top100的例子很多,就不再具体阐述过程! 完整代码github:https://github.com/connordb/Top-100 总结一下,容易出错的问题有: 1.没有加请求头,导致输出没有具体信息! 输出结果为:运行时间: 1.767100 阅读全文
posted @ 2018-11-15 21:47 时间带着假象流淌 阅读(1021) 评论(1) 推荐(0)
摘要:Tensorflow: Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个节点都是计算图上的一个Tensor, 也就是张量,而节点之间的边描述了计算之间的依赖关系(定义时)和数学操作(运算时)。Tensor 阅读全文
posted @ 2018-11-14 16:50 时间带着假象流淌 阅读(239) 评论(0) 推荐(0)
摘要:1.SVM: SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开。 2.SVM为什么采用间隔最大化: 1.当训练数据可分的时候,存在很多超平面可以将数据分开 2.感知机利用误分类最小策 阅读全文
posted @ 2018-11-14 15:51 时间带着假象流淌 阅读(857) 评论(0) 推荐(0)
摘要:有这样的一个表: 如果两个分数相同,则两个分数排名(Rank)相同平分后的下一个名次应该是下一个连续的整数值。 因此,名次之间不应该有“间隔”! 此时有2种方法: 第一: select grade, (select count(distinct grade) from class3 where gr 阅读全文
posted @ 2018-11-14 10:37 时间带着假象流淌 阅读(814) 评论(0) 推荐(0)
摘要:这是表,我们需要操作的就是删除除了学号不同,其它信息都相同的冗余信息 思路:删除表格class3中的冗余的stu_id信息,那么接下来我们应该去筛选哪些stu_id信息是冗余的, 此时我们想到的就是利用group by语句进行分组,即select min(stu_id) from class3 gr 阅读全文
posted @ 2018-11-13 10:28 时间带着假象流淌 阅读(1533) 评论(0) 推荐(0)
摘要:在安装pandas时出现Could not install packages due to an EnvironmentErrorConsider using the `--user` option or check the permissions 此时在install后面加--user即可pip 阅读全文
posted @ 2018-11-08 22:20 时间带着假象流淌 阅读(1077) 评论(0) 推荐(0)
摘要:Logistic回归目的是从特征学习出一个0/1分类模型,而这个模型是将特性的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷。 因此,使用logistic函数(或称作sigmoid函数)将自变量映射到(0,1)上,映射后的值被认为是属于y=1的概率。 阅读全文
posted @ 2018-11-08 16:04 时间带着假象流淌 阅读(3105) 评论(0) 推荐(0)
摘要:什么是R语言编程? R语言是一种用于统计分析和为此目的创建图形的编程语言。不是数据类型,它具有用于计算的数据对象。它用于数据挖掘,回归分析,概率估计等领域,使用其中可用的许多软件包。R语言中的不同数据对象是什么?它们是R语言中的6个数据对象。它们是向量,列表,数组,矩阵,数据框和表。什么使R语言中的 阅读全文
posted @ 2018-11-08 13:35 时间带着假象流淌 阅读(1775) 评论(0) 推荐(0)
摘要:有这样一个成绩表,学生A,B,C,三个人,考试科目分别为C(chinese),M(math),E(english) 求三门课成绩都大于80分的那个学生姓名: 即查询的方法可分为俩种:select name from class3 group by name having min(grade)>80 阅读全文
posted @ 2018-11-08 10:27 时间带着假象流淌 阅读(240) 评论(0) 推荐(0)
摘要:过拟合:当某个模型过度的学习训练数据中的细节和噪音,以至于模型在新的数据上表现很差,我们称过拟合发生了,通俗点就是:模型在训练集中测试的准确度远远高于在测试集中的准确度。 过拟合问题通常发生在变量特征过多的时候。这种情况下训练出的方程总是能很好的拟合训练数据,也就是说,我们的代价函数可能非常接近于0 阅读全文
posted @ 2018-11-07 16:53 时间带着假象流淌 阅读(1218) 评论(0) 推荐(0)
摘要:机器学习最通俗的解释就是让机器学会决策。对于我们人来说,比如去菜市场里挑选芒果,从一堆芒果中拿出一个,根据果皮颜色、大小、软硬等属性或叫做特征,我们就会知道它甜还是不甜。类似的,机器学习就是把这些属性信息量化后输入计算机模型,从而让机器自动判断一个芒果是甜是酸,这实际上就是一个分类问题。 分类和回归 阅读全文
posted @ 2018-11-07 16:33 时间带着假象流淌 阅读(3585) 评论(0) 推荐(0)
摘要:回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值来自预测变量。 在线性回归中,这两个变量通过一个等式相关联,其中这两个变量的指数(幂)是1。数学上,当绘制为图形时,线性关系表示直线。任何变量的指数不等于1的 阅读全文
posted @ 2018-11-07 12:30 时间带着假象流淌 阅读(791) 评论(0) 推荐(0)
摘要:有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据。 防止表中出现重复数据 你可以在MySQL数据表中设置指定的字段为 PRIMARY KEY(主键) 或者 UNIQUE(唯一) 索引来保证数据的唯一性。 让我们尝试一个实例:下表中无索 阅读全文
posted @ 2018-11-06 13:58 时间带着假象流淌 阅读(702) 评论(0) 推荐(0)
摘要:方法一:直接del df['column-name'] 删除sub_grade_列, 输入del df['sub_grade_x'] 方法二:采用drop方法,有下面三种等价的表达式: 1. df= df.drop('column_name', 1) 输入:df,drop('num',axix=1) 阅读全文
posted @ 2018-11-01 15:12 时间带着假象流淌 阅读(94317) 评论(3) 推荐(2)
摘要:读入数据: 数据分组:我们可以看到num这列它的数字在0-20之间变化,我们可以对其增加一列,用来对其分组 df['新增一列的名称']=pd.cut(df['要分组的列'],要分组的区间,新增一列后对应区间分组的名称) 数据的分列: 可以分析数据grade这一列,可以用split函数就行分列 分列以 阅读全文
posted @ 2018-11-01 14:30 时间带着假象流淌 阅读(3104) 评论(0) 推荐(1)
摘要:一. mysqldump工具基本用法,不适用于大数据备份 1. 备份所有数据库: mysqldump -u root -p --all-databases > all_database_sql 2. 备份mysql数据库:mysqldump -u root -p --databases mysql 阅读全文
posted @ 2018-11-01 10:38 时间带着假象流淌 阅读(1794) 评论(0) 推荐(0)
摘要:首先,我们查看自己的数据结构: 导出数据到某一固定文件夹,当然,你最后可以选择保存为CSV或者txt格式都是可以的 mysql> select * from student3 -> into outfile 'C://Users/SHNU/desktop/s3.csv' -> ; 导出数据库: 此时 阅读全文
posted @ 2018-11-01 09:04 时间带着假象流淌 阅读(173) 评论(0) 推荐(0)