摘要: 二分查找,就是对于已排好序的序列,查找某个值,每次都对比中间值,比中间值小,就去序列前面找,否则就去后面找,知道找到为止,否则返回-1。 这里分递归和非递归两种方式组成,其中非递归方式调用的适合更符合日常习惯。 ll=[1,3,5,7,9,11,13,15] #递归方式 def Binary_sea 阅读全文
posted @ 2020-05-18 17:04 小熊_看看 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 快速排序算法,总体来说就是选一个基准值,把小于基准值的分一拨,把大于基准值的分到另一拨,然后递归。 有区别的是,分区算法有差异,最直接的是,选个基准值,定义两个列表(小值分区less和大值分区great),然后挨个比较,小的追加到less,大的追加到great 再有就是,选个基准值,先从右边开始比, 阅读全文
posted @ 2018-03-07 15:08 小熊_看看 阅读(6911) 评论(1) 推荐(0) 编辑
摘要: CNN中减少参数的2两个规则: 1、局部感知。生物学中,视觉皮层的神经元是局部感知信息的,只响应某些特定区域的刺激;图像的空间联系中,局部的像素联系较为紧密,距离较远的像素相关性较弱。 这个对应于算法中卷积核的大小,mnist手写识别在28*28的像素中取patch为5*5。 上图中:左边是全连接, 阅读全文
posted @ 2017-12-15 15:49 小熊_看看 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 1、count函数里写表达式 2、计算时间差值 阅读全文
posted @ 2017-12-07 17:11 小熊_看看 阅读(1142) 评论(0) 推荐(0) 编辑
摘要: exists和in的使用方式: 1、exists是对外表做loop循环,每次loop循环再对内表(子查询)进行查询,那么因为对内表的查询使用的索引(内表效率高,故可用大表),而外表有多大都需要遍历,不可避免(尽量用小表),故内表大的使用exists,可加快效率; 2、in是把外表和内表做hash连接 阅读全文
posted @ 2017-11-30 11:33 小熊_看看 阅读(34822) 评论(0) 推荐(3) 编辑
摘要: 来自官网的Spark Programming Guide,包括个人理解的东西。 这里有一个疑惑点,pyspark是否支持Python内置函数(list、tuple、dictionary相关操作)?思考加搜索查询之后是这么考虑的:要想在多台机器上分布式处理数据,首先需要是spark支持的数据类型(要使 阅读全文
posted @ 2017-10-13 15:10 小熊_看看 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 来自官网DataFrames、DataSets、SQL,即sparkSQL模块。 通过dataframe接口,sparkSQL支持多种数据源的操作。可以把dataframe注册为临时视图,也可以通过关系转换。 1)默认格式是parquet,这是一种columnar(柱状的,按列的)的格式,按列存储( 阅读全文
posted @ 2017-10-11 17:54 小熊_看看 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 来自官网DataFrames、DataSets、SQL,即sparkSQL模块。 spark2.0之前,主要的数据格式是RDD(弹性分布式数据集)。spark2.0之后,使用Dataset代替RDD;再,Datasets在Python中是Datasets[Row],故称之为DataFrame,与Py 阅读全文
posted @ 2017-10-10 16:35 小熊_看看 阅读(2016) 评论(0) 推荐(0) 编辑
摘要: 考虑到要是自己去做一个项目,那么第一步是如何把数据导入到代码中,何种形式呢?是否需要做预处理?官网中给的实例mnist,数据导入都是写好的模块,那么自己的数据呢? 一、从文件中读取数据(CSV文件、二进制文件、图片或其他格式) 读取文件,都需要一个阅读器reader和一个转换解码操作decode,不 阅读全文
posted @ 2017-09-29 14:40 小熊_看看 阅读(3852) 评论(0) 推荐(0) 编辑
摘要: 初识TensorFlow,看了几天教程后有些无聊,决定写些东西,来夯实一下基础,提供些前进动力。 一、Session.run()和Tensor.eval()的区别: 最主要的区别就是可以使用sess.run()一步获取多个Tensor值,而tensor.eval()只能获取当前tensor值。比如: 阅读全文
posted @ 2017-09-28 13:50 小熊_看看 阅读(255) 评论(0) 推荐(0) 编辑