上一页 1 2 3 4 5 6 7 8 ··· 15 下一页

2020年4月27日

摘要: 用惯了hive的row_number,在Mysql中想要使用分组排序的功能时,却发现不那么简单 —— 貌似不能一个函数解决。 有时候又特别需要使用,怎么办呢?不慌,这也还是有方法的。 首先建立数据表: create table t_variable ( name_people VARCHAR(255 阅读全文
posted @ 2020-04-27 17:26 落日峡谷 阅读(11778) 评论(0) 推荐(2)
摘要: Mysql用户变量的形式是:@var,其可以使用的场合很多,例如新增一列排序值、分组排序等。 下面让我们来探讨一下其部分应用场景。 1. 首先建表,插入数据: create table t_variable ( name_people VARCHAR(255) NOT NULL comment '姓 阅读全文
posted @ 2020-04-27 16:58 落日峡谷 阅读(2732) 评论(0) 推荐(0)

2020年4月26日

摘要: 本篇主要讲述Mysql的curdate、curtime、date_add、date_sub、datediff、timediff等函数。 1. 获取当前的日期时间:now select now(); #获取当前的日期时间 2. 当前日期、时间:curdate、curtime select curdat 阅读全文
posted @ 2020-04-26 22:06 落日峡谷 阅读(4583) 评论(0) 推荐(0)

2020年4月25日

摘要: 用Python实现爬虫的包有很多,可以结合使用,但是目前个人觉得BeautifulSoup至少在看上去会更方便和美观一些。 这里只涉及静态网页的爬取,暂不支持cookie、session等。 Python实现微博热搜榜的爬取 微博热搜地址:https://s.weibo.com/top/summar 阅读全文
posted @ 2020-04-25 21:06 落日峡谷 阅读(4211) 评论(0) 推荐(0)

2020年4月23日

摘要: python的内置函数中,有一对函数:chr 和 ord,有着相反的功能。 1. chr(x):用一个数值作参数,返回一个对应的unicode字符,该参数的有效范围是从0到1114111(16进制时为0x10FFFF),参数可以是十进制,也可以是十六进制。 print(chr(105)) # > i 阅读全文
posted @ 2020-04-23 17:43 落日峡谷 阅读(1936) 评论(0) 推荐(0)

2020年4月22日

摘要: 1. hive建表:create create table if not exists db_name.test_tb(id string, name string, age string, province string, score string)partitioned by (str_date 阅读全文
posted @ 2020-04-22 22:28 落日峡谷 阅读(1632) 评论(0) 推荐(0)

2020年4月17日

摘要: 最近刚好用到距离相关的知识,于是过来回顾记录一下 ~~~ 相信大家都非常熟悉欧拉公式了,从小到大使用的最多的距离公式,比如两点之间的距离、点到直线的距离等。 如今,在机器学习等领域,还有一些其他的公式也应用的非常广,例如曼哈顿距离、余弦距离、马氏距离等。 这些距离部分直观表示如下: 其中,每个距离都 阅读全文
posted @ 2020-04-17 19:43 落日峡谷 阅读(2961) 评论(1) 推荐(0)
摘要: 轮盘赌在遗传算法中应用的很多,效果也不错,而且它的思想很简单直观 —— 物竞天择、适者生存 —— 越强获得的资源越多 —— 在一个圆中,扇形的面积越大,圆中的点落在该扇形的概率越大。 其主要步骤是: 1. 计算每个个体被选中的概率p(在遗传算法中,先通过适应度函数计算适应度,然后根据适应度计算选择概 阅读全文
posted @ 2020-04-17 10:24 落日峡谷 阅读(8064) 评论(0) 推荐(0)

2020年4月15日

摘要: 当你执行大型程序的时候,突然出现exception,会让程序直接停止,这种对服务器自动程序很不友好,而python有着较好的异常捕获机制,不会立刻终止程序。 这个机制就是try-except。 1. 发生异常时可配置备用程序 aa = [1,2,4,5,7,0,2] for ii in aa: tr 阅读全文
posted @ 2020-04-15 22:10 落日峡谷 阅读(4807) 评论(0) 推荐(0)
摘要: 在做数据分析或者统计的时候,经常需要进行数据正态性的检验,因为很多假设都是基于正态分布的基础之上的,例如:T检验。 在Python中,主要有以下检验正态性的方法: 1. scipy.stats.shapiro —— Shapiro-Wilk test,属于专门用来做正态性检验的模块,其原假设:样本数 阅读全文
posted @ 2020-04-15 20:58 落日峡谷 阅读(9052) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 15 下一页

导航