会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
haoziii
博客园
首页
新随笔
联系
订阅
管理
2018年12月17日
hive常用的一些函数
摘要: 1.分组后查询前几列数据 row_number() over (partition by p_day,uid order by time asc) num num = 1 取第一个,num<=10取分区后前十个 2.lag/lead 某一行前/后附近一行的数据 lag(url,1,2001) ove
阅读全文
posted @ 2018-12-17 17:28 haoziii
阅读(156)
评论(0)
推荐(0)
2018年7月6日
python 向上获取目录
摘要: 如果需要导入的模块与正在编写的程序处于同一文件夹内,可以直接import导入。 如果是上级目录: 如果是上级目录的上级目录,增加“/..”(以此类推):
阅读全文
posted @ 2018-07-06 12:11 haoziii
阅读(418)
评论(0)
推荐(0)
2018年6月29日
快速排序算法(python)
摘要: 冒泡和插数的算法对于大量数据效率太低,可以用下面这种方法。
阅读全文
posted @ 2018-06-29 15:35 haoziii
阅读(170)
评论(0)
推荐(0)
2018年6月25日
python os里的一些常用操作
摘要: PATH_FILE_DIRECTORY:文件目录路径 PATH_FILE:文件路径
阅读全文
posted @ 2018-06-25 14:45 haoziii
阅读(130)
评论(0)
推荐(0)
2018年4月13日
pandas常用操作(随时更新)
摘要: 1.时间处理 格式化时间 pd.to_datetime(),其中输入一个时间形式的str或者一列数据都行。如, 生成时间序列 pd.date_range(),其中主要输入的参数,起止时间或序列长度、间隔。如, 时间加减 2.行列操作 删除空行 df.dropna(),可以选择某一列,也可以全选,删掉
阅读全文
posted @ 2018-04-13 11:44 haoziii
阅读(324)
评论(0)
推荐(0)
2018年3月29日
python/django-上传excel文件并用pandas处理
摘要: html文件 <form>中,enctype设置为multipart/form-data,才能完整的传递文件数据。 后端 如果上传的excel文件包含多个sheet,不能这样做。这样只能读到Sheet1,读不到Sheet2. 而要这样:
阅读全文
posted @ 2018-03-29 17:16 haoziii
阅读(3759)
评论(0)
推荐(0)
2018年3月19日
全栈技能图
摘要:
阅读全文
posted @ 2018-03-19 11:50 haoziii
阅读(132)
评论(0)
推荐(0)
2017年7月7日
DataFrame对行列求和并添加新行和列
摘要: 导入模块: 生成DataFrame数据 DataFrame数据预览: 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 2017-07-07 11:19:54
阅读全文
posted @ 2017-07-07 11:21 haoziii
阅读(1255)
评论(0)
推荐(0)
公告