见贤思小齐,知足常乐呵

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

04 2018 档案

摘要:1. 读取和保存 csv文件 2. pandas如何根据字段进行过滤 3. python脚本运行日志保存 4. 排序,生成序列号 5. join操作 6. dataframe 某个字段的类型转化 7. spark 和python的 Data Frame之间互相转换 8. python 对hive读和 阅读全文
posted @ 2018-04-28 16:33 Suckseedeva 阅读(602) 评论(0) 推荐(0)

摘要:建表可以用 map<string,string> 查询时可以按照 aaa[bbb], aaa 是map字段名,bbb是其中的参数名,就可以取到这个参数的值了 当参数名bbb是string时,需要加双引号。例: aaa: {"url":"http://Detail?activityId=7"} aaa 阅读全文
posted @ 2018-04-18 17:07 Suckseedeva 阅读(14266) 评论(0) 推荐(0)

摘要:场景: 在执行insert into或insert overwrite任务时,中途手动将程序停掉,会出现卡死情况(无法提交MapReduce),只能执行查询操作,而drop insert操作均不可操作,无论执行多久,都会保持卡死状态 临时解决办法是……把表名换一个…… 根本原因是:hive表被锁或者 阅读全文
posted @ 2018-04-12 11:28 Suckseedeva 阅读(15148) 评论(0) 推荐(0)

摘要:安装直接按这个步骤了: https://hub.mybinder.org/user/ipython-ipython-in-depth-xj8fraz8/notebooks/binder/Index.ipynb 然后启动notebook: cd /Users/yuanyuan/Documents/Bi 阅读全文
posted @ 2018-04-04 21:39 Suckseedeva 阅读(613) 评论(0) 推荐(0)