会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
繁星air
给生活加点调味料,细细品味多彩人生
博客园
首页
新随笔
联系
管理
订阅
2020年9月27日
scala模式匹配case多情况
摘要: 我们有时候在模式匹配的时候,多个case会输出同样结果,因此需要在一个case中写入多个情况,减少重复代码 scala模式匹配 def matchTest(x: Int): String = x match { case 1 => "one" case 1.0 => "one" case _ =>
阅读全文
posted @ 2020-09-27 09:47 繁星air
阅读(1205)
评论(0)
推荐(0)
2020年7月13日
将xml文件转为csv文件
摘要: 使用工具 excel 操作步骤 使用excel打开xml文件 提示打开xml文件方式,确认 提示没有引用架构,将基于xml源数据创建架构,确认 数据已转为xlsx表格式 (也可以使用映射,选择需要的字段导入)
阅读全文
posted @ 2020-07-13 16:46 繁星air
阅读(2153)
评论(0)
推荐(0)
根据分隔符将表格文件一行转多行
摘要: 使用工具 excel的Power Query编辑器 操作步骤 导入数据 数据-获取数据-自文件-从工作簿-导入源文件 在导航器中选中sheet,点击转换数据 2. 一行转多行 选中需要转换的列 拆分列,按分隔符 输入分隔符 点击高级选项,选择拆分为行 点击确认 关闭并上载
阅读全文
posted @ 2020-07-13 16:29 繁星air
阅读(463)
评论(0)
推荐(0)
取出wireshack抓包记录的所有user-agent
摘要: 使用工具 wireshack notepad++ excel 操作流程 抓包结果筛选 使用wireshack打开抓包文件 筛选条件设为 http contains "User-Agent" 文件-导出特定分组-displayed即为筛选后结果(可选) 2. 结果转为json文件 文件-导出分组解析结
阅读全文
posted @ 2020-07-13 16:14 繁星air
阅读(749)
评论(0)
推荐(0)
2020年7月7日
spark计算数据中筛选部分的百分比
摘要: df.groupby('name).agg((sum(when('value 5, 1).otherwise(0))/count('value)).as("percent")) 通过自定义计数函数计算筛选部分的数量
阅读全文
posted @ 2020-07-07 17:39 繁星air
阅读(672)
评论(0)
推荐(0)
2019年10月10日
python爬虫——爬取B站用户在线人数
摘要: 国庆期间想要统计一下bilibili网站的在线人数变化,写了一个简单的爬虫程序。主要是对https://api.bilibili.com/x/web-interface/online返回的参数进行分析,获取在线人数对应位置。程序关键点在于requests模块的使用。 具体步骤 1、网页中寻找数据元素
阅读全文
posted @ 2019-10-10 20:37 繁星air
阅读(2084)
评论(0)
推荐(0)
2019年8月27日
spark针对web日志正则匹配
摘要: 针对于web日志做分析是学习spark常用练习项目。此文介绍web日志正则匹配相关小提示。 从网上找了一个access日志案列 218.19.140.242 - - [10/Dec/2010:09:31:17 +0800] "GET /query/trendxml/district/todayret
阅读全文
posted @ 2019-08-27 16:20 繁星air
阅读(728)
评论(0)
推荐(1)
公告