摘要: 我们有时候在模式匹配的时候,多个case会输出同样结果,因此需要在一个case中写入多个情况,减少重复代码 scala模式匹配 def matchTest(x: Int): String = x match { case 1 => "one" case 1.0 => "one" case _ => 阅读全文
posted @ 2020-09-27 09:47 繁星air 阅读(1205) 评论(0) 推荐(0)
摘要: 使用工具 excel 操作步骤 使用excel打开xml文件 提示打开xml文件方式,确认 提示没有引用架构,将基于xml源数据创建架构,确认 数据已转为xlsx表格式 (也可以使用映射,选择需要的字段导入) 阅读全文
posted @ 2020-07-13 16:46 繁星air 阅读(2153) 评论(0) 推荐(0)
摘要: 使用工具 excel的Power Query编辑器 操作步骤 导入数据 数据-获取数据-自文件-从工作簿-导入源文件 在导航器中选中sheet,点击转换数据 2. 一行转多行 选中需要转换的列 拆分列,按分隔符 输入分隔符 点击高级选项,选择拆分为行 点击确认 关闭并上载 阅读全文
posted @ 2020-07-13 16:29 繁星air 阅读(463) 评论(0) 推荐(0)
摘要: 使用工具 wireshack notepad++ excel 操作流程 抓包结果筛选 使用wireshack打开抓包文件 筛选条件设为 http contains "User-Agent" 文件-导出特定分组-displayed即为筛选后结果(可选) 2. 结果转为json文件 文件-导出分组解析结 阅读全文
posted @ 2020-07-13 16:14 繁星air 阅读(749) 评论(0) 推荐(0)
摘要: df.groupby('name).agg((sum(when('value 5, 1).otherwise(0))/count('value)).as("percent")) 通过自定义计数函数计算筛选部分的数量 阅读全文
posted @ 2020-07-07 17:39 繁星air 阅读(672) 评论(0) 推荐(0)
摘要: 国庆期间想要统计一下bilibili网站的在线人数变化,写了一个简单的爬虫程序。主要是对https://api.bilibili.com/x/web-interface/online返回的参数进行分析,获取在线人数对应位置。程序关键点在于requests模块的使用。 具体步骤 1、网页中寻找数据元素 阅读全文
posted @ 2019-10-10 20:37 繁星air 阅读(2084) 评论(0) 推荐(0)
摘要: 针对于web日志做分析是学习spark常用练习项目。此文介绍web日志正则匹配相关小提示。 从网上找了一个access日志案列 218.19.140.242 - - [10/Dec/2010:09:31:17 +0800] "GET /query/trendxml/district/todayret 阅读全文
posted @ 2019-08-27 16:20 繁星air 阅读(728) 评论(0) 推荐(1)