会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
猫七的blog
https://www.cnblogs.com/liuguangshou123/
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
4
5
6
7
8
9
10
下一页
2020年8月10日
hive/UDF/UDAF/UDTF/自定义函数介绍
摘要: 函数/UDF -输入一行记录,输出一行记录。如length 聚集函数/UDAF -输入多行记录,输出一行记录。如sum/count 表生成函数/UDTF 输入一行记录,输出多行记录,如explode 自定义函数 自己用java开发jar包
阅读全文
posted @ 2020-08-10 15:55 猫七的blog
阅读(80)
评论(0)
推荐(0)
2020年8月8日
函数式编程——闭包与装饰器
摘要: 闭包:延伸了作用域的函数。 需求: 假如有个名为avg的函数,它的作用是计算不断增加的系列值的均值; 使用类实现: class Averager(): def __init__(self): self.series=[] def __call__(self,new_value): self.seri
阅读全文
posted @ 2020-08-08 12:35 猫七的blog
阅读(101)
评论(0)
推荐(0)
2020年8月6日
数据分析——关联分析
摘要: 关联分析: 构造一个关联系数矩阵,两个属性的值介于-1到1之间。 大于0,两者为正关联,<0,两者为负关联。 0 无关联,接近1或-1是比较强的关联。 关联规则: 寻找数据集内的属性之间存在的频繁关联,前提 >结论 举例子: 确定哪些产品最常被一起购买。 有这么一波人买早点,买糕点的有4个,买牛奶的
阅读全文
posted @ 2020-08-06 16:23 猫七的blog
阅读(728)
评论(0)
推荐(0)
2020年8月4日
hive基本查询命令
摘要: CREATE TABLE employees( name STRING, salary FLOAT, subordinatates ARRAY<STRING> deductions MAP<STRING,FLOAT> address STRUCT<street:STRING,city:STRING,
阅读全文
posted @ 2020-08-04 10:00 猫七的blog
阅读(17)
评论(0)
推荐(0)
2020年8月3日
hive cli基本交互命令
摘要: HIVE CLI交互式模式: 1.退出hive: exit 2.在hive中运行本地shell命令,不需要退出hive执行操作: !echo 'hello hive' 3.在hive上直接运行dfs命令 dfs -ls /; 查看根目录 dfs -du -h /; 查看根目录空间大小 HIVE CL
阅读全文
posted @ 2020-08-03 16:09 猫七的blog
阅读(336)
评论(0)
推荐(0)
大数据基础知识介绍
摘要: Hadoop:分布式计算平台 HDFS:分布式文件系统 一个hdfs集群包含一个节点,称为NameNode,管理文件系统名称空间,存储metadata(每一个文件包含多少个block,每个block在哪个主机?),规范客户端对文件访问。 DataNode,将数据以块(block)存储在文件中 map
阅读全文
posted @ 2020-08-03 15:12 猫七的blog
阅读(159)
评论(0)
推荐(0)
linux常见命令总结
摘要: linux之快捷键: 1.命令或目录补齐 Tab 2.遍历历史记录 History:命令端显示最近使用过的命令 上移:ctrl+p 下移:ctrl+n 3.光标移动 移动到首部:ctrl+a 移动到尾部:ctrl+e linux之文档编辑: vi和vim的三种模式 命令模式: 移动光标插入模式:编辑
阅读全文
posted @ 2020-08-03 10:49 猫七的blog
阅读(130)
评论(0)
推荐(0)
2020年8月1日
字典
摘要: 字典构造: a=dict(one=1,two=2,three=3) b={'one':1,'two':2.'three'=3} c=dict(zip(['one','two','three'],[1,2,3])) 字典推导: dic=[(86,'China'),(91,'India'),(1,'Un
阅读全文
posted @ 2020-08-01 23:11 猫七的blog
阅读(95)
评论(0)
推荐(0)
2020年7月25日
高阶函数与匿名函数
摘要: 高阶函数: 接受函数为参数,或者把函数作为结果返回的函数是高阶函数。 例子: python的sorted函数 需求:根据单词长度排序。 fruits=['strawberry','fig','apple','cherry','raspberry'] sorted(fruits,key=len) 需求
阅读全文
posted @ 2020-07-25 17:50 猫七的blog
阅读(106)
评论(0)
推荐(0)
2020年7月24日
RNN
摘要: 全连接神经网络: 网络结构是从输入层到隐含层,再到输出层,层与层之间是有连接的,隐含层之间的结点是无连接的。 循环神经网络: 隐含层之间的结点使连接是,隐含层的输入不仅包括输入层的输出,还包括上一时刻隐含层的输出。
阅读全文
posted @ 2020-07-24 15:39 猫七的blog
阅读(124)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
下一页
公告