摘要: 准备数据 create table table_origin_data( users varchar(100), item varchar(100), score number(20,4) ); insert into table_origin_data(users,item,score) VALU 阅读全文
posted @ 2023-06-29 18:25 瘦多一点 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 推荐给每个用户和user_id,和他相似的用户所购买过的product 1.排除自己购买过的 2.相似用户的自定义:曾经购买过的2种或者2种以上的相同的商品 输入表:orders 准备数据 create table orders( user_id varchar(100), product_id v 阅读全文
posted @ 2023-06-29 09:44 瘦多一点 阅读(29) 评论(0) 推荐(0) 编辑
摘要: Create table Logs (id int, num int); insert into Logs (id, num) values (1, 1); insert into Logs (id, num) values (2, 1); insert into Logs (id, num) va 阅读全文
posted @ 2023-06-15 16:45 瘦多一点 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 预览数据时报这个错误 表示bijet-license.jar过期 需要更新jar包 打开皕杰报表选择窗口-->首选项 打开皕杰报表选择首选项-->1.通用配置-->A类加载配置 D:\Tools\皕杰\BiosPlatform4Win-V6.1-B20211012\BIOS Studio 在这个路径 阅读全文
posted @ 2022-08-05 17:30 瘦多一点 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 1.本质上相同,都是把Map端数据分类处理后交由Reduce的过程 2.数据流有所区别,MR按map, spill, merge, shuffle, sort, reduce等各阶段逐一实现。Spark基于DAG数据流,可实现更复杂数据流操作(根据宽/窄依赖实现) 3.实现功能上有所区别,MR在ma 阅读全文
posted @ 2022-01-24 18:15 瘦多一点 阅读(728) 评论(0) 推荐(0) 编辑
摘要: integer是Int的包装类, int则是java的一种基本数据类型 integer变量必须实例化后才能使用,而int变量不需要 integer实例是对象的引用,当new一个integer时,实际上是生成一个指针指向此对象;而int则是直接存储数据值 integer的默认值是Null, int的默 阅读全文
posted @ 2021-12-26 21:11 瘦多一点 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 函数在伪递归时可以调用它自己,伪递归不一定是递归调用 比如100 * 99 * 98 * 97 * * * 1 用伪递归的话就不用开太多的栈,比如 100 * 99的结果会存到栈里,再乘98时,再用上一步的结果 去乘98,会得到一个结果,把第二次乘的结果存到栈里,把100 * 98的结果释放掉,以下 阅读全文
posted @ 2021-11-17 23:22 瘦多一点 阅读(61) 评论(0) 推荐(0) 编辑
摘要: window + r输入regedit定位到HYEK_LOCAL_MACHINE\SYSTEM\ControlSet001\Control\Session Manager\Environment这个目录找到path,双击打开把数值数据行复制出来粘贴到系统变量path里 阅读全文
posted @ 2021-10-27 15:31 瘦多一点 阅读(1320) 评论(1) 推荐(0) 编辑
摘要: window + r打开dos命令行输入where python 找到python目录 python的第三方库存放的目录是在python文件夹下的Python36\Lib\site-packages位置 在dos命令行下载python的第三方库,如pandas pip install pandas 阅读全文
posted @ 2021-10-26 09:51 瘦多一点 阅读(172) 评论(0) 推荐(0) 编辑
摘要: CAST('12-03-2010' as date 'dd-mm-yyyy') 阅读全文
posted @ 2021-03-09 16:13 瘦多一点 阅读(494) 评论(0) 推荐(0) 编辑