会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
starqiu
博客园
首页
新随笔
联系
订阅
管理
2024年4月12日
快速下载指定版本的vscode插件
摘要: 背景 vscode不是最新版本,且所在网络不能联网 插件市场只提供最新插件下载,插件历史只提供最近五次历史且加载很慢 新版本的插件一般支持的是新版本的vscode,插件对旧版本的兼容性不能保证 问题 如何快速定位需要下载的插件版本并下载该版本的插件呢? 解决方案 如何快速定位需要下载的插件版本? 自
阅读全文
posted @ 2024-04-12 14:59 starqiu
阅读(1826)
评论(0)
推荐(0)
2020年3月4日
利用动态资源分配优化Spark应用资源利用率
摘要: 背景 在某地市开展项目的时候,发现数据采集,数据探索,预处理,数据统计,训练预测都需要很多资源,现场资源不够用。 目前该项目的资源3台旧的服务器,每台的资源 内存为128G,cores 为24 (core可暂时忽略,以下仅考虑内存即可) 。 案例分析 我们先对任务分别分析,然后分类。 数据采集基于D
阅读全文
posted @ 2020-03-04 14:12 starqiu
阅读(1534)
评论(0)
推荐(0)
2020年2月25日
一条Sql的Spark之旅
摘要: 背景 SQL作为一门标准的、通用的、简单的DSL,在大数据分析中有着越来越重要的地位;Spark在批处理引擎领域当前也是处于绝对的地位,而Spark2.0中的SparkSQL也支持ANSI SQL 2003标准。因此SparkSQL在大数据分析中的地位不言而喻。 本文将通过分析一条SQL在Spa
阅读全文
posted @ 2020-02-25 16:11 starqiu
阅读(920)
评论(0)
推荐(0)
2020年1月2日
使用SparkSql进行表的分析与统计
摘要: 背景 我们的数据挖掘平台对数据统计有比较迫切的需求,而Spark本身对数据统计已经做了一些工作,希望梳理一下Spark已经支持的数据统计功能,后期再进行扩展。 准备数据 在参考文献6中下载 "鸢尾花数据" ,此处格式为iris.data格式, 先将data后缀改为csv后缀(不影响使用,只是为了
阅读全文
posted @ 2020-01-02 13:49 starqiu
阅读(4552)
评论(0)
推荐(0)
公告