会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
网站更新内容:请访问: https://bigdata.ministep.cn/
bigdata.ministep.cn
网站已迁移到:https://bigdata.ministep.cn/
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
19
20
21
22
23
24
25
26
27
···
73
下一页
2022年7月4日
OLAP 进阶:Excel 可直接分析的大数据语义层
摘要: 如何在异构化、割裂化严重的大数据平台上解决数据孤岛的挑战,并支持丰富的 OLAP 分析能力和进阶分析功能,如可计算度量、多对多关系?背后的实现原理和技术难点是什么,以至于用户可以简单地通过 Excel 感受到极其平民化的多维分析体验?本次分享的主要内容包括: 大数据时代下的分析挑战 传统 OLAP
阅读全文
posted @ 2022-07-04 11:28 ministep88
阅读(293)
评论(0)
推荐(0)
2022年6月29日
最强最全的数仓建设规范指南,肝完后卷哭他们!
摘要: 本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段命名规范等! 一、数据模型架构原则 1、数仓分层原则 优秀可靠的数仓体系,往往需要清晰的数据分层结构,即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长。那么问题来了,一直在讲
阅读全文
posted @ 2022-06-29 17:49 ministep88
阅读(410)
评论(0)
推荐(0)
HBase+Elasticsearch,百亿级数据中心架构设计实践
摘要: 一、业务背景 今天给大家分享一下我们在公司里,面向多个业务团队设计的数据中心架构,他是如何一步一步的从多业务团队数据现状分析开始,然后逐步的演化设计出一个数据中心架构来的,希望能帮助大家对现在很流行的数据中心这个概念构建起来系统化的认知。 首先跟大家说一下在没有数据中心的时候,公司里的各个业务团队是
阅读全文
posted @ 2022-06-29 17:30 ministep88
阅读(783)
评论(0)
推荐(0)
MacOS提示“打不开xxx,因为Apple无法检查其是否包含恶意软件...”
摘要: [摘要] 当你的mac提示“打不开xxx,因为Apple无法检查其是否包含恶意软件...”时,一般是由于你下载了非App […] 当你的mac提示“打不开xxx,因为Apple无法检查其是否包含恶意软件...”时,一般是由于你下载了非App Store且不受苹果信任的开发者的软件,怎么解决呢? 其实
阅读全文
posted @ 2022-06-29 15:18 ministep88
阅读(2633)
评论(0)
推荐(0)
支持云端同步的图片素材管理软件, Pixcall
摘要: 图片管理软件,先后也使用过 Eagle 、Billfish 等软件,就迫不及待进行了测试。 文章尾部赠送 10 个邀请码,问开发者要的。 初次使用 Pixcall 软件,它的界面风格,给我的感觉是很舒服那种,你说不出哪里优化的很好,也说不出它的配色多么的优秀,但是感觉就是舒服,就这么简单。 一、视觉
阅读全文
posted @ 2022-06-29 15:17 ministep88
阅读(641)
评论(0)
推荐(0)
2022年6月21日
微信文章阅读点赞的获取
摘要: 参考: [记一次微信公众号爬虫的经历(微信文章阅读点赞的获取) | Wnma's Blogs](https://wnma3mz.github.io/hexo_blog/2017/11/18/%E8%AE%B0%E4%B8%80%E6%AC%A1%E5%BE%AE%E4%BF%A1%E5%85%AC%
阅读全文
posted @ 2022-06-21 22:22 ministep88
阅读(1282)
评论(0)
推荐(0)
2022年6月20日
pandas多列变一列或者多行变一行
摘要: pandas多列变一列或者多行变一行 合并重复的行 queryset = read_query_sql_cloud(query_sql) df = pd.DataFrame(queryset) def formatRecords(g): result = [] item=g.to_dict() re
阅读全文
posted @ 2022-06-20 20:47 ministep88
阅读(396)
评论(0)
推荐(0)
scrapy多个爬虫并行运行
摘要: 有的时候需要在scrapy工程里面运行多个爬虫,试用了网上两种方法。 运行环境:scrapy:2.3.0 + python3.8 第一种: # coding:utf-8 from scrapy import cmdline cmdline.execute("scrapy crawl spider1"
阅读全文
posted @ 2022-06-20 19:20 ministep88
阅读(370)
评论(0)
推荐(0)
2022年6月19日
windows查看某目录所有子目录大小的方法
摘要: 参考:[(36条消息) windows查看某目录所有子目录大小的方法_YANGYYID的博客-CSDN博客_windows查看目录大小](https://blog.csdn.net/YANGYYID/article/details/102658062) 有以下两个方法查看所有子目录大小,还可以手动清
阅读全文
posted @ 2022-06-19 15:05 ministep88
阅读(4802)
评论(0)
推荐(0)
使用7zip备份文件夹并ignore部分文件
摘要: cmd窗口操作 "C:\Program Files\7-Zip\7z.exe" a G:\backups\windows_localhost\backup_p11.zip D:\code\python -xr!*\venv\* -xr!*\.git\* -xr!*\.ipynb_checkpoint
阅读全文
posted @ 2022-06-19 13:51 ministep88
阅读(99)
评论(1)
推荐(0)
上一页
1
···
19
20
21
22
23
24
25
26
27
···
73
下一页
公告
网站更新内容:请访问:https://bigdata.ministep.cn/