随笔分类 - data
摘要:【数据技巧1】手把手教你用容器实现下钻 https://mp.weixin.qq.com/s/l0iIUi6Jl9UuXxgQoXXM-A 数据分析工作中,尤其在做数据汇报时,难免需要做多层级的精准报告,仪表板里的数据下钻就显得格外重要。以往,我们习惯通过筛选去下钻、或通过视图去筛选,你有没有想到其
阅读全文
摘要:识别:访问者来源、会话、访问者 HTTP 安全套接字层SSL :包含访问者的登录活动和加密密钥的交换 动态网页:在返回给访问者的每个网页中隐藏一个会话ID的字段来维护访问者状态
阅读全文
摘要:不可 Kimball维度建模 维度建模,而非数据建模 文本型度量是对某些事情的描述。虽然以文本方式度量事实是可行的,但是应将其放入维度表中,除非对事实表的每个行,其文本是唯一的。 数据仓库的好坏直接取决于维度属性的设置:DW/BI环境的分析能力直接取决于维度属性的质量和深度。 【简单:易理解 性能好
阅读全文
摘要:全依赖 Designs that Violate 1NF CustomerCustomer ID First Name Surname Telephone Number123 Pooja Singh 555-861-2025, 192-122-1111456 San Zhang (555) 403-
阅读全文
摘要:http://cis.stvincent.edu/html/tutorials/swd/btree/btree.html Introduction A B-tree is a specialized multiway tree designed especially for use on disk.
阅读全文
摘要:SQL processing uses the following main components to execute a SQL query: The Parser checks both syntax and semantic analysis. The Optimizer uses cost
阅读全文
摘要:An Overview of Query Optimization in Relational Systems
阅读全文
摘要:RocksDB RocksDB is a high performance[1][2][3][4][5] embedded database for key-value data. It is a fork of LevelDB which was then optimized to exploit
阅读全文
摘要:Dynamic programming https://people.eecs.berkeley.edu/~vazirani/algorithms/chap6.pdf
阅读全文
摘要:spark 行动算子 TensorFlow
阅读全文
摘要:连接串 从节点列表本地缓存主节点对未分配的任务,随机分配给从节点(不合理??)从节点保存一个本地待执行任务列表单独的线程对节点已分配任务进行循环 进程p为了获锁——>创建节点znode_/lock且其为临时节点:/lock 临时节点 避免该znode崩溃而锁无法释放 https://zookeepe
阅读全文
摘要:数据位于hdfs路径下 load data into Table t1 load 执行的是复制文件的操作 create Table partitioned by () 创建了分区目录
阅读全文
摘要:re.compile('"ssid":"[^"]*"}',re.MULTILINE) re.compile('"ssid":"[^"]*"}',re.MULTILINE)
阅读全文