摘要: 100w行日志 由左到右值分别是 book_id | menu_id | userid 我需要每天每个用户读了多少本书(不重复)多少章节,以及每本书有多少章节被阅读,以及每个章节的pv或者uv 转成这样的结构存储 a、一条条解析,每条更新一遍where menuid 和booid的记录的pv和uv值 阅读全文
posted @ 2019-04-06 00:53 许伟强 阅读(1758) 评论(0) 推荐(0)
摘要: 经常遇到 Linux 权限问题,每次都是 对于数字也是不清晰,今天学习一下做个小笔记。 常见用linux权限: 第0个数字时候表示类型: 1-3位数字代表文件所有者的权限,4-6位数字代表同组用户的权限,7-9数字代表其他用户的权限 c、而具体的权限是由数字来表示的,读取的权限等于4,用r表示;写入 阅读全文
posted @ 2019-03-28 10:43 许伟强 阅读(1382) 评论(0) 推荐(0)
摘要: 要爬取广点通广告平台数据,这平台居然没有提供开发用的API数据接口,登录是QQ登录,很复杂,不好抓取登录接口逻辑 于是就用这个 想录gif的不好录 - 文档: python扩展 selenium的python官方手册: 代码: 很简洁吧,真真实实能解决登录这一块的问题,但是linux上环境的搭建真滴 阅读全文
posted @ 2019-02-26 20:36 许伟强 阅读(1420) 评论(0) 推荐(0)
摘要: 注释规范非常影响自身和别人的编程体验,不管别人怎样吧,自己写的遵守以下规范: 1、文件注释 a.注释开始 /* 不可以 /**,结束 */ 不可以 **/。b.第二行php版本信息,版本信息后一空行。c.注解内容对齐,注解之间不可有空行。d.星号和注释内容中间必须是一个空格。e.保持注解顺序一致@c 阅读全文
posted @ 2019-02-21 17:39 许伟强 阅读(392) 评论(0) 推荐(0)
摘要: 无聊那我的阿里云服务器试试MySQL的读写分离 简书博客: MySQL授权命令grant的使用方法 虽然对很多配置项不是很明白,但是着实配置成功啦 查看当前主库日志: 从库检查复制状: 在主库查看当前链接过来的从库线程: 停止复制、从库启动同步 阅读全文
posted @ 2019-02-15 18:11 许伟强 阅读(161) 评论(0) 推荐(0)
摘要: 自己用一台阿里云服务器的docker配置两台nginx,再用本机的nginx做负载到三台机器上,并测试性能. 1、docker实例化nginx容器两个: 第一个容器 这里的最后面一个参数是镜像ID,当然你可以直接使用 nginx,他会自动拉取最新版镜像创建容器 第二个容器 以上让两个容器分别监听不同 阅读全文
posted @ 2019-02-15 10:10 许伟强 阅读(231) 评论(0) 推荐(0)
摘要: 学习apache的服务器压测 直接贴几个博客: apache在linux上的安装: ab测试报告结果分析: 实际操作中将并发调到1000以上时候ab自动终止了: 所以,解决ab遇到Connection reset by peer错误就自动退出的问题非常简单,加一个-r参数就好。 -r参数就是“在遇到 阅读全文
posted @ 2019-02-15 10:08 许伟强 阅读(319) 评论(0) 推荐(0)
摘要: 正则表达式是很常用也是很好用的东西,它的语法我总是记不住啊,现在通过几个小问题快速记忆,以便于以后查找使用: PHP的正则文档: 文档分为三大块介绍: a、正则语法(元字符等) b、模式修饰符 c、PCRE函数 阅读全文
posted @ 2019-02-12 11:24 许伟强 阅读(2592) 评论(0) 推荐(0)
摘要: 在tcp/ip入门经典知道资源流是一层一层的,现在只讨论http那一层的上下文(header那些): 在自己机器里面脚本如下: 当运行脚本时候输出: 阅读全文
posted @ 2019-02-11 11:38 许伟强 阅读(246) 评论(0) 推荐(0)
摘要: 中文转为unicode 编码: unicode编码解码为中文: 阅读全文
posted @ 2019-02-11 11:31 许伟强 阅读(1868) 评论(0) 推荐(0)