会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
cphmvp
简单 简约 It's me
博客园
首页
新随笔
联系
管理
[置顶]
blog_导航
摘要: blog导航 在左下侧:随笔分类 简要做个导航图放到这儿方便大家查阅 直奔爬虫: 点击-> 直奔oracle:点击->
阅读全文
posted @ 2014-10-21 17:27 cphmvp
阅读(172)
评论(0)
推荐(0)
[置顶]
crawler_爬虫开发的曲线图
摘要: 个人总结爬虫的学习曲线,可分为三个阶段,一、 主要在填充基础知识,要熟悉http协议,学习正则表达式,首先基于jdk的基础包的网络功能,.net包下的 httpurlconnction从细节上简单访问网络数据,进一步可以减去一些繁琐的封装功能(请求参数),使用httpClient (4.2.1)版...
阅读全文
posted @ 2013-09-05 22:52 cphmvp
阅读(606)
评论(0)
推荐(0)
2021年4月23日
spark相关问题
摘要: 1.transformation和action的区别 Transformation:代表的是转化操作就是我们的计算流程,返回是RDD[T],可以是一个链式的转化,并且是延迟触发的。 Action:代表是一个具体的行为,返回的值非RDD类型,可以一个object,或者是一个数值,也可以为Unit代表无
阅读全文
posted @ 2021-04-23 09:30 cphmvp
阅读(57)
评论(0)
推荐(0)
2021年4月18日
hive常见问题以及解析
摘要: 1:数据倾斜 理论 hive数据倾斜可能的原因有哪些?主要解决方法有哪些? 原因 1:数据倾斜多由于脏数据/特殊数据 (某一类数据集中) 2:大小表join 3:小文件过多; 解决方案 1:脏数据不参与关联,给特数据数据做随机(建表时) 2:使用mapjoin将小表加入内存。 3:合并小文件,通过s
阅读全文
posted @ 2021-04-18 22:18 cphmvp
阅读(1663)
评论(0)
推荐(0)
2019年8月20日
crawler_app_在Airtest无线模式控制手机
摘要: 无线模式开启: adb tcpip 48887 参考引用: https://www.cnblogs.com/xieqiankun/p/wireless-mode-of-poco.html
阅读全文
posted @ 2019-08-20 10:45 cphmvp
阅读(255)
评论(0)
推荐(0)
2018年4月16日
blockchain_eth客户端安装 & geth使用 &批量转账(二)
摘要: 回顾一下,前面我们讲到启动geth geth --rpc --datadir "F:/geth/Geth/" --light console 2>console.log 这一篇接着上面讲geth的使用,分为4个部分 1、创建账户 2、验证区块是否更新完毕 3、解锁账户 4、转账 此时进入到命令行模式
阅读全文
posted @ 2018-04-16 17:59 cphmvp
阅读(665)
评论(0)
推荐(0)
blockchain_eth客户端安装 & geth使用 &批量转账(一)
摘要: 这里是第一篇,主要讲eth客户端安装 eth官网 https://ethereum.org/ 国内有一个论坛内容挺多的,可以参考 http://ethfans.org/ eth客户端: eth客户端种类很多,go,Java,Python等各种语言写的都有 目前最常用的,官网推荐的有带图形界面的 mi
阅读全文
posted @ 2018-04-16 17:58 cphmvp
阅读(2147)
评论(0)
推荐(0)
2017年11月27日
Matplotlib常用绘图示例
摘要: 一.Matplotlib介绍 Matplotlib是一个Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,折线图、散点图、柱状图、饼图、直方图、子图等。Matplotlib使用NumPy进行数组
阅读全文
posted @ 2017-11-27 16:56 cphmvp
阅读(576)
评论(0)
推荐(0)
2017年11月14日
NPM切换源
摘要: 可以试试切换下你的NPM源。看是否能得到解决。国内的NPM有CNPM和淘宝的NPM源比较稳定。npm源切换和工具可参照站内贴 nrm工具的使用或者是直接用命令切换
阅读全文
posted @ 2017-11-14 16:54 cphmvp
阅读(288)
评论(0)
推荐(0)
2017年11月6日
python_matplotlib cannot import name _thread on mac
摘要: 最后的2行错误信息是 1 2 发现是six出现了问题,用pip更新一下six,问题并没有解决,原因是并没有真正更新six的文件。在python下输入: 1 2 /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/py
阅读全文
posted @ 2017-11-06 10:57 cphmvp
阅读(540)
评论(0)
推荐(0)
2017年8月3日
jupyter_远程安装&问题
摘要: 安装: https://jupyter.readthedocs.io/en/latest/install.html#install 配置 Ubuntu 16.04 LTS 配置 Jupyter notebook 为服务器 原材料: Ubuntu 16.04 LTS 64bit 已经配置好 IPyth
阅读全文
posted @ 2017-08-03 19:35 cphmvp
阅读(667)
评论(0)
推荐(0)
2017年6月23日
解决MacOS下readlink: illegal option -- f
摘要: 时间: 2017.03.21 分类: 【操作系统】 评论 Mac下的readlink没有-f参数,诸如screenfetch又会去调用readlink -f,于是每次都会出现: readlink: illegal option -- f usage: readlink [-n] [file ...]
阅读全文
posted @ 2017-06-23 17:19 cphmvp
阅读(1352)
评论(0)
推荐(0)
下一页
公告
爬虫在线测试小工具:
http://tool.haoshuju.cn/