10 2018 档案
摘要:DDL(Data Definition Languages)数据定义语言,常用关键字包括create、drop、alter等 DML(Data Manipulation Languages)数据操纵语句,常用的关键字包括insert、delete、update等 1.插入记录 DCL(Data Co
阅读全文
摘要:from urllib import request """ 使用代理 """ url = "http://httpbin.org/ip" #设置代理的服务器的ip和端口,以及协议类型 handler = request.ProxyHandler({"http":"121.232.194.71:9000"}) opener = request.build_opener(handler) r...
阅读全文
摘要:Spark是什么? Spark是一个用来实现快速而通用的集群计算的平台。扩展了广泛使用的MapReduce计算模型,而且高效地支持更多的计算模式,包括交互式查询和流处理。在处理大规模数据集的时候,速度是非常重要的。Spark的一个重要特点就是能够在内存中计算,因而更快。即使在磁盘上进行的复杂计算,S
阅读全文
摘要:Apache spark2.1.0 编译 hadoop-2.6-cdh5.11.2 的对应版本 搞了两天,终于把spark编译成功了,把编译过程记录一下 编译失败的坑: 1)linux内存不足,maven编译过程中内存溢出 2)找不到cloudera仓库 3)报各种错误 考虑到maven下载可能会被
阅读全文
摘要:在Java中,如果要实现多线程,必须依靠一个线程的主体类(就好比主类的概念一样,表示的是一个线程的主类)。 但是这个线程的主体类在定义时也需要一些特殊的要求,即类需要继承Thread类或实现Runnable(Callable)接口来完成定义 多线程的实现 继承Thread类,实现多线程 实现Runn
阅读全文

浙公网安备 33010602011771号