摘要:
# 第一种方法 # 第二种方法 # 第三种方法 #第四种方法 #第五种方法 阅读全文
摘要:
1、什么是Hadoop? 解释:Hadoop中有3个核心组件: 分布式文件系统:HDFS 实现文件分布式存储在很多的服务器上 分布式运算编程框架:MAPREDUCE 实现在很多机器上分布式并行运算 分布式资源调度平台:YARN 帮用户调度大量的MapReduce程序,并合理分配运算资源 2、HDFS 阅读全文
摘要:
tcpdump简介 tcpdump采用命令行方式对接口的数据包进行筛选抓取,其丰富特性表现在灵活的表达式上。 tcpdump命令格式 tcpdump [ -DenNqvX ] [ -c count ] [ -F file ] [ -i interface ] [ -r file ] [ -s sna 阅读全文
摘要:
Mongodb简介 Mongodb是一个分布式存储的NoSQL数据库,运行稳定、性能高,旨在于为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB特点: 模式自由:可以把不同结构的文档存储在同一个数据库中。 面向集合的存储:适合存储JSON风格格式的形式 完整的索引支持:对任何属性可索引 阅读全文
摘要:
爬虫简介 爬虫:可以把互联网看做是一张大网,爬虫就好像是这张网里的蜘蛛,如果想得到这张网里的资源,就可以将其抓取下来。 简单来说就是请求网站并提取数据的自动化程序。 爬虫的基本流程: 发起请求:通过HTTP库向目标站点发送请求,即发送一个request,请求可以包含额外的headers等信息,等待服 阅读全文
摘要:
二分查找 冒泡排序 思路:首先列表中每两个相邻的数,如果前边的比后面的大,那么交换这两个数。 优化后 java版冒泡排序 选择排序 思路:一趟遍历记录最小的数,放到第一个位置,再一趟遍历记录剩余列表中的最小的值,依次放置 方法1 方法2 插入排序 快排 思路:1、取一个元素p(第一个元素),使元素p 阅读全文
摘要:
自动化只要掌握四步操作:获取元素,操作元素,获取返回结果,断言(返回结果与期望结果是否一致),最后自动出测试报告,元素定位在这四个环节中是至关重要的,如果说按学习精力分配的话,元素定位占70%;操作元素10%,获取返回结果10%;断言10%。如果一个页面上的元素不能被定位到,那后面的操作就无法继续了 阅读全文
摘要:
python基础面试题 1、对字典操作和深浅拷贝的理解 2、字符串格式化:%和format有什么区别 3、可变对象不建议做关键字参数 4、列表切片 5、fib 斐波那契 6、去重 7、合并两个有序列表 8、单例模式:在__new__方法上把类实例绑定到类变量_instance上,如果cls._ins 阅读全文
摘要:
协程简介 协程:是单线程下的并发,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的 协程本质上是一个线程,能够在多个任务之间切换来节省一些IO时间。 协程的优点: 1. 协程的切换开销更小,属于程序级别的切换,操作系统完 阅读全文
摘要:
闭包的引入 闭包:首先必须是嵌套函数,再次内部函数调用外部函数的变量,如下代码 外部函数的返回值是内部函数的函数名 闭包的小小应用: 总结:闭包好处,多次调用函数,不必多次生成外部函数的变量。 装饰器 装饰器的引出,计算程序的执行时间 装饰器的作用:不想修改原来函数的调用方式,但是还想再原来的函数前 阅读全文