Fork me on GitHub

python面试笔试题,你都会了吗?快来复习

1、一行代码实现1--100之和

利用sum()函数求和

>>> sum(range(0,101))
5050

 

2、如何在一个函数内部修改全局变量

利用global 修改全局变量

a = 5
def fn():
    global a
    a = 4
fn()
print(a)

3、列出5个python标准库

os:提供了不少与操作系统相关联的函数

sys:   通常用于命令行参数

re:   正则匹配

math: 数学运算

datetime:处理日期时间

 

4、字典如何删除键和合并两个字典

del和update方法

>>> dic = {"name":"zs", "age":18}
>>> del dic["name"]
>>> dic
{'age': 18}
>>> dic2 = {"name":"ls"}
>>> dic.update(dic2)
>>> dic
{'age': 18, 'name': 'ls'}

5、谈下python的GIL

GIL 是python的全局解释器锁,同一进程中假如有多个线程运行,一个线程在运行python程序的时候会霸占python解释器(加了一把锁即GIL),使该进程内的其他线程无法运行,等该线程运行完后其他线程才能运行。如果线程运行过程中遇到耗时操作,则解释器锁解开,使其他线程运行。所以在多线程中,线程的运行仍是有先后顺序的,并不是同时进行。

多进程中因为每个进程都能被系统分配资源,相当于每个进程有了一个python解释器,所以多进程可以实现多个进程的同时运行,缺点是进程系统资源开销大

 

6、python实现列表去重的方法

先通过集合去重,在转列表

 

 

7、fun(*args,**kwargs)中的*args,**kwargs什么意思?

 

 

8、python2和python3的range(100)的区别

python2返回列表,python3返回迭代器,节约内存

 

9、一句话解释什么样的语言能够用装饰器?

函数可以作为参数传递的语言,可以使用装饰器

 

10、python内建数据类型有哪些

整型--int

布尔型--bool

字符串--str

列表--list

元组--tuple

字典--dict

 

11、简述面向对象中__new__和__init__区别

__init__是初始化方法,创建对象后,就立刻被默认调用了,可接收参数,如图

 

1、__new__至少要有一个参数cls,代表当前类,此参数在实例化时由Python解释器自动识别

2、__new__必须要有返回值,返回实例化出来的实例,这点在自己实现__new__时要特别注意,可以return父类(通过super(当前类名, cls))__new__出来的实例,或者直接是object的__new__出来的实例

3、__init__有一个参数self,就是这个__new__返回的实例,__init__在__new__的基础上可以完成一些其它初始化的动作,__init__不需要返回值

4、如果__new__创建的是当前类的实例,会自动调用__init__函数,通过return语句里面调用的__new__函数的第一个参数是cls来保证是当前类实例,如果是其他类的类名,;那么实际创建返回的就是其他类的实例,其实就不会调用当前类的__init__函数,也不会调用其他类的__init__函数。

 

 

12、简述with方法打开处理文件帮我我们做了什么?

打开文件在进行读写的时候可能会出现一些异常状况,如果按照常规的f.open

写法,我们需要try,except,finally,做异常判断,并且文件最终不管遇到什么情况,都要执行finally f.close()关闭文件,with方法帮我们实现了finally中f.close

(当然还有其他自定义功能,有兴趣可以研究with方法源码)

 

13、列表[1,2,3,4,5],请使用map()函数输出[1,4,9,16,25],并使用列表推导式提取出大于10的数,最终输出[16,25]

map()函数第一个参数是fun,第二个参数是一般是list,第三个参数可以写list,也可以不写,根据需求

 

 

14、python中生成随机整数、随机小数、0--1之间小数方法

随机整数:random.randint(a,b),生成区间内的整数

随机小数:习惯用numpy库,利用np.random.randn(5)生成5个随机小数

0-1随机小数:random.random(),括号中不传参

import random
import numpy
result = random.randint(10, 20)
res = numpy.random.randn(5)
ret = random.random()
print("正整数",result)
print("5个随机小数",res)
print("0-1随机小数",ret)

打印:
正整数 11
5个随机小数 [ 0.98433549  1.2379769  -1.73281501 -0.64436276 -1.11252797]
0-1随机小数 0.7430385844822477

15、避免转义给字符串加哪个字母表示原始字符串?

r , 表示需要原始字符串,不转义特殊字符

 

16、<div class="nam">中国</div>,用正则匹配出标签里面的内容(“中国”),其中class的类名是不确定的

import re
str = '<div class="man">中国</div>'
res = re.findall(r'<div class=".*">(.*?)</div>', str) #.代表可有可无;*代表任意字符,满足类名可有变化
                                   #(.*?)提取文本
print(res)

打印:
['中国']

17、python中断言方法举例

assert()方法,断言成功,则程序继续执行,断言失败,则程序报错

a = 3
assert (a > 1)
print("断言成功,程序继续往下执行")
b = 4
assert (b > 7)
print("断言失败,程序报错")

打印:
Traceback (most recent call last):
断言成功,程序继续往下执行
  File "C:/Users/Administrator/PycharmProjects/myFirstpro/chapter7并发编程/并发编程回顾/线程.py", line 73, in <module>
    assert (b > 7)
AssertionError

 

18、数据表student有id,name,score,city字段,其中name中的名字可有重复,需要消除重复行,请写sql语句

select  distinct  name  from  student

 

19、10个Linux常用命令

ls  pwd  cd  touch  rm  mkdir  tree  cp  mv  cat  more  grep  echo 

 

20、python2和python3区别?列举5个

1、Python3 使用 print 必须要以小括号包裹打印内容,比如 print('hi')

Python2 既可以使用带小括号的方式,也可以使用一个空格来分隔打印内容,比如 print 'hi'

2、python2 range(1,10)返回列表,python3中返回迭代器,节约内存

3、python2中使用ascii编码,python中使用utf-8编码

4、python2中unicode表示字符串序列,str表示字节序列

      python3中str表示字符串序列,byte表示字节序列

5、python2中为正常显示中文,引入coding声明,python3中不需要

6、python2中是raw_input()函数,python3中是input()函数

 

21、列出python中可变数据类型和不可变数据类型,并简述原理

不可变数据类型:数值型、字符串型string和元组tuple

不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象(一个地址),如下图用id()方法可以打印对象的id

 

可变数据类型:列表list和字典dict;

允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。

 

 

22、s = "ajldjlajfdljfddd",去重并从小到大排序输出"adfjl"

set去重,去重转成list,利用sort方法排序,reeverse=False是从小到大排

list是不 变数据类型,s.sort时候没有返回值,所以注释的代码写法不正确

 

23、用lambda函数实现两个数相乘

 

 

24、字典根据键从小到大排序

dict={"name":"zs","age":18,"city":"深圳","tel":"1362626627"}

 

25、利用collections库的Counter方法统计字符串每个单词出现的次数"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"

 

26、字符串a = "not 404 found 张三 99 深圳",每个词中间是空格,用正则过滤掉英文和数字,最终输出"张三  深圳"

顺便贴上匹配小数的代码,虽然能匹配,但是健壮性有待进一步确认

 

 

27、filter方法求出列表所有奇数并构造新列表,a =  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判,然后返回 True 或 False,最后将返回 True 的元素放到新列表

 

28、列表推导式求列表所有奇数并构造新列表,a =  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

 

 

29、正则re.complie作用

re.compile是将正则表达式编译成一个对象,加快速度,并重复使用

 

30、a=(1,)b=(1),c=("1") 分别是什么类型的数据?

 

 

31、两个列表[1,5,7,9]和[2,2,6,8]合并为[1,2,2,3,6,7,8,9]

extend可以将另一个集合中的元素逐一添加到列表中,区别于append整体添加

 

 

32、用python删除文件和用linux命令删除文件方法

python:os.remove(文件名)

linux:       rm  文件名

 

33、log日志中,我们需要用时间戳记录error,warning等的发生时间,请用datetime模块打印当前时间戳 “2018-04-01 11:38:54

顺便把星期的代码也贴上了

 

34、数据库优化查询方法

外键、索引、联合查询、选择特定字段等等

 

35、请列出你会的任意一种统计图(条形图、折线图等)绘制的开源库,第三方也行

pychart、matplotlib

 

36、写一段自定义异常代码

自定义异常用raise抛出异常

 

 

37、正则表达式匹配中,(.*)和(.*?)匹配区别?

(.*)是贪婪匹配,会把满足正则的尽可能多的往后匹配

(.*?)是非贪婪匹配,会把满足正则的尽可能少匹配

 

 

38、简述Django的orm

ORM,全拼Object-Relation Mapping,意为对象-关系映射

实现了数据模型与数据库的解耦,通过简单的配置就可以轻松更换数据库,而不需要修改代码只需要面向对象编程,orm操作本质上会根据对接的数据库引擎,翻译成对应的sql语句,所有使用Django开发的项目无需关心程序底层使用的是MySQL、Oracle、sqlite....,如果数据库迁移,只需要更换Django的数据库引擎即可

 

39、[[1,2],[3,4],[5,6]]一行代码展开该列表,得出[1,2,3,4,5,6]

列表推导式的骚操作

运行过程:for i in a ,每个i是【1,2】,【3,4】,【5,6】,for j in i,每个j就是1,2,3,4,5,6,合并后就是结果

 

 

还有更骚的方法,将列表转成numpy矩阵,通过numpy的flatten()方法,代码永远是只有更骚,没有最骚

 

 

40、x="abc",y="def",z=["d","e","f"],分别求出x.join(y)和x.join(z)返回的结果

join()括号里面的是可迭代对象,x插入可迭代对象中间,形成字符串,结果一致,有没有突然感觉字符串的常见操作都不会玩了

顺便建议大家学下os.path.join()方法,拼接路径经常用到,也用到了join,和字符串操作中的join有什么区别,该问题大家可以查阅相关文档,后期会有答案

 

 

41、举例说明异常模块中try except else finally的相关意义

try..except..else没有捕获到异常,执行else语句

try..except..finally不管是否捕获到异常,都执行finally语句

42、python中交换两个数值

 

43、举例说明zip()函数用法

zip()函数在运算时,会以一个或多个序列(可迭代对象)做为参数,返回一个元组的列表。同时将这些序列中并排的元素配对。

zip()参数可以接受任何类型的序列,同时也可以有两个以上的参数;当传入参数的长度不同时,zip能自动以最短序列长度为准进行截取,获得元组。

 

 

44、a="张明 98分",用re.sub,将98替换为100

 

45、写5条常用sql语句

show databases;

show tables;

desc 表名;

select * from 表名;

delete from 表名 where id=5;

update students set gender=0,hometown="北京" where id=5

 

46、a="hello"和b="你好"编码成bytes类型

 

 

47、[1,2,3]+[4,5,6]的结果是多少?

两个列表相加,等价于extend

 

 

48、提高python运行效率的方法

1、使用生成器,因为可以节约大量内存

2、循环代码优化,避免过多重复代码的执行

3、核心模块用Cython  PyPy等,提高效率

4、多进程、多线程、协程

5、多个if elif条件判断,可以把最有可能先发生的条件放到前面写,这样可以减少程序判断的次数,提高效率

 

49、简述mysql和redis区别

redis: 内存型非关系数据库,数据保存在内存中,速度快

mysql:关系型数据库,数据保存在磁盘中,检索的话,会有一定的Io操作,访问速度相对慢

 

50、遇到bug如何处理

1、细节上的错误,通过print()打印,能执行到print()说明一般上面的代码没有问题,分段检测程序是否有问题,如果是js的话可以alert或console.log

2、如果涉及一些第三方框架,会去查官方文档或者一些技术博客。

3、对于bug的管理与归类总结,一般测试将测试出的bug用teambin等bug管理工具进行记录,然后我们会一条一条进行修改,修改的过程也是理解业务逻辑和提高自己编程逻辑缜密性的方法,我也都会收藏做一些笔记记录。

4、导包问题、城市定位多音字造成的显示错误问题

 

51、正则匹配,匹配日期2018-03-20

url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462'

仍有同学问正则,其实匹配并不难,提取一段特征语句,用(.*?)匹配即可

 

 

52、list=[2,3,5,4,9,6],从小到大排序,不许用sort,输出[2,3,4,5,6,9]

利用min()方法求出最小值,原列表删除最小值,新列表加入最小值,递归调用获取最小值的函数,反复操作

 

 

53、写一个单列模式

因为创建对象时__new__方法执行,并且必须return 返回实例化出来的对象所cls.__instance是否存在,不存在的话就创建对象,存在的话就返回该对象,来保证只有一个实例对象存在(单列),打印ID,值一样,说明对象同一个

 

54、保留两位小数

题目本身只有a="%.03f"%1.3335,让计算a的结果,为了扩充保留小数的思路,提供round方法(数值,保留位数)

 

 

55、求三个方法打印结果

fn("one",1)直接将键值对传给字典;

fn("two",2)因为字典在内存中是可变数据类型,所以指向同一个地址,传了新的额参数后,会相当于给字典增加键值对

fn("three",3,{})因为传了一个新字典,所以不再是原先默认参数的字典

 

 

56、列出常见的状态码和意义

200 OK 

请求正常处理完毕

204 No Content 

请求成功处理,没有实体的主体返回

206 Partial Content 

GET范围请求已成功处理

301 Moved Permanently 

永久重定向,资源已永久分配新URI

302 Found 

临时重定向,资源已临时分配新URI

303 See Other 

临时重定向,期望使用GET定向获取

304 Not Modified 

发送的附带条件请求未满足

307 Temporary Redirect 

临时重定向,POST不会变成GET

400 Bad Request 

请求报文语法错误或参数错误

401 Unauthorized 

需要通过HTTP认证,或认证失败

403 Forbidden 

请求资源被拒绝

404 Not Found 

无法找到请求资源(服务器无理由拒绝)

500 Internal Server Error 

服务器故障或Web应用故障

503 Service Unavailable 

服务器超负载或停机维护

 

57、分别从前端、后端、数据库阐述web项目的性能优化

该题目网上有很多方法,我不想截图网上的长串文字,看的头疼,按我自己的理解说几点

前端优化:

1、减少http请求、例如制作精灵图

2、html和CSS放在页面上部,javascript放在页面下面,因为js加载比HTML和Css加载慢,所以要优先加载html和css,以防页面显示不全,性能差,也影响用户体验差

后端优化:

1、缓存存储读写次数高,变化少的数据,比如网站首页的信息、商品的信息等。应用程序读取数据时,一般是先从缓存中读取,如果读取不到或数据已失效,再访问磁盘数据库,并将数据再次写入缓存。

2、异步方式,如果有耗时操作,可以采用异步,比如celery

3、代码优化,避免循环和判断次数太多,如果多个if else判断,优先判断最有可能先发生的情况

数据库优化:

1、如有条件,数据可以存放于redis,读取速度快

2、建立索引、外键等

 

58、使用pop和del删除字典中的"name"字段,dic={"name":"zs","age":18}

 

59、列出常见MYSQL数据存储引擎

InnoDB:支持事务处理,支持外键,支持崩溃修复能力和并发控制。如果需要对事务的完整性要求比较高(比如银行),要求实现并发控制(比如售票),那选择InnoDB有很大的优势。如果需要频繁的更新、删除操作的数据库,也可以选择InnoDB,因为支持事务的提交(commit)和回滚(rollback)。 

MyISAM:插入数据快,空间和内存使用比较低。如果表主要是用于插入新记录和读出记录,那么选择MyISAM能实现处理高效率。如果应用的完整性、并发性要求比 较低,也可以使用。

MEMORY:所有的数据都在内存中,数据的处理速度快,但是安全性不高。如果需要很快的读写速度,对数据的安全性要求较低,可以选择MEMOEY。它对表的大小有要求,不能建立太大的表。所以,这类数据库只使用在相对较小的数据库表。

 

60、计算代码运行结果,zip函数历史文章已经说了,得出[("a",1),("b",2),("c",3),("d",4),("e",5)]

 

dict()创建字典新方法

 

 

61、简述同源策略

 同源策略需要同时满足以下三点要求: 

1)协议相同 

 2)域名相同 

3)端口相同 

 http:www.test.com与https:www.test.com 不同源——协议不同 

 http:www.test.com与http:www.admin.com 不同源——域名不同 

 http:www.test.com与http:www.test.com:8081 不同源——端口不同

 只要不满足其中任意一个要求,就不符合同源策略,就会出现“跨域”

 

62、简述cookie和session的区别

1,session 在服务器端,cookie 在客户端(浏览器)

2、session 的运行依赖 session id,而 session id 是存在 cookie 中的,也就是说,如果浏览器禁用了 cookie ,同时 session 也会失效,存储Session时,键与Cookie中的sessionid相同,值是开发人员设置的键值对信息,进行了base64编码,过期时间由开发人员设置

3、cookie安全性比session差

 

63、简述多线程、多进程

进程:

1、操作系统进行资源分配和调度的基本单位,多个进程之间相互独立

2、稳定性好,如果一个进程崩溃,不影响其他进程,但是进程消耗资源大,开启的进程数量有限制

线程:

1、CPU进行资源分配和调度的基本单位,线程是进程的一部分,是比进程更小的能独立运行的基本单位,一个进程下的多个线程可以共享该进程的所有资源

2、如果IO操作密集,则可以多线程运行效率高,缺点是如果一个线程崩溃,都会造成进程的崩溃

应用:

IO密集的用多线程,在用户输入,sleep 时候,可以切换到其他线程执行,减少等待的时间

CPU密集的用多进程,因为假如IO操作少,用多线程的话,因为线程共享一个全局解释器锁,当前运行的线程会霸占GIL,其他线程没有GIL,就不能充分利用多核CPU的优势

 

64、简述any()和all()方法

any():只要迭代器中有一个元素为真就为真

all():迭代器中所有的判断项返回都是真,结果才为真

python中什么元素为假?

答案:(0,空字符串,空列表、空字典、空元组、None, False)

 

测试all()和any()方法

 

 

65、IOError、AttributeError、ImportError、IndentationError、IndexError、KeyError、SyntaxError、NameError分别代表什么异常

IOError:输入输出异常

AttributeError:试图访问一个对象没有的属性

ImportError:无法引入模块或包,基本是路径问题

IndentationError:语法错误,代码没有正确的对齐

IndexError:下标索引超出序列边界

KeyError:试图访问你字典里不存在的键

SyntaxError:Python代码逻辑语法出错,不能执行

NameError:使用一个还未赋予对象的变量

 

66、python中copy和deepcopy区别

1、复制不可变数据类型,不管copy还是deepcopy,都是同一个地址当浅复制的值是不可变对象(数值,字符串,元组)时和=“赋值”的情况一样,对象的id值与浅复制原来的值相同。

2、复制的值是可变对象(列表和字典)

浅拷贝copy有两种情况:

第一种情况:复制的 对象中无 复杂 子对象,原来值的改变并不会影响浅复制的值,同时浅复制的值改变也并不会影响原来的值。原来值的id值与浅复制原来的值不同。

第二种情况:复制的对象中有 复杂 子对象 (例如列表中的一个子元素是一个列表), 改变原来的值 中的复杂子对象的值  ,会影响浅复制的值。

深拷贝deepcopy:完全复制独立,包括内层列表和字典

 

 

 

67、列出几种魔法方法并简要介绍用途

__init__:对象初始化方法

__new__:创建对象时候执行的方法,单列模式会用到

__str__:当使用print输出对象的时候,只要自己定义了__str__(self)方法,那么就会打印从在这个方法中return的数据

__del__:删除对象执行的方法

 

68、C:Users y-wu.junyaDesktop>python 1.py 22 33命令行启动程序并传参,print(sys.argv)会输出什么数据?

文件名和参数构成的列表

 

 

69、请将[i for i in range(3)]改成生成器

生成器是特殊的迭代器,

1、列表表达式的【】改为()即可变成生成器

2、函数在返回值得时候出现yield就变成生成器,而不是函数了;

中括号换成小括号即可,有没有惊呆了

 

 

70、a = "  hehheh  ",去除收尾空格

71、举例sort和sorted对列表排序,list=[0,-1,3,-10,5,9]

 

 

72、对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],使用lambda函数从小到大排序

 

 

73、使用lambda函数对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],输出结果为

[0,2,4,8,8,9,-2,-4,-4,-5,-20],正数从小到大,负数从大到小

(传两个条件,x<0和abs(x))

 

74、列表嵌套字典的排序,分别根据年龄和姓名排序

foo = [{"name":"zs","age":19},{"name":"ll","age":54},

        {"name":"wa","age":17},{"name":"df","age":23}

 

75、列表嵌套元组,分别按字母和数字排序

 

 

76、列表嵌套列表排序,年龄数字相同怎么办?

 

77、根据键对字典排序(方法一,zip函数)

 

 

78、根据键对字典排序(方法二,不用zip)

有没有发现dic.items和zip(dic.keys(),dic.values())都是为了构造列表嵌套字典的结构,方便后面用sorted()构造排序规则

 

 

79、列表推导式、字典推导式、生成器

 

80、最后出一道检验题目,根据字符串长度排序,看排序是否灵活运用

 

 

81、举例说明SQL注入和解决办法

当以字符串格式化书写方式的时候,如果用户输入的有;+SQL语句,后面的SQL语句会执行,比如例子中的SQL注入会删除数据库demo

 

解决方式:通过传参数方式解决SQL注入

 

 

82、s="info:xiaoZhang 33 shandong",用正则切分字符串输出['info', 'xiaoZhang', '33', 'shandong']

|表示或,根据冒号或者空格切分

 

 

83、正则匹配以163.com结尾的邮箱

 

84、递归求和

 

 

85、python字典和json字符串相互转化方法

json.dumps()字典转json字符串,json.loads()json转字典

 

 

86、MyISAM 与 InnoDB 区别:

1、InnoDB 支持事务,MyISAM 不支持,这一点是非常之重要。事务是一种高

级的处理方式,如在一些列增删改中只要哪个出错还可以回滚还原,而 MyISAM

就不可以了;

2、MyISAM 适合查询以及插入为主的应用,InnoDB 适合频繁修改以及涉及到

安全性较高的应用;

3、InnoDB 支持外键,MyISAM 不支持;

4、对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM

表中可以和其他字段一起建立联合索引;

5、清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重

建表;

 

87、统计字符串中某字符出现次数

 

 

88、字符串转化大小写

 

 

89、用两种方法去空格

 

 

90、正则匹配不是以4和7结尾的手机号

 

 

91、简述python引用计数机制

python垃圾回收主要以引用计数为主,标记-清除和分代清除为辅的机制,其中标记-清除和分代回收主要是为了处理循环引用的难题。

 

引用计数算法

当有1个变量保存了对象的引用时,此对象的引用计数就会加1

当使用del删除变量指向的对象时,如果对象的引用计数不为1,比如3,那么此时只会让这个引用计数减1,即变为2,当再次调用del时,变为1,如果再调用1次del,此时会真的把对象进行删除

 

92、int("1.4"),int(1.4)输出结果?

int("1.4")报错,int(1.4)输出1

 

93、列举3条以上PEP8编码规范

1、顶级定义之间空两行,比如函数或者类定义。

2、方法定义、类定义与第一个方法之间,都应该空一行

3、三引号进行注释

4、使用Pycharm、Eclipse一般使用4个空格来缩进代码

 

94、正则表达式匹配第一个URL

findall结果无需加group(),search需要加group()提取

 

95、正则匹配中文

 

96、简述乐观锁和悲观锁

悲观锁, 就是很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。

 

乐观锁,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制,乐观锁适用于多读的应用类型,这样可以提高吞吐量

 

97、r、r+、rb、rb+文件打开模式区别

模式较多,比较下背背记记即可

 

 

98、Linux命令重定向 > 和 >>

Linux 允许将命令执行结果 重定向到一个 文件

将本应显示在终端上的内容 输出/追加 到指定文件中

> 表示输出,会覆盖文件原有的内容

>> 表示追加,会将内容追加到已有文件的末尾

用法示例:

将 echo 输出的信息保存到 1.txt 里echo Hello Python > 1.txt
将 tree 输出的信息追加到 1.txt 文件的末尾tree >> 1.txt

 

99、正则表达式匹配出<html><h1>www.itcast.cn</h1></html>

前面的<>和后面的<>是对应的,可以用此方法

 

 

100、python传参数是传值还是传址?

Python中函数参数是引用传递(注意不是值传递)。对于不可变类型(数值型、字符串、元组),因变量不能修改,所以运算不会影响到变量自身;而对于可变类型(列表字典)来说,函数体运算可能会更改传入的参数变量。

 

 

101、求两个列表的交集、差集、并集

 

102、生成0-100的随机数

random.random()生成0-1之间的随机小数,所以乘以100

 

 

103、lambda匿名函数好处

精简代码,lambda省去了定义函数,map省去了写for循环过程

 

104、常见的网络传输协议

UDP、TCP、FTP、HTTP、SMTP等等

 

105、单引号、双引号、三引号用法

1、单引号和双引号没有什么区别,不过单引号不用按shift,打字稍微快一点。表示字符串的时候,单引号里面可以用双引号,而不用转义字符,反之亦然。

'She said:"Yes." ' or  "She said: 'Yes.' "

2、但是如果直接用单引号扩住单引号,则需要转义,像这样:

 ' She said:'Yes.' '

3、三引号可以直接书写多行,通常用于大段,大篇幅的字符串

"""

hello

world

"""

106、python垃圾回收机制

python垃圾回收主要以引用计数为主,标记-清除和分代清除为辅的机制,其中标记-清除和分代回收主要是为了处理循环引用的难题。

引用计数算法

当有1个变量保存了对象的引用时,此对象的引用计数就会加1

当使用del删除变量指向的对象时,如果对象的引用计数不为1,比如3,那么此时只会让这个引用计数减1,即变为2,当再次调用del时,变为1,如果再调用1次del,此时会真的把对象进行删除

 

107、HTTP请求中get和post区别

1、GET请求是通过URL直接请求数据,数据信息可以在URL中直接看到,比如浏览器访问;而POST请求是放在请求头中的,我们是无法直接看到的;

2、GET提交有数据大小的限制,一般是不超过1024个字节,而这种说法也不完全准确,HTTP协议并没有设定URL字节长度的上限,而是浏览器做了些处理,所以长度依据浏览器的不同有所不同;POST请求在HTTP协议中也没有做说明,一般来说是没有设置限制的,但是实际上浏览器也有默认值。总体来说,少量的数据使用GET,大量的数据使用POST。

3、GET请求因为数据参数是暴露在URL中的,所以安全性比较低,比如密码是不能暴露的,就不能使用GET请求;POST请求中,请求参数信息是放在请求头的,所以安全性较高,可以使用。在实际中,涉及到登录操作的时候,尽量使用HTTPS请求,安全性更好。

 

108、python中读取Excel文件的方法

应用数据分析库pandas

 

 

109、简述多线程、多进程

进程:

1、操作系统进行资源分配和调度的基本单位,多个进程之间相互独立

2、稳定性好,如果一个进程崩溃,不影响其他进程,但是进程消耗资源大,开启的进程数量有限制

线程:

1、CPU进行资源分配和调度的基本单位,线程是进程的一部分,是比进程更小的能独立运行的基本单位,一个进程下的多个线程可以共享该进程的所有资源

2、如果IO操作密集,则可以多线程运行效率高,缺点是如果一个线程崩溃,都会造成进程的崩溃

应用:

IO密集的用多线程,在用户输入,sleep 时候,可以切换到其他线程执行,减少等待的时间

CPU密集的用多进程,因为假如IO操作少,用多线程的话,因为线程共享一个全局解释器锁,当前运行的线程会霸占GIL,其他线程没有GIL,就不能充分利用多核CPU的优势

110、python正则中search和match

import re
s = "小明年龄18岁 工资10000"
res = re.search(r"\d+",s).group()
print("search结果", res)

res = re.findall(r"\d+", s)
print("findall结果", res)

res = re.match("小明", s).group()  #匹配以小明开头的字符串,并匹配出小明
print("match的结果", res)

res = re.match(r"\d+", s)
print("试错,不加group为none,匹配不到", res)

# res = re.match("工资", s).group() #工资不是字符串,匹配不到,报错
# print("match的结果", res)

打印:
search结果 18
findall结果 ['18', '10000']
match的结果 小明
试错,不加group为none,匹配不到 None
  • 来源:python爬虫人工智能大数据

  • https://mp.weixin.qq.com/s/cQXQC1oJZ_v0d7qBD95o2

 

 

 

第一部分 Python基础篇(80题)

1、为什么学习Python?

2、通过什么途径学习的Python?

3、Python和Java、PHP、C、C#、C++等其他语言的对比?

python是解释型语言,

4、简述解释型和编译型编程语言?

编译类:先翻译成二进制,产生两个文件,运行的时候是二进制文件。程序执行效率高,编译后程序运行时不需要重新翻译,直接使用编译的结果就可以了,但是跨平台性能差。如C\C++、Delphi等。
通过操作系统把它运行起来,操作系统下面才是CPU、运行内存等
解释型:“同声翻译”,一边翻译成目标代码即机器语言一边执行,运行效率比较低且不能生成可独立执行的可执行文件,应用程序不能脱离解释器,这种方式比较灵活,可以动态调整、修改应用程序。可以跨平台,开发效率高。如:java、python等。

5、Python解释器种类以及特点?

Python解释器:
CPython官方版本;IPython在交互方式上有所增强;PyPy执行速度快,使用JIT技术,进行动态编译;Jython;IronPython。

6、位和字节的关系?

字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8个比特(位)(1Byte=8bit)。

7、b、B、KB、MB、GB 的关系?

位就是bit也是b,1B=8b,   1B就是1byte,1KB=1024B,1MB=1024KB,1GB=1024MB

8、请至少列举5个 PEP8 规范(越多越好)

 

9、通过代码实现如下转换:

  • 二进制转换成十进制:v = “0b1111011”

  • 十进制转换成二进制:v = 18 

  • 八进制转换成十进制:v = “011” 

  • 十进制转换成八进制:v = 30 

  • 十六进制转换成十进制:v = “0x12” 

  • 十进制转换成十六进制:v = 87

10、请编写一个函数实现将IP地址转换成一个整数。

 

如 10.3.9.12 转换规则为:

 

 10           00001010
3            00000011
9            00001001
12           00001100

 

再将以上二进制拼接起来计算十进制结果:00001010 00000011 00001001 00001100 = ?

 

11、python递归的最大层数?

12、求结果:

 

v1 = 1 or 3
v2 = 1 and 3
v3 = 0 and 2 and 1
v4 = 0 and 2 or 1
v5 = 0 and 2 or 1 or 4
v6 = 0 or Flase and 1

 

13、ascii、unicode、utf-8、gbk 区别?

14、字节码和机器码的区别?

15、三元运算规则以及应用场景?

16、列举 Python2和Python3的区别?

17、用一行代码实现数值交换:

 

a = 1
b = 2

 

18、Python3和Python2中 int 和 long的区别?

19、xrange和range的区别?

20、文件操作时:xreadlines和readlines的区别?

21、列举布尔值为False的常见值?

22、字符串、列表、元组、字典每个常用的5个方法?

23、lambda表达式格式以及应用场景?

24、pass的作用?

25、*arg和**kwarg作用

26、is和==的区别

27、简述Python的深浅拷贝以及应用场景?

28、Python垃圾回收机制?

29、Python的可变类型和不可变类型?

30、求结果:

 

v = dict.fromkeys(['k1','k2'],[])
v[‘k1’].append(666)
print(v)
v[‘k1’] = 777
print(v)

 

31、求结果:

 

32、列举常见的内置函数?

33、filter、map、reduce的作用?

34、一行代码实现9*9乘法表

35、如何安装第三方模块?以及用过哪些第三方模块?

36、至少列举8个常用模块都有那些?

37、re的match和search区别?

38、什么是正则的贪婪匹配?

39、求结果: a. [ i % 2 for i in range(10) ] b. ( i % 2 for i in range(10) )

40、求结果: a. 1 or 2 b. 1 and 2 c. 1 < (2==2) d. 1 < 2 == 2

41、def func(a,b=[]) 这种写法有什么坑?

42、如何实现 “1,2,3” 变成 [‘1’,’2’,’3’] ?

43、如何实现[‘1’,’2’,’3’]变成[1,2,3] ?

44、比较: a = [1,2,3] 和 b = [(1),(2),(3) ] 以及 b = [(1,),(2,),(3,) ] 的区别?

45、如何用一行代码生成[1,4,9,16,25,36,49,64,81,100] ?

46、一行代码实现删除列表中重复的值 ?

47、如何在函数中设置一个全局变量 ?

48、logging模块的作用?以及应用场景?

49、请用代码简答实现stack 。

50、常用字符串格式化哪几种?

51、简述 生成器、迭代器、可迭代对象 以及应用场景?

52、用Python实现一个二分查找的函数。

53、谈谈你对闭包的理解?

54、os和sys模块的作用?

55、如何生成一个随机数?

56、如何使用python删除一个文件?

57、谈谈你对面向对象的理解?

58、Python面向对象中的继承有什么特点?

59、面向对象深度优先和广度优先是什么?

60、面向对象中super的作用?

61、是否使用过functools中的函数?其作用是什么?

62、列举面向对象中带爽下划线的特殊方法,如:__new__、__init__

63、如何判断是函数还是方法?

64、静态方法和类方法区别?

65、列举面向对象中的特殊成员以及应用场景

66、1、2、3、4、5 能组成多少个互不相同且无重复的三位数

67、什么是反射?以及应用场景?

68、metaclass作用?以及应用场景?

69、用尽量多的方法实现单例模式。

70、装饰器的写法以及应用场景。

71、异常处理写法以及如何主动跑出异常(应用场景)

72、什么是面向对象的mro

73、isinstance作用以及应用场景?

 

74、写代码并实现:

 

Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would 
have exactly one solution, and you may not use the same element twice.
Example:
         Given nums = [2, 7, 11, 15], target = 9,
Because nums[0] + nums[1] = 2 + 7 = 9,
          return [0, 1]

 

75、json序列化时,可以处理的数据类型有哪些?如何定制支持datetime类型?

76、json序列化时,默认遇到中文会转换成unicode,如果想要保留中文怎么办?

77、什么是断言?应用场景?

78、有用过with statement吗?它的好处是什么?

79、使用代码实现查看列举目录下的所有文件。

80、简述 yield和yield from关键字。

 

第二部分 网络编程和并发(34题)

 

1、简述 OSI 七层协议。

2、什么是C/S和B/S架构?

3、简述 三次握手、四次挥手的流程。

4、什么是arp协议?

5、TCP和UDP的区别?

6、什么是局域网和广域网?

7、为何基于tcp协议的通信比基于udp协议的通信更可靠?

8、什么是socket?简述基于tcp协议的套接字通信流程。

9、什么是粘包? socket 中造成粘包的原因是什么? 哪些情况会发生粘包现象?

10、IO多路复用的作用?

11、什么是防火墙以及作用?

12、select、poll、epoll 模型的区别?

13、简述 进程、线程、协程的区别 以及应用场景?

14、GIL锁是什么鬼?

15、Python中如何使用线程池和进程池?

16、threading.local的作用?

17、进程之间如何进行通信?

18、什么是并发和并行?

19、进程锁和线程锁的作用?

20、解释什么是异步非阻塞?

21、路由器和交换机的区别?

22、什么是域名解析?

23、如何修改本地hosts文件?

24、生产者消费者模型应用场景及优势?

25、什么是cdn?

26、LVS是什么及作用?

27、Nginx是什么及作用?

28、keepalived是什么及作用?

29、haproxy是什么以及作用?

30、什么是负载均衡?

31、什么是rpc及应用场景?

32、简述 asynio模块的作用和应用场景。

33、简述 gevent模块的作用和应用场景。

34、twisted框架的使用和应用?

 

第三部分 数据库和缓存(46题)

 

1、列举常见的关系型数据库和非关系型都有那些?

2、MySQL常见数据库引擎及比较?

3、简述数据三大范式?

4、什么是事务?MySQL如何支持事务?

5、简述数据库设计中一对多和多对多的应用场景?

6、如何基于数据库实现商城商品计数器?

7、常见SQL(必备)
详见武沛齐博客:https://www.cnblogs.com/wupeiqi/articles/5729934.html

8、简述触发器、函数、视图、存储过程?

9、MySQL索引种类

10、索引在什么情况下遵循最左前缀的规则?

11、主键和外键的区别?

12、MySQL常见的函数?

13、列举 创建索引但是无法命中索引的8种情况。

14、如何开启慢日志查询?

15、数据库导入导出命令(结构+数据)?

16、数据库优化方案?

17、char和varchar的区别?

18、简述MySQL的执行计划?

19、在对name做了唯一索引前提下,简述以下区别: 

 

select * from tb where name = ‘Oldboy-Wupeiqi’ 
select * from tb where name = ‘Oldboy-Wupeiqi’ limit 1

 

20、1000w条数据,使用limit offset 分页时,为什么越往后翻越慢?如何解决?

21、什么是索引合并?

22、什么是覆盖索引?

23、简述数据库读写分离?

24、简述数据库分库分表?(水平、垂直)

25、redis和memcached比较?

26、redis中数据库默认是多少个db 及作用?

27、python操作redis的模块?

28、如果redis中的某个列表中的数据量非常大,如果实现循环显示每一个值?

29、redis如何实现主从复制?以及数据同步机制?

30、redis中的sentinel的作用?

31、如何实现redis集群?

32、redis中默认有多少个哈希槽?

33、简述redis的有哪几种持久化策略及比较?

34、列举redis支持的过期策略。

35、MySQL 里有 2000w 数据,redis 中只存 20w 的数据,如何保证 redis 中都是热点数据? 

36、写代码,基于redis的列表实现 先进先出、后进先出队列、优先级队列。

37、如何基于redis实现消息队列?

38、如何基于redis实现发布和订阅?以及发布订阅和消息队列的区别?

39、什么是codis及作用?

40、什么是twemproxy及作用?

41、写代码实现redis事务操作。

42、redis中的watch的命令的作用?

43、基于redis如何实现商城商品数量计数器?

44、简述redis分布式锁和redlock的实现机制。

45、什么是一致性哈希?Python中是否有相应模块?

46、如何高效的找到redis中所有以oldboy开头的key?

 

第四部分 前端、框架和其他(155题)

 

1、谈谈你对http协议的认识。

2、谈谈你对websocket协议的认识。

3、什么是magic string ?

4、如何创建响应式布局?

5、你曾经使用过哪些前端框架?

6、什么是ajax请求?并使用jQuery和XMLHttpRequest对象实现一个ajax请求。

7、如何在前端实现轮训?

8、如何在前端实现长轮训?

9、vuex的作用?

10、vue中的路由的拦截器的作用?

11、axios的作用?

12、列举vue的常见指令。

13、简述jsonp及实现原理?

14、是什么cors ?

15、列举Http请求中常见的请求方式?

16、列举Http请求中的状态码?

17、列举Http请求中常见的请求头?

18、看图写结果:

 

19、看图写结果:

 

20、看图写结果:

 

21、看图写结果:

 

 

22、看图写结果:

 

23、看图写结果:

 

24、django、flask、tornado框架的比较?

25、什么是wsgi?

26、django请求的生命周期?

27、列举django的内置组件?

28、列举django中间件的5个方法?以及django中间件的应用场景?

29、简述什么是FBV和CBV?

30、django的request对象是在什么时候创建的?

31、如何给CBV的程序添加装饰器?

32、列举django orm 中所有的方法(QuerySet对象的所有方法)

33、only和defer的区别?

34、select_related和prefetch_related的区别?

35、filter和exclude的区别?

36、列举django orm中三种能写sql语句的方法。

37、django orm 中如何设置读写分离?

38、F和Q的作用?

39、values和values_list的区别?

40、如何使用django orm批量创建数据?

41、django的Form和ModeForm的作用?

42、django的Form组件中,如果字段中包含choices参数,请使用两种方式实现数据源实时更新。

43、django的Model中的ForeignKey字段中的on_delete参数有什么作用?

44、django中csrf的实现机制?

45、django如何实现websocket?

46、基于django使用ajax发送post请求时,都可以使用哪种方法携带csrf token?

47、django中如何实现orm表中添加数据时创建一条日志记录。

48、django缓存如何设置?

49、django的缓存能使用redis吗?如果可以的话,如何配置?

50、django路由系统中name的作用?

51、django的模板中filter和simple_tag的区别?

52、django-debug-toolbar的作用?

53、django中如何实现单元测试?

54、解释orm中 db first 和 code first的含义?

55、django中如何根据数据库表生成model中的类?

56、使用orm和原生sql的优缺点?

57、简述MVC和MTV

58、django的contenttype组件的作用?

59、谈谈你对restfull 规范的认识?

60、接口的幂等性是什么意思?

61、什么是RPC?

62、Http和Https的区别?

63、为什么要使用django rest framework框架?

64、django rest framework框架中都有那些组件?

65、django rest framework框架中的视图都可以继承哪些类?

66、简述 django rest framework框架的认证流程。

67、django rest framework如何实现的用户访问频率控制?

68、Flask框架的优势?

69、Flask框架依赖组件?

70、Flask蓝图的作用?

71、列举使用过的Flask第三方组件?

72、简述Flask上下文管理流程?

73、Flask中的g的作用?

74、Flask中上下文管理主要涉及到了那些相关的类?并描述类主要作用?

75、为什么要Flask把Local对象中的的值stack 维护成一个列表?

76、Flask中多app应用是怎么完成?

77、在Flask中实现WebSocket需要什么组件?

78、wtforms组件的作用?

79、Flask框架默认session处理机制?

80、解释Flask框架中的Local对象和threading.local对象的区别?

81、Flask中 blinker 是什么?

82、SQLAlchemy中的 session和scoped_session 的区别?

83、SQLAlchemy如何执行原生SQL?

84、ORM的实现原理?

85、DBUtils模块的作用?

86、以下SQLAlchemy的字段是否正确?如果不正确请更正:

 

from datetime import datetime
from sqlalchemy.ext.declarative
import declarative_base
from sqlalchemy import Column, Integer, String, DateTime

Base = declarative_base()
class UserInfo(Base):
   __tablename__ = 'userinfo'
   id = Column(Integer, primary_key=True, autoincrement=True)
   name = Column(String(64), unique=True)
   ctime = Column(DateTime, default=datetime.now())

 

87、SQLAchemy中如何为表设置引擎和字符编码?

88、SQLAchemy中如何设置联合唯一索引?

89、简述Tornado框架的特点。

90、简述Tornado框架中Future对象的作用?

91、Tornado框架中如何编写WebSocket程序?

92、Tornado中静态文件是如何处理的?如: <link href="{{static_url("commons.css")}}" rel="stylesheet" />

93、Tornado操作MySQL使用的模块?

94、Tornado操作redis使用的模块?

95、简述Tornado框架的适用场景?

96、git常见命令作用:

97、简述以下git中stash命令作用以及相关其他命令。

98、git 中 merge 和 rebase命令 的区别。

99、公司如何基于git做的协同开发?

100、如何基于git实现代码review?

101、git如何实现v1.0 、v2.0 等版本的管理?

102、什么是gitlab?

103、github和gitlab的区别?

104、如何为github上牛逼的开源项目贡献代码?

105、git中 .gitignore文件的作用?

106、什么是敏捷开发?

107、简述 jenkins 工具的作用?

108、公司如何实现代码发布?

109、简述 RabbitMQ、Kafka、ZeroMQ的区别?

110、RabbitMQ如何在消费者获取任务后未处理完前就挂掉时,保证数据不丢失?

111、RabbitMQ如何对消息做持久化?

112、RabbitMQ如何控制消息被消费的顺序?

113、以下RabbitMQ的exchange type分别代表什么意思?如:fanout、direct、topic。

114、简述 celery 是什么以及应用场景?

115、简述celery运行机制。

116、celery如何实现定时任务?

117、简述 celery多任务结构目录?

118、celery中装饰器 @app.task 和 @shared_task的区别?

119、简述 requests模块的作用及基本使用?

120、简述 beautifulsoup模块的作用及基本使用?

121、简述 seleninu模块的作用及基本使用?

122、scrapy框架中各组件的工作流程?

123、在scrapy框架中如何设置代理(两种方法)?

124、scrapy框架中如何实现大文件的下载?

125、scrapy中如何实现限速?

126、scrapy中如何实现暂定爬虫?

127、scrapy中如何进行自定制命令?

128、scrapy中如何实现的记录爬虫的深度?

129、scrapy中的pipelines工作原理?

130、scrapy的pipelines如何丢弃一个item对象?

131、简述scrapy中爬虫中间件和下载中间件的作用?

132、scrapy-redis组件的作用?

133、scrapy-redis组件中如何实现的任务的去重?

134、scrapy-redis的调度器如何实现任务的深度优先和广度优先?

135、简述 vitualenv 及应用场景?

136、简述 pipreqs 及应用场景?

137、在Python中使用过什么代码检查工具?

138、简述 saltstack、ansible、fabric、puppet工具的作用?

139、B Tree和B+ Tree的区别?

140、请列举常见排序并通过代码实现任意三种。

141、请列举常见查找并通过代码实现任意三种。

142、请列举你熟悉的设计模式?

143、有没有刷过leetcode?

144、列举熟悉的的Linux命令。

145、公司线上服务器是什么系统?

146、解释 PV、UV 的含义?

147、解释 QPS的含义?

148、uwsgi和wsgi的区别?

149、supervisor的作用?

150、什么是反向代理?

151、简述SSH的整个过程。

152、有问题都去那些找解决方案?

153、是否有关注什么技术类的公众号?

154、最近在研究什么新技术?

155、是否了解过领域驱动模型?

 

 

 

 
posted @ 2018-06-30 13:57  kris12  阅读(4968)  评论(0编辑  收藏  举报
levels of contents