05 2018 档案
摘要:(猜数字的小游戏) 要求:产生一个随机数字1-100之间,接收用户输入,如果猜对了,游戏结束,猜大了,提示猜大了,小了提示猜小了。产生随机数模块使用random.randint(1,101),是一个标准包,导入使用即可。代码如下:
阅读全文
摘要:list,dict:用来序列化你爬的东西 切片:用来对爬取的内容进行分割,生成 条件判断(if等):用来解决爬虫过程中哪些要哪些不要的问题 循环和迭代(for while ):用来循环,重复爬虫动作 文件读写操作(open,close等):用来读取参数、保存爬下来的内容等 list,dict:用来序
阅读全文
摘要:Web应用开发可以说是目前软件开发中最重要的部分。Web开发也经历了好几个阶段: 静态Web页面:由文本编辑器直接编辑并生成静态的HTML页面,如果要修改Web页面的内容,就需要再次编辑HTML源文件,早期的互联网Web页面就是静态的; CGI:由于静态Web页面无法与用户交互,比如用户填写了一个注
阅读全文
摘要:大O表示法:称一个函数g(n)是O(f(n)),当且仅当存在常数c>0和n0>=1,对一切n>n0均有|g(n)|<=c|f(n)|成立,也称函数g(n)以f(n)为界或者称g(n)受限于f(n)。记作g(n)=O(f(n))。 定义:如果一个问题的规模是n,解这一问题的某一算法所需要的时间为T(n
阅读全文
摘要:动态链接库(Dynamic Link Library 或者 Dynamic-link Library,缩写为 DLL),是微软公司在微软Windows操作系统中,实现共享函数库概念的一种方式。这些库函数的扩展名是 ”.dll"、".ocx"(包含ActiveX控制的库)或者 ".drv"(旧式的系统
阅读全文
摘要:单表最大的也在25万左右,历史数据表因为不涉及所以不用考虑, 难点在于这个规模的热点数据,变化非常频繁。 数据来源于一些检测设备的采集数据,一些大表,有可能在极短时间内(如几秒钟)可能大部分都会变化, 而且主程序也有一些后台服务需要不断轮询、读写某种类型的设备,所以要求信息交互时间尽可能短。 2、之
阅读全文
摘要:对于单一客户端对服务器进行http请求,一般我们的方式 1:单进程或线程轮询请求(这个效能自然很低,原因会讲到,也不用测试) 2:多条线程提前准备数据等待信号(对客户端性能要求较高) 3:提前准备一组线程同时轮询操作 4:使用系统/平台自带异步发送机制(实际就是平台线程池的方式,发送与接收使用从线程
阅读全文
摘要:限管理,一般指根据系统设置的安全规则或者安全策略,用户可以访问而且只能访问自己被授权的资源,不多不少。权限管理几乎出现在任何系统里面,只要有用户和密码的系统。 很多人常将“用户身份认证”、“密码加密”、“系统管理”等概念与权限管理概念混淆。 从控制力度来看,可以将权限管理分为两大类: 1,功能级权限
阅读全文
摘要:计算机系统是由硬件和系统软件组成,他们共同工作来运行应用程序。我们通常接触更多的是应用程序级别的,很少关注系统以及系统和硬件的交互,但是如果自己能完全理解计算机系统以及它对应用程序的影响,那将会让我们在软件开发的路上走的更远,也同时可以避免很多问题的发生。 计算机来说其实就是由0和1组成的位(比特)
阅读全文
摘要:GB2312是中国规定的汉字编码,也可以说是简体中文的字符集编码 GBK 是 GB2312的扩展 ,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名 cp936:中文本地系统是Windows中的cmd,默认codepage是CP936,cp936就是指系统里第936号编码格式,即GB231
阅读全文
摘要:if __name__ == '__main__' 就相当于是 Python 模拟的程序入口。Python 本身并没有规定这么写,这只是一种编码习惯。由于模块之间相互引用,不同模块可能都有这样的定义,而入口程序只能有一个。到底哪个入口程序被选中,这取决于 __name__ 的值。 __name__
阅读全文
摘要:所谓数组,是有序的元素序列。将有限个类型相同的变量的集合命名,那么这个名称为数组名。组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量。用于区分数组的各个元素的数字编号称为下标。数组是在程序设计中,为了处理方便, 把具有相同类型的若干元素按无序的形式组织起来的一种形式。 这些无序
阅读全文
摘要:特殊字符 所谓特殊字符,就是一些有特殊含义的字符,如上面说的 runoo*b 中的 *,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 \: runo\*ob 匹配 runo*ob。 许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字
阅读全文
摘要:在一些语言中,你会发现正则第一个和最后一个字符是相同的,如: /\d+/ 这个/ /在PHP中称为分隔符,正则表达式需要由分隔符闭合包裹。在PHP中,分隔符可以使任意非字母数字、非反斜线、非空白字符。这个概念很关键,它能帮助我们简化一些正则的书写,避免错误,如: /<div>.*?</div>/ 这
阅读全文
摘要:定位符 定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式,这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。 定位符用来描述字符串或单词的边界,^ 和 $ 分别指字符串的开始与结束,\b 描述单词的前或后边界,\B 表示非单词边界。 正则表达式的定位符
阅读全文
摘要:欧几里得算法:适用于这个最小块地的最大方块,也是适用整块地块的最大方块 D&C的工作原理: 1,,找出最简单的基线条件 2,确定如何缩小问题的规模,使其符合基线条件 3,D&C并非是可用于解决问题的算法,而是一种解决问题的思路】 def sum(arr): total = 0 for x in ar
阅读全文
摘要:1,每个递归函数都有两部分,基线条件和递归条件 base case and recursive case 2,调用一个函数的时候,其他的函数调用会暂停并处于未完成的状态 3.调用栈会消耗大量的内存,栈很高的时候意味着计算机要存储大量的函数调用信息,此时的选择是重新编写代码,将栈运算改变成循环或是使用
阅读全文
摘要:算法问题的总结学习过程 1.计算机内存相当于一个个相互独立的抽屉 2.需要存储多个元素的时候可以使用数组与链表 3.数组的元素都在一起 4.链表的元素都是分开的,其中的每个元素都存储了下一个元素的地址 5.数组的读取速度是很快的 6.链表的插入删除速度很快 7.在同一个数组里,所有元素的类型都必须是
阅读全文
摘要:数据对象的运算和操作:计算机可以执行的基本操作是以指令的形式描述的。一个计算机系统能执行的所有指令的集合,成为该计算机系统的指令系统。一个计算机的基本运算和操作有如下四类:1,算术运算:加减乘除等运算 2,逻辑运算:或、且、非等运算 3,关系运算:大于、小于、等于、不等于等运算 4,数据传输:输入、
阅读全文
摘要:pyc 直接在setting中安装,用pyc环境运行 urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。 urllib2.urlopen accepts an instance of the Request class or a url, (whereas urlli
阅读全文
摘要:类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。 类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。 数据成员:类变量或者实例变量, 用于处理类及其实例对象的相关的数据。
阅读全文
摘要:捕获的表达式,正如 [a-z]+ 指定的,包括一个或多个字母。正则表达式的第二部分是对以前捕获的子匹配项的引用,即,单词的第二个匹配项正好由括号表达式匹配。\1 指定第一个子匹配项。 字边界元字符确保只检测整个单词。否则,诸如 "is issued" 或 "this is" 之类的词组将不能正确地被
阅读全文
摘要:正则表达式(regular expression),是使用单个字符串来描述、匹配一系列符合某个语法的字符串。在python中对应的是re模块。待匹配模式和字符串可以采用unicode编码或者普通8-位编码,但是两者不能混用,即如果待匹配模式是Unicode编码,则字符串也必须是Unicode编码。
阅读全文
摘要:re.search方法 re.search 扫描整个字符串并返回第一个成功的匹配。 re.match与re.search的区别 re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。 检索和替换 Pyt
阅读全文

浙公网安备 33010602011771号