• 一、什么是模块
    • 1、一组功能的整合,当你需要和某个东西打交道,这个东西本身就存在,python提供了一个功能的集合,专门负责和这东西交互。
  • 二、正则表达式
    • 1、正则表达式有两个目的
      • 1、从大段文字中找到符合规则的内容
      • 2、判断某个字符串是否完全符合规则
    • 2、正则表达式的规则
      • 1、首先。正则表达式旨在操作字符串,从字符串中找到符合条件的内容
      • 2、[ ],写在中括号里面的内容,都会出现在下面某一个字符的位置上,可以是一个一个的具体字符,也可以是一个范围,如[a-z]或者[0-9],表示这里面的内容,但是需要知道的是这个必须按照ASCII码的顺序来确定范围,不能反着来
      • 3、[^内容] 表示除了括号的内容之外的任何其他字符都符合要求
      • 4、\w 匹配所有字母数字和下划线
      • 5、\d匹配所有的数字
      • 6、\s匹配所有的空白符
      • 7、\t匹配所有的制表符
      • 8、\n匹配所有的换行符
      • 9、\W、\D、\S、表示的含义与他们的小写含义相反
      • 10、\b表示去单词的边界寻找,如:\bha 表示寻找一切ha开头的单词,ing\b表示一切以ing结尾的单词
      • 11、^表示匹配一个字符串的开头,只能出现在字符串的开头
      • 12、$表示匹配一个字符串的结尾
      • 13、。可以匹配除了换行符之外的所有字符
      • 14、| 表示“或”a|b即表示符合a规则或者b规则的都可以被匹配,若a规则是b规则的一部分,切a规则比b规则更加的苛刻,那么就需要将a规则写在前面,即谁的要求高谁写在前面
      • 15、有一些有特殊的意义的字符进入字符组[. ]中,会取消他的意义,如,小括号(,竖杠字符 |,点。,和中括号本身。
      • 16、{n},量词,仅约束它前面的元字组,表示该元字组出现的次数
      • 17、{n,}同样仅仅约束它前面的元字组,表示该元字组至少出现的次数
      • 18、{n,m},表明它前面元字组出现的范围
      • 19、?表示匹配量词之前的字符出现一次或者零次,可有可无
      • 20、+匹配量词前的字符出现一次或者多次,至少一次
      • 21、*匹配量词之前的字符出现0次或者多次
      • 22、分组,使用小括号表示,表示给几个字符量词加上需求约束
    • 3、正则表达式的匹配特点
      • 1、它会在允许的范围内取最长的结果,这是由于他本身由回溯算法构建而成,具有天生贪婪的特点,若想让他变成非贪婪模式,需要在量词后面加上一个”?“
      • 2、^.....$这种形式的约束,需要中间的内容和长度与要求完全一才能被匹配
      • 3、我们最长使用的形式便是:(。*?X)这表示匹配任意非换行符字符串,直到遇见了x
posted on 2018-08-16 21:42  哈尔斯塔特  阅读(39)  评论(0)    收藏  举报