组合数据类型练习,英文词频统计实例

    1. 列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。
      s=list('12323231312')
      s.append('3')
      s.pop(0)
      s[1]='2'
      s.index('2')
      s.count('1')
      s.count('3')

    2. 字典实例:建立学生学号成绩字典,做增删改查遍历操作。
      d={'01':85,'02':80,'03':90,'04':95,'05':75,'06':85,'07':86}
      d['01']
      d['08']=96
      d.pop('01')
      d.keys()
      d.values ()

    3. 列表,元组,字典,集合的遍历。
      l=list('12311312231')
      s=tuple('bsfdsbsk')
      t={'01':'98','02':'99','03':'92','04':'95'}
      d={'10','11','12','13','14'}
      for i in l:
          print(i,end='')
      for i in s:
          print(i,end='')
      for i in d:
          print(i,end='')
      for i in t:
          print(i,end='')
      for i in t:
          print(i,t.values())

      属性 列表list 元祖tuple                  字典dict      集合set
      有序 是 (正向递增/反向递减)
      数据可重复 key值唯一
      数据可修改
      特点

      查询速度随内容增加而变慢

      占用内存较小

      表达固定数据项、函数多返回值、

      多变量同步赋值、循环遍历等情况下适用

      改&查操作速度快,

      不会因key值增加而变慢。

      占用内存大,内存浪费多

      (利用空间成本换时间)

      数据独立性:

      能够过滤重复参数

       


      总结列表,元组,字典,集合的联系与区别。
    4. 英文词频统计实例
      1. 待分析字符串
      2. 分解提取单词
        1. 大小写 txt.lower()
        2. 分隔符'.,:;?!-_’
      3. 计数字典
        1. 排除语法型词汇,代词、冠词、连词

      4. 排序list.sort()
      5. 输出TOP(10)
        s=open('s.txt','r').read()
        exc={'the','a','to','of','and','in','on','that','i','it','at'}
        s=s.lower()
        for i in ''',.?!''':
            s=s.replace(i,' ')
        words=s.split(' ')
        dic={}
        keys=set(words)
        for w in exc:
            keys.remove(w)
        for i in keys:
            dic[i]=words.count(i)
        wc=list(dic.items ())
        wc.sort(key=lambda x:x[1],reverse=True)
        for i in range(20):
            print(wc[i])

posted on 2017-09-21 17:16  ohh咔咔咔  阅读(109)  评论(0编辑  收藏  举报

导航