字符串操作、文件操作,英文词频统计预处理

1.字符串操作:
    解析身份证号:生日、性别、出生地等。

code=input("请输入您的身份证号:");
year=code[6:10];
month=code[10:12];
day=code[12:14];
province=code[0:2];
area={'11':'北京市','12':'天津市','13':'河北省','14':'山西省','15':'内蒙古自治区','21':'辽宁省','22':'吉林省','23':'黑龙江省','31':'上海市','32':'江苏省','33':'浙江省','34':'安徽省','35':'福建省','36':'江西省','37':'山东省','41':'河南省','42':'湖北省','43':'湖南省','44':'广东省','45':'广西壮族自治区','46':'海南省','50':'重庆市','51':'四川省','52':'贵州省','53':'云南省','54':'西藏自治区','61':'陕西省','62':'甘肃省','63':'青海省','64':'宁夏回族自治区','65':'新疆维吾尔自治区','71':'台湾省','81':'香港特别行政区','82':'澳门特别行政区'}
print("你所查询的身份证归属地为:"+area.get(province));
print("出生日期是{}年{}月{}日".format(year,month,day));
sex=code[-2];
if int(sex)%2==0:
    print("性别为女");
else:
    print("性别为男")

    凯撒密码编码与解码

def encryption():
    str_raw = input("请输入明文:")
    k = int(input("请输入位移值:"))
    str_change = str_raw.lower()
    str_list = list(str_change)
    str_list_encry = str_list
    i = 0
    while i < len(str_list):
        if ord(str_list[i]) < 123-k:
            str_list_encry[i] = chr(ord(str_list[i]) + k)
        else:
            str_list_encry[i] = chr(ord(str_list[i]) + k - 26)
        i = i+1
    print ("加密结果为:"+"".join(str_list_encry))
def decryption():
    str_raw = input("请输入密文:")
    k = int(input("请输入位移值:"))
    str_change = str_raw.lower()
    str_list = list(str_change)
    str_list_decry = str_list
    i = 0
    while i < len(str_list):
        if ord(str_list[i]) >= 97+k:
            str_list_decry[i] = chr(ord(str_list[i]) - k)
        else:
            str_list_decry[i] = chr(ord(str_list[i]) + 26 - k)
        i = i+1
    print ("解密结果为:"+"".join(str_list_decry))
while True:
    print (u"1. 加密")
    print (u"2. 解密")
    choice = input("请选择:")
    if choice == "1":
        encryption()
    elif choice == "2":
        decryption()
    else:
        print (u"您的输入有误!")

 


    网址观察与批量生成

for i in range(4,6):
    url='http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html'.format(i)
    print(url)

 


2.英文词频统计预处理

    下载一首英文的歌词或文章或小说。
    将所有大写转换为小写
    将所有其他做分隔符(,.?!)替换为空格
    分隔出一个一个的单词
    并统计单词出现的次数。

url='''
  WHEN MINUTES BECOME HOURS
   WHEN DAYS BECOME YEARS
   AND I DON’T KNOW WHERE YOU ARE
   COLOR SEEMS SO DULL WITHOUT YOU
'''
str1=url.lower()
str2=str1.replace(",","")
str3=str2.replace("'","")
print(str3)
print(str3.split());
print(str3.count('we'))

 
3.文件操作
    同一目录、绝对路径、相对路径
    凯撒密码:从文件读入密函,进行加密或解密,保存到文件。

   词频统计:下载一首英文的歌词或文章或小说,保存为utf8文件。从文件读入文本进行处理。

同一目录:

f=open('ll.txt','r',encoding='utf8')
text=f.read()
f.close()
print(text)



 4.函数定义
 加密函数

def get_text():
    plaincode = 'abcd'
    cipher=''
    for i in plaincode:
        cipher=cipher+chr(ord(i) + 3)
    return cipher
bigstr = get_text()
print(bigstr)

  解密函数

def get_text():
    plaincode = 'defg'
    cipher=''
    for i in plaincode:
        cipher=cipher+chr(ord(i) -3)
    return cipher
bigstr = get_text()
print(bigstr)
  

 读文本函数

def get_text():
    with open('yw.txt', 'r', encoding='utf8',errors='ignore') as f:
        text = f.read()
    return text
bigstr = get_text()
print(bigstr)

 



posted @ 2019-03-11 01:37  梁琳  阅读(92)  评论(0编辑  收藏  举报