Fork me on GitHub

全是中文的txt文件查找特定字符并输出该行到新文件

  • tangshi.txt文件为全为汉唐诗
  • 在该文件中查找指定字符
  • codecs库为打开中文文件的库,详情自行知乎
  • tangshi.txt大概十几万行,需要该文件练手的同学下方评论
  • 要点:更改文件字符编码格式,即为另存为下方选择编码
import codecs

def search(key_word: str, ):
    with codecs.open('tangshi1.txt', encoding='utf-8') as f:
        for index, line in enumerate(f.readlines()):
            if key_word in line:
                result = ""
                result += f"{key_word}在文件的第{index + 1}行\n"
                # print(result)
                # print(line)
                f = open("1.txt","a+",encoding='utf-8')
                f.write(line)
            else:
                result = f"未在文件中发现{key_word}"
    return result


if __name__ == '__main__':
    search("融")
    search("柔")
    search("肉")
    search("如")
    search("乳")
    search("入")
    search("辱")
    search("儒")
# 1528融  1529柔  1530肉  1531如  1532儒  1533乳  1534辱  1535入
posted @ 2020-03-29 18:58  草莓草莓酱  阅读(203)  评论(0)    收藏  举报