摘要: 1 class DataSource(object): 2 3 def __init__(self): 4 self.conn = self.to_connect() 5 6 def __del__(self): 7 self.conn.close() 8 9 # @staticmethod 10 阅读全文
posted @ 2021-04-28 08:36 洒哥 阅读(398) 评论(0) 推荐(0)
摘要: 中文分词是将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于原文本。词典分词是最简单、最为常见的分词算法,仅需一部词典和一套查询词典规则即可。 常用的规则词典有正向最长匹配、逆向最长匹配和双向最长匹配,它们都基于完全切分过程。 1.完全切分 完全切分指的是,找出一段文本中所有单词。这并不是标准 阅读全文
posted @ 2021-04-26 15:54 洒哥 阅读(446) 评论(0) 推荐(0)