随笔分类 - NLP自然语言处理
摘要:1. Boolean representation word_dict = ['我们', '又', '去', '爬山', '今天', '你们', '昨天', '跑步'] def booleanRepresent(user_input): count = {} for word in word_dic
阅读全文
摘要:本文转载自: https://zhuanlan.zhihu.com/p/58163299 最近我在学习自然语言处理,相信大家都知道NLP的第一步就是学分词,但分词≠自然语言处理。现如今分词工具及如何使用网上一大堆。我想和大家分享的是结巴分词核心内容,一起探究分词的本质。 (1)、基于前缀词典实现高效
阅读全文
摘要:# 先定义个词典 word_dict = ['我们', '经常', '有','有意见','意见','分歧'] # 滑动窗口的大小 max_len = 5 # 用户的输入 user_input = '我们经常有意见分歧' len(user_input) 结果: 9 前向最大匹配算法的实现 # 前向最大
阅读全文
摘要:网址链接:https://algorithms.tutorialhorizon.com/dynamic-programming-edit-distance-problem/ 1. 目标:给定两个字符串s1, s2,写出一个算法来找出从s1转化到s2所需要的最小操作步骤数(编辑距离)。 所允许的操作:
阅读全文

浙公网安备 33010602011771号