Loading

04 2020 档案

摘要:The primary advantage of CRFs over HMMs is their conditional nature, resulting in the relaxation of the independence assumptions that required by HMMs 阅读全文
posted @ 2020-04-29 21:33 云野Winfield 阅读(697) 评论(0) 推荐(0)
摘要:[TOC] 模型介绍 马尔科夫假设: 假设模型的当前状态仅仅依赖于前面的几个状态 一个马尔科夫过程是状态间的转移仅依赖于前n个状态的过程。这个过程被称之为n阶马尔科夫模型,其中n是影响下一个状态选择的(前)n个状态。最简单的马尔科夫过程是一阶模型,它的状态选择仅与前一个状态有关。这里要注意它与确定性 阅读全文
posted @ 2020-04-26 17:28 云野Winfield 阅读(2576) 评论(0) 推荐(0)
摘要:这次我们使用 "今日头条信息流中抽取的38w条新闻标题数据" 作为数据集。数据集中的文本长度在10到30之间,一共15个类别。 数据预处理: 接下来,定义模型。这里我们用到了 这个包: 定义训练和测试方法: 开始训练: 由于colab显存不够,所以调小了batch_size,训练了三小时左右,最终在 阅读全文
posted @ 2020-04-23 10:57 云野Winfield 阅读(8936) 评论(1) 推荐(1)
摘要:[TOC] 这次采用的数据集为 ,这份语料的质量还是不错的,内容也比较生活化。更多的语料数据可见: "中文公开聊天语料库" 首先,项目依赖: 准备数据 先 读取数据 ,然后打印几行看看语料质量: 打印结果: 可以看到,语料的基本质量还是可以的,不过其中还有一些不必要的符号,后续处理时要过滤掉 分词 阅读全文
posted @ 2020-04-22 22:16 云野Winfield 阅读(1499) 评论(0) 推荐(2)