07 2018 档案

Python数据分析8-----网页文本处理
摘要:1、去除网页的标签,如<br/> 2、将标点符号等去掉,用正则表达式。 去除特殊符号: 3、将文本中的单词小写化,并将data用空格分开 4、去掉停用词 5、将所有的词连接成一个句子 6、把空格前缀去除 7、删除短词,删除句子中词语长度小于3的词,如haa,hi等无意义的词 8、分词 9、提取词干 阅读全文

posted @ 2018-07-17 21:19 吱吱了了 阅读(542) 评论(0) 推荐(0)

Python数据分析3------数据预处理(2)----字符串处理
摘要: 阅读全文

posted @ 2018-07-13 13:12 吱吱了了 阅读(613) 评论(0) 推荐(0)

sklearn学习9----LDA(discriminat_analysis)
摘要:1、导入模块 http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html#sklearn.discriminant_analysis.Li 阅读全文

posted @ 2018-07-04 15:57 吱吱了了 阅读(1305) 评论(0) 推荐(0)

树(8)----路径和
摘要:1、输出树的所有路径:(前序遍历,深度遍历的特例) 1、二叉树中的最大路径和 给定一个非空二叉树,返回其最大路径和。 本题中,路径被定义为一条从树中任意节点出发,达到任意节点的序列。该路径至少包含一个节点,且不一定经过根节点。 示例 1: 示例 2: ############超出时间限制 2、路径求 阅读全文

posted @ 2018-07-03 19:47 吱吱了了 阅读(567) 评论(0) 推荐(0)

树(7)-----二叉树的序列化和反序列化
摘要:1、序列化:层次遍历【用字符串来存储】 2、反序列化:用队列存已经建立的节点,从序列化后的字符串列表取数来建立树 二、前序遍历的序列化: 代码: 反序列化: 3、前序遍历和中序遍历反序列化 阅读全文

posted @ 2018-07-01 15:16 吱吱了了 阅读(218) 评论(0) 推荐(0)

导航