上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 27 下一页

2018年1月12日

摘要: 参考: http://edyfox.codecarver.org/html/vim_fileencodings_detection.html 一、查看文件编码。 在打开文件的时候输入:set fileencoding 即可显示文件编码格式。 二、文件编码转换 1、在Vim中直接进行转换文件编码,比如 阅读全文
posted @ 2018-01-12 20:41 TMatrix52 阅读(599) 评论(0) 推荐(1)

2018年1月11日

摘要: 参考:http://cslt.riit.tsinghua.edu.cn/mediawiki/images/e/e5/%E5%8F%A5%E6%B3%95%E5%B7%A5%E5%85%B7%E5%88%86%E6%9E%90.pdf http://pyltp.readthedocs.io/zh_CN 阅读全文
posted @ 2018-01-11 19:45 TMatrix52 阅读(750) 评论(0) 推荐(0)

2018年1月4日

摘要: raw_datas #DateFrame diff_index_list = [] #行index #多行所有列索引 raw_datas.ix[diff_index_list] #多行一列索引raw_datas.ix[diff_index_list, df.columns[1]] #多行多列索引ra 阅读全文
posted @ 2018-01-04 21:10 TMatrix52 阅读(208) 评论(0) 推荐(0)
摘要: 参考: 用 Doc2Vec 得到文档/段落/句子的向量表达 https://radimrehurek.com/gensim/models/doc2vec.html Gensim Doc2vec Tutorial on the IMDB Sentiment Dataset 基于gensim的Doc2V 阅读全文
posted @ 2018-01-04 11:28 TMatrix52 阅读(326) 评论(0) 推荐(0)

2017年12月29日

摘要: output = json.dumps(output, ensure_ascii=False).encode('utf-8') 阅读全文
posted @ 2017-12-29 19:24 TMatrix52 阅读(181) 评论(0) 推荐(0)
摘要: 链接:https://github.com/wks/ik-analyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析 阅读全文
posted @ 2017-12-29 17:11 TMatrix52 阅读(163) 评论(0) 推荐(0)

2017年12月10日

摘要: 参考: https://docs.python.org/2/library/tarfile.html http://www.jianshu.com/p/bbad16822eab #解压文件tarfile.open(filepath, 'r:gz').extractall(inception_pret 阅读全文
posted @ 2017-12-10 17:16 TMatrix52 阅读(147) 评论(0) 推荐(0)

2017年12月8日

摘要: 参考: http://www.jb51.net/shouce/jquery/regexp.html http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 数量词的贪婪模式与非贪婪模式 2. 数量词的贪婪模式与非贪婪模式 正则表达 阅读全文
posted @ 2017-12-08 13:31 TMatrix52 阅读(230) 评论(0) 推荐(0)

2017年11月23日

摘要: 参考:http://www.cnblogs.com/ybjourney/p/4793370.html http://www.cnblogs.com/ybjourney/p/4824903.html https://janav.wordpress.com/2013/10/27/tf-idf-and-c 阅读全文
posted @ 2017-11-23 20:08 TMatrix52 阅读(165) 评论(0) 推荐(0)

2017年11月22日

摘要: 参考:http://blog.sciencenet.cn/blog-995625-803323.html 原始集:概率分布为A训练集:概率分布为B测试集:概率分布为C特征工程:处理A,得到更接近C的B机器学习:拟合B,用以预测C 一.四类特征 特征工程是个过程,包括三个子模块:特征构建->特征提取- 阅读全文
posted @ 2017-11-22 19:50 TMatrix52 阅读(130) 评论(0) 推荐(0)
上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 27 下一页

导航