摘要: jieba Python下中文分词工具 地址:https://github.com/fxsjy/jieba , 安装:pip install jieba 功能:中文分词、词性标注、TF-IDF和TextRank关键词抽取 ansj Java下中文分词工具 地址:https://github.com/ 阅读全文
posted @ 2019-04-27 11:10 黄然小悟 阅读(177) 评论(0) 推荐(0)
摘要: print函数 python输出主要使用print函数,print函数介绍: print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False) *objects表示要打印的值,表示多个无名参数或需要打印的值;sep=’ ',对应上面要打 阅读全文
posted @ 2019-04-17 00:00 黄然小悟 阅读(667) 评论(0) 推荐(0)
摘要: 原文来自知乎:https://zhuanlan.zhihu.com/p/58931044 转载为了方便自己学习,如有侵权,我会删除!... 阅读全文
posted @ 2019-03-31 17:32 黄然小悟 阅读(1083) 评论(0) 推荐(0)
摘要: python中图像处理相关库有很多,这里简单介绍PIL、cv2、scipy.imageio 、matplotlib.image、skimage等常用库,其中PIL库使用最方便,cv2库功能最强大。 PIL:Python Imaging Library python安装:pip install Pil 阅读全文
posted @ 2019-03-11 22:27 黄然小悟 阅读(390) 评论(0) 推荐(0)
摘要: Java调用Tensorflow训练好的模型做预测,首先需要读取词典,然后加载模型,读入数据,最后预测结果。 模型训练参考上一篇博客... 阅读全文
posted @ 2018-12-28 21:42 黄然小悟 阅读(697) 评论(0) 推荐(0)
摘要: 这里用Tensorflow中LSTM+Attention模型训练一个中文标题党的分类模型,并最后用Java调用训练好的模型。 数据预... 阅读全文
posted @ 2018-12-28 21:33 黄然小悟 阅读(290) 评论(0) 推荐(0)
摘要: 读取二进制文件 读取二进制文件,并存入byte数组,如算法训练模型的二进制模型。 public byte[] readFromByteFile(String pathname) throws IOException{ File filename = new File(pathname); Buffe 阅读全文
posted @ 2018-10-21 16:32 黄然小悟 阅读(52) 评论(0) 推荐(0)
摘要: 参考此文:https://blog.csdn.net/qq_33039859/article/details/79901667 产生batch数据 输入data中每个样本可以有多个特征,和一个标签,最好都是numpy.array格式。 datas = [data1, data2, …, dataN 阅读全文
posted @ 2018-10-21 16:10 黄然小悟 阅读(549) 评论(0) 推荐(0)
摘要: 本文翻译的原文:https://queryunderstanding.com/query-rewriting-an-overview... 阅读全文
posted @ 2018-09-22 21:45 黄然小悟 阅读(428) 评论(0) 推荐(0)
摘要: Modern Deep Learning Techniques Applied to Natural Language Proces... 阅读全文
posted @ 2018-07-23 00:08 黄然小悟 阅读(104) 评论(0) 推荐(0)