随笔分类 -  ML&DL

摘要:环境 Python3, gensim,jieba,numpy ,pandas 原理:文章转成向量,然后在计算两个向量的余弦值。 Gensim gensim是一个python的自然语言处理库,能够将文档根据TF IDF, LDA, LSI 等模型转化成向量模式,gensim还实现了word2vec功能 阅读全文
posted @ 2018-05-15 18:54 Jreey 阅读(14740) 评论(1) 推荐(0)
摘要:Titanic 数据集是从 kaggle下载的,下载地址:https://www.kaggle.com/c/titanic/data 数据一共又3个文件,分别是:train.csv,test.csv,gender_submission.csv 先把需要视同的库导入: np.random.seed(1 阅读全文
posted @ 2018-01-20 14:32 Jreey 阅读(1554) 评论(0) 推荐(1)
摘要:本文主要是使用【监督学习】实现一个图像分类器,目的是识别图片是猫还是狗。 从【数据预处理】到 【图片预测】实现一个完整的流程, 当然这个分类在 Kaggle 上已经有人用【迁移学习】(VGG,Resnet)做过了,迁移学习我就不说了,我自己用 Keras + Tensorflow 完整的实现了一遍。 阅读全文
posted @ 2017-10-26 20:19 Jreey 阅读(17615) 评论(1) 推荐(3)