摘要: TensorFlow Serving 是一个用于机器学习模型 serving 的高性能开源库。它可以将训练好的机器学习模型部署到线上,使用 gRPC 作为接口接受外部调用。更加让人眼前一亮的是,它支持模型热更新与自动模型版本管理。这意味着一旦部署 TensorFlow Serving 后,你再也不需 阅读全文
posted @ 2017-11-29 15:14 Qniguoym 阅读(428) 评论(0) 推荐(0)
摘要: sys.argv[0]代表代码本身文件路径 参数从argv[1]开始。 阅读全文
posted @ 2017-11-29 12:28 Qniguoym 阅读(149) 评论(0) 推荐(0)
摘要: TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。 字词的重要性随着它在文件中出现的次数成正比增加,但同时会随 阅读全文
posted @ 2017-11-27 16:58 Qniguoym 阅读(864) 评论(0) 推荐(0)
摘要: 1.CBOW模型 之前已经解释过,无论是CBOW模型还是skip-gram模型,都是以Huffman树作为基础的。值得注意的是,Huffman树中非叶节点存储的中间向量的初始化值是零向量,而叶节点对应的单词的词向量是随机初始化的。 1.1 训练的流程 那么现在假设我们已经有了一个已经构造好的Huff 阅读全文
posted @ 2017-11-04 16:46 Qniguoym 阅读(629) 评论(0) 推荐(0)
摘要: 1.单词的向量化表示 一般来讲,词向量主要有两种形式,分别是稀疏向量和密集向量。 所谓稀疏向量,又称为one-hot representation,就是用一个很长的向量来表示一个词,向量的长度为词典的大小N,向量的分量只有一个1,其他全为0,1的位置对应该词在词典中的索引。 至于密集向量,又称dis 阅读全文
posted @ 2017-11-04 16:02 Qniguoym 阅读(1617) 评论(0) 推荐(0)
摘要: 在使用tf来训练模型的时候,难免会出现中断的情况。这时候自然就希望能够将辛辛苦苦得到的中间参数保留下来,不然下次又要重新开始。 保存模型的方法: 将模型保存好以后,载入也比较方便。 使用tensorboard来使训练过程可视化 tensorflow还提供了一个可视化工具,叫tensorboard.启 阅读全文
posted @ 2017-11-04 15:40 Qniguoym 阅读(2575) 评论(0) 推荐(0)
摘要: 1.矩阵操作 1.1矩阵生成 这部分主要将如何生成矩阵,包括全0矩阵,全1矩阵,随机数矩阵,常数矩阵等 新建一个与给定的tensor类型大小一致的tensor,使其所有元素为0和1 创建一个形状大小为shape的tensor,初始值为value 创建一个常量tensor,按照给出value来赋值,可 阅读全文
posted @ 2017-11-04 14:53 Qniguoym 阅读(2342) 评论(0) 推荐(0)
摘要: 在NLP领域,语义相似度的计算一直是个难题:搜索场景下query和Doc的语义相似度、feeds场景下Doc和Doc的语义相似度、机器翻译场景下A句子和B句子的语义相似度等等。本文通过介绍DSSM、CNN-DSSM、LSTM-DSSM等深度学习模型在计算语义相似度上的应用,希望给读者带来帮助。 1. 阅读全文
posted @ 2017-11-02 15:39 Qniguoym 阅读(34380) 评论(0) 推荐(2)
摘要: 1.tf.Graph() 你一旦开始你的任务,就已经有一个默认的图已经创建好了。而且可以通过调用tf.get_default_graph()来访问到。 添加一个操作到默认的图里面,只要简单的调用一个定义了新操作的函数就行。比如下面的例子展示的: <tensorflow.python.framewor 阅读全文
posted @ 2017-11-02 11:25 Qniguoym 阅读(5277) 评论(0) 推荐(0)
摘要: 如果有一个Tensor t,在使用t.eval()时,等价于: 这其中最主要的区别是你可以使用sess.run()在同一步获取多个tensor中的值, 例如: 注意到:每次使用 eval 和 run时,都会执行整个计算图,为了获取计算的结果,将它分配给tf.Variable,然后获取。 阅读全文
posted @ 2017-11-01 11:09 Qniguoym 阅读(630) 评论(0) 推荐(0)