摘要: 1. 模型原理 1.1 论文 Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN。 将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中 阅读全文
posted @ 2018-09-20 14:52 焦距 阅读(79168) 评论(3) 推荐(7) 编辑
摘要: 1. 词云简介 词云,又称文字云、标签云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。常见于博客、微博、文章分析等。 除了网上现成的Wordle、Tagxedo、Tagul、Tagcrowd等词云制作工 阅读全文
posted @ 2018-07-22 17:46 焦距 阅读(10422) 评论(0) 推荐(2) 编辑
摘要: 在训练深度学习模型的时候,通常将数据集切分为训练集和验证集.Keras提供了两种评估模型性能的方法: 使用自动切分的验证集 使用手动切分的验证集 一.自动切分 在Keras中,可以从数据集中切分出一部分作为验证集,并且在每次迭代(epoch)时在验证集中评估模型的性能. 具体地,调用model.fi 阅读全文
posted @ 2018-05-14 15:45 焦距 阅读(24388) 评论(2) 推荐(4) 编辑
摘要: 一、TextRank原理 TextRank是一种用来做关键词提取的算法,也可以用于提取短语和自动摘要。因为TextRank是基于PageRank的,所以首先简要介绍下PageRank算法。 1. PageRank算法 PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇( 阅读全文
posted @ 2018-02-23 15:45 焦距 阅读(2461) 评论(0) 推荐(0) 编辑
摘要: 引入 智能 人工智能 强化学习初印象 强化学习的相关资料 经典书籍推荐:《Reinforcement Learning:An Introduction(强化学习导论)》(强化学习教父Richard Sutton 的经典教材) 经典理论课程推荐: 2015 David Silver经典强化学习公开课、 阅读全文
posted @ 2020-06-27 10:51 焦距 阅读(225) 评论(0) 推荐(0) 编辑
摘要: Linux下的paste命令主要用于从多个文件(包括标准输入)中读取内容,将每个文件的对应行用指定分隔符(默认tab制表符)拼接起来并打印到标准输出,我们可以使用重定向命令“>”将输出结果保存到文件中,从而实现整合多个文件的功能。 常用参数: -d<分隔符> 指定分隔符,若未使用该参数则默认制表符分 阅读全文
posted @ 2020-01-14 17:32 焦距 阅读(5187) 评论(0) 推荐(0) 编辑
摘要: 1、文本相似度,文本匹配模型归纳总结 https://blog.csdn.net/u012526436/article/details/90179466 2、短文本匹配的利器-ESIM https://zhuanlan.zhihu.com/p/47580077 阅读全文
posted @ 2019-09-18 10:07 焦距 阅读(3577) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2019-07-08 23:09 焦距 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 效果: 详细参考: https://www.cnblogs.com/easypython/p/9084426.html https://www.cnblogs.com/ping-y/p/5897018.html 阅读全文
posted @ 2019-04-30 14:30 焦距 阅读(355) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2019-04-22 21:38 焦距 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 1、官网下载地址 https://www.omnigroup.com/omnigraffle 2、激活方法 Omnigraffle Pro 7注册码/许可证 名字:Appked 序列号:MFWG-GHEB-HYTW-CGHT-CSXU-QCNC-SXU (参考:https://www.cnblogs 阅读全文
posted @ 2019-03-13 15:46 焦距 阅读(1094) 评论(0) 推荐(0) 编辑
摘要: Linux:Settings —> Editor —> Inspections —> General —> Duplicated Code Mac:Preferences --> Editor —> Inspections —> General —> Duplicated Code fragment 阅读全文
posted @ 2019-03-01 11:22 焦距 阅读(2758) 评论(0) 推荐(0) 编辑
摘要: 题目大意 https://leetcode.com/problems/search-a-2d-matrix-ii/ 240. Search a 2D Matrix II Write an efficient algorithm that searches for a value in an m x 阅读全文
posted @ 2018-11-02 16:51 焦距 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 1. 比较文件 2. 比较文件夹 对于其中一方缺失的文件,仅输出文件名及其所在的文件夹名称: 3. diff命令的参数及完整用法说明 $ diff --help Usage: diff [OPTION]... FILES Compare FILES line by line. Mandatory a 阅读全文
posted @ 2018-10-26 14:20 焦距 阅读(1306) 评论(0) 推荐(0) 编辑
摘要: 通过修改 ~/.vimrc 文件可以自定义配置vim,然后重新打开vim即可看到效果。 1. 简单配置 2. 复杂配置 主要参考: https://www.cnblogs.com/ma6174/archive/2011/12/10/2283393.html 原配置主要是为C、C++开发而配置,涉及: 阅读全文
posted @ 2018-10-20 12:40 焦距 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 转自:TCP编程 - 廖雪峰的官方网站 Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。 客户端 大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动 阅读全文
posted @ 2018-10-11 10:15 焦距 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 转自:3.4 解决样本类别分布不均衡的问题 | 数据常青藤 (组织排版上稍有修改) 3.4 解决样本类别分布不均衡的问题 说明:本文是《Python数据分析与数据化运营》中的“3.4 解决样本类别分布不均衡的问题”。 下面是正文内容 所谓的不平衡指的是不同类别的样本量异非常大。样本类别分布不平衡主要 阅读全文
posted @ 2018-10-10 14:56 焦距 阅读(5183) 评论(0) 推荐(0) 编辑
摘要: 转自:分布式进程 - 廖雪峰的官方网站 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。 Python的 multiprocessing 模块不但支持多进程,其中 ma 阅读全文
posted @ 2018-09-29 10:09 焦距 阅读(267) 评论(0) 推荐(0) 编辑
摘要: w3m是一个基于文本的网页浏览器,支持多种操作系统,在命令行终端可以很好的支持中文。即使在没有鼠标支持的情况下也可以检查网页的输出。 1. 安装w3m 2. w3m的常用使用操作 2.1 查看帮助信息 2.2 打开指定网页地址 可以通过滚动鼠标、按箭头键移动光标或点击所需的位置将光标移动到那里。 2 阅读全文
posted @ 2018-09-25 14:37 焦距 阅读(5753) 评论(0) 推荐(0) 编辑
摘要: 1. 模型原理 1.1 论文 Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN。 将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中 阅读全文
posted @ 2018-09-20 14:52 焦距 阅读(79166) 评论(3) 推荐(7) 编辑
摘要: 题目大意 https://leetcode.com/problems/kth-smallest-element-in-a-bst/description/ 230. Kth Smallest Element in a BST Given a binary search tree, write a f 阅读全文
posted @ 2018-09-18 10:04 焦距 阅读(763) 评论(0) 推荐(0) 编辑
摘要: 问题描述 程序开始运行的时候报出警告:I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to 阅读全文
posted @ 2018-09-17 15:47 焦距 阅读(936) 评论(0) 推荐(0) 编辑
摘要: 转自:https://zhidao.baidu.com/question/935674859160973732/answer/2895447719?fr=index_ans 问题描述:重装系统后找不到硬盘 我用的是三星R425-JU05笔记本电脑WIN7系统。我将硬盘一键分四区后重装成XP系统,结果 阅读全文
posted @ 2018-09-17 14:20 焦距 阅读(807) 评论(0) 推荐(0) 编辑
摘要: 转自:https://blog.csdn.net/u010887744/article/details/45270245 今天给一朋友重装系统,华硕FX50J,修改BIOS重装了win7,结果所有USB接口均无法使用,鼠标键盘U盘都成了摆设,再次重装还是如此,恢复BIOS依旧没用。打了两次华硕技术客 阅读全文
posted @ 2018-09-17 14:14 焦距 阅读(2060) 评论(0) 推荐(0) 编辑