摘要: 临时文件是计算机程序存储临时数据的文件,它的扩展名通常是“.temp”。本文用于记录使用Python提供的临时文件API解决实际问题的过程,主要内容包括问题描述、tempfile库简要介绍、解决方案等。 阅读全文
posted @ 2021-06-17 01:52 taojiahong 阅读(2739) 评论(0) 推荐(0)
摘要: 最近在研究基于知识图谱的问答系统,想要参考网上分享的关于[NLPCC 2016 KBQA任务](http://tcci.ccf.org.cn/conference/2016/pages/page05_evadata.html)的经验帖,自己实现一个原型。不少博客都有提到,nlpcc-kbqa训练数据只提供了问题和答案,没有标注三元组,因此需要根据答案(尾实体)从知识图谱中反向查找头实体和关系,进而构建一条训练样例的(头实体,关系,尾实体)三元组标注。由于知识图谱规模比较大,三元组的数量超过了4000万条,直接根据文件进行查询不方便,因此考虑用数据库来管理这些三元组。本文记录了通过SQLAlchemy加载数据到MySQL数据库中的过程,主要内容包括建立数据连接、定义数据库表模式等。 阅读全文
posted @ 2020-12-02 20:29 taojiahong 阅读(411) 评论(0) 推荐(0)
摘要: 昨天通过Git Bash提交代码的时候遇到了由于单个文件大小超过100M,导致代码上传失败的问题。考虑到那个大文件是用于训练模型的数据集,并没有进行版本控制的必要,为了方便以后能快速推送和拉取代码,决定设置Git忽略该文件并且从提交记录中删除它。本文记录了Git删除已提交的文件的整个过程,主要内容包括定位文件和删除文件。 阅读全文
posted @ 2020-11-12 15:51 taojiahong 阅读(473) 评论(0) 推荐(0)
摘要: 本文记录了部署Vue项目到阿里云服务器上的过程,其中云服务器的操作系统是CentOS 7,Web服务器用的是nginx。因为项目涉及发送异步请求,而由Flask编写的后端应用监听的并非80端口,存在跨域的问题,在部署Vue项目的过程中给我带来了困扰,因此将部署Flask应用的过程一并记录。 阅读全文
posted @ 2020-07-13 00:46 taojiahong 阅读(110) 评论(0) 推荐(0)
摘要: 本文档用于记录PyTorch环境配置过程中的要点,内容包括:安装Miniconda、安装PyTorch、配置远程开发工具以及使用基于CUDA的张量。 阅读全文
posted @ 2020-06-15 16:36 taojiahong 阅读(180) 评论(0) 推荐(0)