07 2020 档案
摘要:今天又重新整理了思路,总觉得对现在的题目有点问题,明天继续研究,万事开头难啊。
阅读全文
摘要:今天学习了智能问答的大概制作,有基于规则的也有基于神经网络的,明天开始尝试自己编写一个简单的知识图谱。
阅读全文
摘要:今天学习了实体关系的判段,老师使用的是随机森林的分类器,进行的句法分析,明天继续学习。
阅读全文
摘要:今天学习了一些实体统一和关系抽取。 视频中使用的是规则的替换,将实体名称统一。 而关系的抽取也是如此。
阅读全文
摘要:今天查看了一下网上的数据,发现很多都是处理好的数据,没有找到合适的目标,真是头大。
阅读全文
摘要:今天再次学习知识图谱最重要的一步,知识的抽取,学习了一般,有别的事情就耽搁了,明天继续学习。 总结以下,重新了解了实体抽取的方法,基于规则的,神经网络等等,有很多现成的成熟的算法。 这些方法在输入数据集时,是不识别字符串的,而是特征向量,知识图谱字符串来描述特征也是不太好的,所以我们需要有一步转化词
阅读全文
摘要:今天依旧学习知识图谱,感觉就是一个实体-->关系-->实体的知识库,而构建这样一个知识库的过程,需要用到 知识的获取:爬虫网路等等 知识的抽取:抽取实体,关系,属性等等 知识的融合:如张翼德和张飞是同一个人 知识的消歧:如同名不同人 指代消除:如小明是个好孩子,他的朋友李华也是。这个他指的就是小明。
阅读全文
摘要:今天又去看了看题目,明天就要进行第三次开会,所以又看了看题目,斟酌了一下,还看了看知识图谱的一个关于医药的案例。
阅读全文
摘要:今天又是学习知识图谱的一天,依旧蒙蔽,词向量,难道是根据词向量通过模型计算为别的数值,再转化为文字。明天继续,加油!
阅读全文
摘要:NLP自然语言处理 分词 文本特征提取方法:表示模型:向量空间模型相似度比较:内积计算,Cosine计算词权重提取算法:词频-逆向文件频率(TF-IDF)LSA潜在语义分析
阅读全文
摘要:今天重新看了看老师的讲义ppt,学习了一下实体抽取和关系抽取,但是对于算法模型的建立还是没有多少了解,有点懵,明天继续学习。
阅读全文
摘要:import moxing as mox mox.file.copy_parallel('/', 'obs://')
阅读全文
摘要:今天软件杯提交作品,忙活了一天,建议多看华为云官方文档,网上的教程少的可怜。 忙到这时候准备看一会教学视频睡觉了。
阅读全文
摘要:今天去看了看知网的数据爬取,有重新构思了一下,准备挑战一下论文的分类和热门的自动分析等等,挑战一下先。
阅读全文
摘要:CSDN:https://blog.csdn.net/wyqwilliam/article/details/90581159
阅读全文
摘要:通过今天的学习总算对知识图谱有了一点理解。 今天看老师的视频是把一个关于医疗的名词进行自动分类的项目,视频里面的老师梳理项目的整体思路时,终于是茅塞顿开。 感觉和图像识别是非常的相似,对名词进行标注,制作数据集,通过算法训练数据集,一般将字或词通过工具,映射为300维的向量,来进行卷积神经网络的输入
阅读全文
摘要:今天我进行了选题,很多题目都没有经验,不知道能做到什么程度,所以最后决定选择了一道和知识图谱有关的题目,数据的获取和数据集的制作依旧是最大的问题。
阅读全文
摘要:今天依旧进行了算法的学习,还是云里雾里的,特别不理解这个知识图谱,是怎么一个推理流程,是词映射吗,用户问一句,就映射为一个答案吗。 听视频里讲解上下文卷积,转化为词向量,还是云里雾里,主要还是花的时间太少,明天我会继续努力的。
阅读全文
摘要:今天没有很多时间去看,大致了解了一下算法,crf,rnn等等。 看的云里雾里的,明天争取花多点时间看看知识图谱。
阅读全文
摘要:使用python的urllib来抓取网页很容易被当作爬虫来对待 下面是一个使用urllib的例子: import urllib.request url = 'http://www.jianshu.com/p/99747a2f29f7' headers = { 'Connection': 'Keep-
阅读全文
摘要:今天继续学习知识图谱。 今天通过观看老师给的学习资料,对知识图谱的数据集制作有了一定的了解,由于还有别的事情,所以今天只了解了这部分。 大致分为数据的获取,标注方法的编写,以及最终的标注。 目标可以标准实体达到100%,这里就不作详细说明了,因为学习资料不是开源的。
阅读全文
摘要:今天老师开了个会,对毕设做了安排,老师推荐我们做知识图谱方面的内容,所以我去网上查阅了相关的资料,先进行了简单的了解。 人们想要机器可以像人一样进行逻辑分析,那么知识图谱就是旨在解决这一类问题。 通过对历史数据的处理,赋予机器处理信息的能力。 下面摘自知乎:https://zhuanlan.zhih
阅读全文

浙公网安备 33010602011771号