文章分类 -  自然语言处理

【转】从CNN视角看在自然语言处理上的应用
摘要:前言:卷积神经网络(Convolutional Neural Network)最早是应用在计算机视觉当中,而如今CNN也早已应用于自然语言处理(Natural Language Processing)的各种任务。本文主要以CMU CS 11-747(Neural Networks for NLP)课 阅读全文
posted @ 2017-10-24 20:27 sxron 阅读(289) 评论(0) 推荐(0)
【转】自然语言处理中的Encoder-Decoder模型,基本Sequence to Sequence模型及Attention Model注意力模型
摘要:注:本文出自Bin的专栏blog.csdn.NET/xbinworld。 Encoder-Decoder(编码-解码)是深度学习中非常常见的一个模型框架,比如无监督算法的auto-encoding就是用编码-解码的结构设计并训练的;比如这两年比较热的image caption的应用,就是CNN-RN 阅读全文
posted @ 2017-06-17 11:18 sxron 阅读(4386) 评论(0) 推荐(0)
LambdaMART简介——基于Ranklib源码
摘要:学习Machine Learning,阅读文献,看各种数学公式的推导,其实是一件很枯燥的事情。有的时候即使理解了数学推导过程,也仍然会一知半解,离自己写程序实现,似乎还有一道鸿沟。所幸的是,现在很多主流的Machine Learning方法,网上都有open source的实现,进一步的阅读这些源码 阅读全文
posted @ 2017-05-01 22:24 sxron 阅读(559) 评论(0) 推荐(0)
【转】LambdaMART 介绍
摘要:传统的搜索引擎排序(Ranking)问题,通常会涉及到很多的排序策略。这些策略根据不同的特征,在不同的适用范围中起作用。因此,一个传统的排序算法,至少涉及到两方面的内容:策略的制定,以及不同策略的组合。策略的组合需要考虑策略分析适用的特征,以及相应策略的适用情况。根据这些内容,通过人工或者半机器半人 阅读全文
posted @ 2017-05-01 10:12 sxron 阅读(1510) 评论(0) 推荐(0)
【转】 命名实体识别方法
摘要:最近在学习命名实体识别,在查阅资料的同时,对命名实体识别的概念以及常用方法做了一下整理汇总,方便以后学习和查阅。 命名实体识别(Named EntitiesRecognition, NER)是自然语言处理(Natural LanguageProcessing, NLP)的一个基础任务。其目的是识别语 阅读全文
posted @ 2017-02-14 22:33 sxron 阅读(889) 评论(0) 推荐(0)
中文分词算法总结
摘要:中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、 分词算法分类 中文分词算法大概分为三大类,第一类是基于字符串 阅读全文
posted @ 2017-02-12 21:46 sxron 阅读(10931) 评论(0) 推荐(3)
【转】使用RNN解决NLP中序列标注问题的通用优化思路
摘要:序列标注问题应该说是自然语言处理中最常见的问题,而且很可能是最而没有之一。在深度学习没有广泛渗透到各个应用领域之前,传统的最常用的解决序列标注问题的方案是最大熵、CRF等模型,尤其是CRF,基本是最主流的方法。随着深度学习的不断探索和发展,很可能RNN模型会取代CRF的传统霸主地位,会成为解决序列标 阅读全文
posted @ 2016-02-24 19:59 sxron 阅读(1447) 评论(0) 推荐(0)