【转】从CNN视角看在自然语言处理上的应用
摘要:前言:卷积神经网络(Convolutional Neural Network)最早是应用在计算机视觉当中,而如今CNN也早已应用于自然语言处理(Natural Language Processing)的各种任务。本文主要以CMU CS 11-747(Neural Networks for NLP)课
阅读全文
posted @
2017-10-24 20:27
sxron
阅读(289)
推荐(0)
【转】自然语言处理中的Encoder-Decoder模型,基本Sequence to Sequence模型及Attention Model注意力模型
摘要:注:本文出自Bin的专栏blog.csdn.NET/xbinworld。 Encoder-Decoder(编码-解码)是深度学习中非常常见的一个模型框架,比如无监督算法的auto-encoding就是用编码-解码的结构设计并训练的;比如这两年比较热的image caption的应用,就是CNN-RN
阅读全文
posted @
2017-06-17 11:18
sxron
阅读(4386)
推荐(0)
LambdaMART简介——基于Ranklib源码
摘要:学习Machine Learning,阅读文献,看各种数学公式的推导,其实是一件很枯燥的事情。有的时候即使理解了数学推导过程,也仍然会一知半解,离自己写程序实现,似乎还有一道鸿沟。所幸的是,现在很多主流的Machine Learning方法,网上都有open source的实现,进一步的阅读这些源码
阅读全文
posted @
2017-05-01 22:24
sxron
阅读(559)
推荐(0)
【转】LambdaMART 介绍
摘要:传统的搜索引擎排序(Ranking)问题,通常会涉及到很多的排序策略。这些策略根据不同的特征,在不同的适用范围中起作用。因此,一个传统的排序算法,至少涉及到两方面的内容:策略的制定,以及不同策略的组合。策略的组合需要考虑策略分析适用的特征,以及相应策略的适用情况。根据这些内容,通过人工或者半机器半人
阅读全文
posted @
2017-05-01 10:12
sxron
阅读(1510)
推荐(0)
【转】 命名实体识别方法
摘要:最近在学习命名实体识别,在查阅资料的同时,对命名实体识别的概念以及常用方法做了一下整理汇总,方便以后学习和查阅。 命名实体识别(Named EntitiesRecognition, NER)是自然语言处理(Natural LanguageProcessing, NLP)的一个基础任务。其目的是识别语
阅读全文
posted @
2017-02-14 22:33
sxron
阅读(889)
推荐(0)
中文分词算法总结
摘要:中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、 分词算法分类 中文分词算法大概分为三大类,第一类是基于字符串
阅读全文
posted @
2017-02-12 21:46
sxron
阅读(10931)
推荐(3)
【转】使用RNN解决NLP中序列标注问题的通用优化思路
摘要:序列标注问题应该说是自然语言处理中最常见的问题,而且很可能是最而没有之一。在深度学习没有广泛渗透到各个应用领域之前,传统的最常用的解决序列标注问题的方案是最大熵、CRF等模型,尤其是CRF,基本是最主流的方法。随着深度学习的不断探索和发展,很可能RNN模型会取代CRF的传统霸主地位,会成为解决序列标
阅读全文
posted @
2016-02-24 19:59
sxron
阅读(1447)
推荐(0)