自然语言处理 - 文章分类 - sxron

【转】从CNN视角看在自然语言处理上的应用

摘要：前言：卷积神经网络（Convolutional Neural Network）最早是应用在计算机视觉当中，而如今CNN也早已应用于自然语言处理（Natural Language Processing）的各种任务。本文主要以CMU CS 11-747（Neural Networks for NLP）课阅读全文

posted @ 2017-10-24 20:27 sxron 阅读(289) 评论(0) 推荐(0)

【转】自然语言处理中的Encoder-Decoder模型，基本Sequence to Sequence模型及Attention Model注意力模型

摘要：注：本文出自Bin的专栏blog.csdn.NET/xbinworld。 Encoder-Decoder（编码-解码）是深度学习中非常常见的一个模型框架，比如无监督算法的auto-encoding就是用编码-解码的结构设计并训练的；比如这两年比较热的image caption的应用，就是CNN-RN 阅读全文

posted @ 2017-06-17 11:18 sxron 阅读(4386) 评论(0) 推荐(0)

LambdaMART简介——基于Ranklib源码

摘要：学习Machine Learning，阅读文献，看各种数学公式的推导，其实是一件很枯燥的事情。有的时候即使理解了数学推导过程，也仍然会一知半解，离自己写程序实现，似乎还有一道鸿沟。所幸的是，现在很多主流的Machine Learning方法，网上都有open source的实现，进一步的阅读这些源码阅读全文

posted @ 2017-05-01 22:24 sxron 阅读(559) 评论(0) 推荐(0)

【转】LambdaMART 介绍

摘要：传统的搜索引擎排序（Ranking）问题，通常会涉及到很多的排序策略。这些策略根据不同的特征，在不同的适用范围中起作用。因此，一个传统的排序算法，至少涉及到两方面的内容：策略的制定，以及不同策略的组合。策略的组合需要考虑策略分析适用的特征，以及相应策略的适用情况。根据这些内容，通过人工或者半机器半人阅读全文

posted @ 2017-05-01 10:12 sxron 阅读(1510) 评论(0) 推荐(0)

【转】命名实体识别方法

摘要：最近在学习命名实体识别，在查阅资料的同时，对命名实体识别的概念以及常用方法做了一下整理汇总，方便以后学习和查阅。命名实体识别(Named EntitiesRecognition, NER)是自然语言处理(Natural LanguageProcessing, NLP)的一个基础任务。其目的是识别语阅读全文

posted @ 2017-02-14 22:33 sxron 阅读(889) 评论(0) 推荐(0)

中文分词算法总结

摘要：中文分词算法是指将一个汉字序列切分成一个一个单独的词，与英文以空格作为天然的分隔符不同，中文字符在语义识别时，需要把数个字符组合成词，才能表达出真正的含义。分词算法是文本挖掘的基础，通常应用于自然语言处理、搜索引擎、智能推荐等领域。一、分词算法分类中文分词算法大概分为三大类，第一类是基于字符串阅读全文

posted @ 2017-02-12 21:46 sxron 阅读(10931) 评论(0) 推荐(3)

【转】使用RNN解决NLP中序列标注问题的通用优化思路

摘要：序列标注问题应该说是自然语言处理中最常见的问题，而且很可能是最而没有之一。在深度学习没有广泛渗透到各个应用领域之前，传统的最常用的解决序列标注问题的方案是最大熵、CRF等模型，尤其是CRF，基本是最主流的方法。随着深度学习的不断探索和发展，很可能RNN模型会取代CRF的传统霸主地位，会成为解决序列标阅读全文

posted @ 2016-02-24 19:59 sxron 阅读(1447) 评论(0) 推荐(0)

文章分类 - 自然语言处理