随笔分类 -  大数据&AI

摘要:参考: https://msdn.microsoft.com/zh-cn/library/mt146806.aspx 首先你需要一个Microsoft的帐号,如果没有在这里注册一下 https://signup.live.com/signup 感叹一下微软的验证码复杂的绝对比12306牛逼。 注册成 阅读全文
posted @ 2017-08-31 10:48 胖喵~ 阅读(13662) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2017-08-15 12:50 胖喵~ 阅读(24) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2017-08-15 10:26 胖喵~ 阅读(24) 评论(0) 推荐(0)
摘要:分词技术目前已经在机器翻译领域广泛使用。今天我们说说分句。 分句的作用主要用在,当我们给翻译引擎一大段文字的时候,它很有可能就搞不定了,因为一般需要将分句后的句子送给引擎,引擎在翻译完后再将结果拼起来。 这里找到一个开源的分句,我们一起来看看它: https://github.com/Tessmor 阅读全文
posted @ 2017-06-07 16:52 胖喵~ 阅读(1657) 评论(1) 推荐(0)
摘要:◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/6554340.html 前言 google的翻译不得不承认它是比较好的。但是google翻译对外提供的翻译接口都是收钱的,做为一名普普通通的开发者,囊中羞涩,因 阅读全文
posted @ 2017-03-24 18:07 胖喵~ 阅读(69053) 评论(29) 推荐(4)
摘要:之所以研究这个算法,是因为最近在研究NLP中文的分词,所谓分词就是将一个完整的句子,例如“计算语言学课程有意思”,分解成一些词组单元“计算语言学,课程,有,意思”。 “最大匹配法” 在中文分词中有所应用,因此这里介绍一下。 “最大匹配法” 分为正向匹配和逆向匹配,这里先看正向匹配。 算法思想: 正向 阅读全文
posted @ 2017-02-24 15:16 胖喵~ 阅读(19628) 评论(0) 推荐(3)
摘要:◆版权声明:本文出自胖喵~的博客,转载必须注明出处。 转载请注明出处:http://www.cnblogs.com/by-dream/p/6040651.html 大数据时代,数据对我们来说就是一笔宝贵的财富,以机器翻译来说,第一步呢需要收集目前大量的中英文翻译的原句子,而这些句子我们应该去哪里得到 阅读全文
posted @ 2016-11-07 21:06 胖喵~ 阅读(830) 评论(2) 推荐(0)