上一页 1 2 3 4 5 6 ··· 10 下一页

2014年5月16日

摘要: Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 K 维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec输出的词向量可以被用来做很多 NLP 相关的工作,比如聚类、找同义词、词性分析等等。如果换个思路, 把词当做特征,那么Word2vec就可以把特征映射到 K 维向量空间,可以为文本数据寻求更加深层次的特征表示。 阅读全文
posted @ 2014-05-16 19:59 小唯THU 阅读(76646) 评论(0) 推荐(6) 编辑

2014年5月15日

摘要: Java版本如果在Scala工程中混入Java类导致java版本不match,可能会抛错java.lang.UnsupportedClassVersionError: XXXUnsupported major.minor version 51.0在build.sbt中加入javacOptions +... 阅读全文
posted @ 2014-05-15 19:59 小唯THU 阅读(992) 评论(0) 推荐(0) 编辑

2014年5月14日

摘要: 最近忙得忘乎所以,写篇博客放松放松,RT,直接上命令好了# Localssh-keygen -t rsascp ~/.ssh/id_rsa.pub username@server:~/.ssh/vi ~/.ssh/config加入:Host nickname #别名,域名缩写HostName XX ... 阅读全文
posted @ 2014-05-14 09:56 小唯THU 阅读(1731) 评论(0) 推荐(0) 编辑

2014年3月24日

摘要: 把你从写繁琐的Map-reduce Job中解放出来,写分布式跟写本地程序没两样,Scalding真真代表着先进生产力的方向啊心动不如行动,赶紧装一个吧1 安装JDK2 安装Homebrewruby -e "$(curl -fsSL https://raw.github.com/Homebrew/homebrew/go/install)"brew updatebrew doctor方法1:http... 阅读全文
posted @ 2014-03-24 03:03 小唯THU 阅读(1029) 评论(0) 推荐(0) 编辑

2014年3月23日

摘要: 输入文件Scalding既可以处理HDFS上的数据,也可以很方便地在本地运行处理一些test case便于debug,Source有好多种1 TextLine(filename)TextLine(args("input"))或者TextLine("~/data/input.txt")对每行数据,产生... 阅读全文
posted @ 2014-03-23 20:35 小唯THU 阅读(2766) 评论(0) 推荐(0) 编辑

2014年3月18日

摘要: 换了好几回Terminal默认的配色,真是难看哭了,作为一只有生活追求的序媛,当然不能安(zuo)之(yi)若(dai)素(bi)了1 自定义 Terminal问候语sudo pico /etc/motd在编辑器中输入你想要显示的问候语,输入完成后按 control-x 执行退出,接着输入字母 “y... 阅读全文
posted @ 2014-03-18 21:34 小唯THU 阅读(1434) 评论(0) 推荐(0) 编辑

2014年3月4日

摘要: 把你从写繁琐的Map-reduce Job中解放出来,写分布式跟写本地程序没两样,Scala真真代表着先进生产力的方向啊。好的,今天开始直播基于Scala的Scalding啦,循序渐进地看以下页面:https://github.com/twitter/scalding#scaldinghttps:/... 阅读全文
posted @ 2014-03-04 15:14 小唯THU 阅读(1467) 评论(0) 推荐(0) 编辑

2014年2月21日

摘要: Scala的基本概念先讲讲Scala里头几个概念Classes, Traits, Objects and Packages。Class和Java中的很像,只不过Scala中Class不能有static members。还有个叫做case的特殊类。Object跟Class也很像,只不过它只能有一个in... 阅读全文
posted @ 2014-02-21 18:05 小唯THU 阅读(2278) 评论(1) 推荐(0) 编辑

2014年2月20日

摘要: A non-empty zero-indexed string S is given. String S consists of N characters from the set of upper-case English lettersA, C, G, T.This string actually represents a DNA sequence, and the upper-case letters represent single nucleotides(核苷).You are also given non-empty zero-indexed arrays P and Q cons 阅读全文
posted @ 2014-02-20 22:14 小唯THU 阅读(1355) 评论(0) 推荐(0) 编辑
摘要: A non-empty zero-indexed array A consisting of N integers is given. The consecutive elements of array A represent consecutive cars on a road.Array A contains only 0s and/or 1s:0 represents a car traveling east,1 represents a car traveling west.The goal is to count passing cars. We say that a pair of 阅读全文
posted @ 2014-02-20 20:47 小唯THU 阅读(970) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页

导航