摘要: 概述 Word2vec是一款由谷歌发布开源的自然语言处理算法,其目的是把words转换成vectors,从而可以用数学的方法来分析words之间的关系。Spark其该算法进行了封装,并在mllib中实现。 整体流程是spark离线训练模型,可以是1小时1训练也可以1天1训练,根据具体业务来判断,sp 阅读全文
posted @ 2017-05-16 21:17 ulysses_you 阅读(3448) 评论(0) 推荐(0)