03 2018 档案

摘要:在深度学习中,文本分类的主要原型:Text  label,坐边是输入端“X”,右边是输出端“Y”。行业baseline:用BoW(bag of words)表示sentences(如何将文本表达成一个数字的形式),然后用LR或者SVM做回归。中英文做自然语言处理主要区别,中文需要分词(启发式Heu 阅读全文
posted @ 2018-03-19 23:04 fionaplanet 阅读(481) 评论(0) 推荐(0)
摘要:一、单机版本Spark安装 Win10下安装Spark2.2.1 1. 工具准备 JDK 8u161 with NetBeans 8.2: http://www.oracle.com/technetwork/java/javase/downloads/jdk-netbeans-jsp-142931. 阅读全文
posted @ 2018-03-07 22:30 fionaplanet 阅读(2611) 评论(0) 推荐(0)