摘要: 观点分析的主要任务和内容: 主要任务:观点和倾向性识别; 观点要素抽取; 观点检索 观点识别的内容有:观点识别; 极性判断 阅读全文
posted @ 2019-11-26 23:09 PasPerCon 阅读(304) 评论(0) 推荐(0)
摘要: 本节内容主要参考于微信公众号"CS的陋室"的相关内容。 一 作者的NLP学习之路1 机器学习:《统计学习方法》,雷明的《机器学习与应用》,塞巴斯蒂安的《Python机器学习》,sklearn的API文档 深度学习:黄文坚《tensorflow实战》,tensorflow技术解析与实战,《keras深 阅读全文
posted @ 2019-11-26 23:05 PasPerCon 阅读(148) 评论(0) 推荐(0)
摘要: 进程:是操作系统的一种抽象概念,表示正在进行的程序。 所有的操作系统都有对于进程的控制和调度。Linux内核中含有一些重要的进程信息:进程的内存地址,进程的当前状态,进程正在使用的资源,进程的优先级(谦让度),进程的属主。 1. 进程的属性 PID:进程的ID号。即用来标识一个进程。 PPID:父进 阅读全文
posted @ 2019-11-26 23:04 PasPerCon 阅读(297) 评论(0) 推荐(0)
摘要: 与系统相关的命令: #ifconfig、exit ifconfig #查看本机IP地址信息 exit #退出并关闭Linux终端 阅读全文
posted @ 2019-11-26 22:58 PasPerCon 阅读(163) 评论(0) 推荐(0)
摘要: 介绍Stacking、Bagging和Boosting三种方式。 一、Stacking 思想:由原始的训练集训练出若干个单模型,将单模型的输出结果作为样本特征进行整合,并把原始样本标记作为新数据样本标记,生成新的训练集。再根据训练集训练一个新模型,并对样本进行预测。 注意:模型训练时,如果直接使用一 阅读全文
posted @ 2019-11-26 22:56 PasPerCon 阅读(318) 评论(0) 推荐(0)
摘要: 相关的实现命令: 1. 文件权限 使用ls -l查看文件或文件夹的权限后,会出现10个字符的字符串。例如drwxr-xr-x,具体的含义如下: Type:d,User:rwx,Group:r-x,Others:r-x。其中,r:read, w:write, x:execute(执行)。 (1)Typ 阅读全文
posted @ 2019-11-26 22:54 PasPerCon 阅读(4200) 评论(0) 推荐(0)
摘要: nano是linux 的一款文字编辑工具,我们可以拿它来做最基本的 terminal 端的文本编辑,甚至可以写代码。 简单的操作如下所示: touch t.py #创建文件 nano t.py #编辑脚本 按照"Ctrl+x"来保存并退出 python3 t.py #执行脚本 阅读全文
posted @ 2019-11-26 22:51 PasPerCon 阅读(270) 评论(0) 推荐(0)
摘要: HDFS常用的文件操作: hadoop fs -ls <path> #显示<path>所指定的文件的详细信息 hadoop fs -mkdir <path> #创建<path>所指定的文件夹 hadoop fs -cat <path> #将<path>所指定的文件夹的内容输出到标准输出(stdout 阅读全文
posted @ 2019-11-26 22:49 PasPerCon 阅读(168) 评论(0) 推荐(0)
摘要: SparkSQL的相关语句: cast (expression as data_type): 数据类型转换,将expression转换为所需要的类型data_type。 left outer join: 左外连接,以左侧的为准。 例如:select ,,from a left outer join  阅读全文
posted @ 2019-11-26 22:46 PasPerCon 阅读(121) 评论(0) 推荐(0)
摘要: 文件/目录操作命令: #cd:跳转到指定目录 cd /home/hadoop #把/home/hadoop设置为当前目录 cd ../ #返回上一级目录 cd ../.. #返回上两级目录 cd ~ #进入到当前Linux系统登录用户的主目录(或主文件夹)。在 Linux 系统中,~代表的是用户的主 阅读全文
posted @ 2019-11-26 22:40 PasPerCon 阅读(273) 评论(0) 推荐(0)