11 2019 档案
摘要:观点分析的主要任务和内容: 主要任务:观点和倾向性识别; 观点要素抽取; 观点检索 观点识别的内容有:观点识别; 极性判断
阅读全文
摘要:本节内容主要参考于微信公众号"CS的陋室"的相关内容。 一 作者的NLP学习之路1 机器学习:《统计学习方法》,雷明的《机器学习与应用》,塞巴斯蒂安的《Python机器学习》,sklearn的API文档 深度学习:黄文坚《tensorflow实战》,tensorflow技术解析与实战,《keras深
阅读全文
摘要:进程:是操作系统的一种抽象概念,表示正在进行的程序。 所有的操作系统都有对于进程的控制和调度。Linux内核中含有一些重要的进程信息:进程的内存地址,进程的当前状态,进程正在使用的资源,进程的优先级(谦让度),进程的属主。 1. 进程的属性 PID:进程的ID号。即用来标识一个进程。 PPID:父进
阅读全文
摘要:与系统相关的命令: #ifconfig、exit ifconfig #查看本机IP地址信息 exit #退出并关闭Linux终端
阅读全文
摘要:介绍Stacking、Bagging和Boosting三种方式。 一、Stacking 思想:由原始的训练集训练出若干个单模型,将单模型的输出结果作为样本特征进行整合,并把原始样本标记作为新数据样本标记,生成新的训练集。再根据训练集训练一个新模型,并对样本进行预测。 注意:模型训练时,如果直接使用一
阅读全文
摘要:相关的实现命令: 1. 文件权限 使用ls -l查看文件或文件夹的权限后,会出现10个字符的字符串。例如drwxr-xr-x,具体的含义如下: Type:d,User:rwx,Group:r-x,Others:r-x。其中,r:read, w:write, x:execute(执行)。 (1)Typ
阅读全文
摘要:nano是linux 的一款文字编辑工具,我们可以拿它来做最基本的 terminal 端的文本编辑,甚至可以写代码。 简单的操作如下所示: touch t.py #创建文件 nano t.py #编辑脚本 按照"Ctrl+x"来保存并退出 python3 t.py #执行脚本
阅读全文
摘要:HDFS常用的文件操作: hadoop fs -ls <path> #显示<path>所指定的文件的详细信息 hadoop fs -mkdir <path> #创建<path>所指定的文件夹 hadoop fs -cat <path> #将<path>所指定的文件夹的内容输出到标准输出(stdout
阅读全文
摘要:SparkSQL的相关语句: cast (expression as data_type): 数据类型转换,将expression转换为所需要的类型data_type。 left outer join: 左外连接,以左侧的为准。 例如:select ,,from a left outer join
阅读全文
摘要:文件/目录操作命令: #cd:跳转到指定目录 cd /home/hadoop #把/home/hadoop设置为当前目录 cd ../ #返回上一级目录 cd ../.. #返回上两级目录 cd ~ #进入到当前Linux系统登录用户的主目录(或主文件夹)。在 Linux 系统中,~代表的是用户的主
阅读全文
摘要:与vim相关的常用命令: #安装vim: sudo apt-get install vim #创建文件: vim word.txt #打开文件: vim word.txt 或者cat word.txt #编辑 Esc:退出编辑 i:编辑 :q!:退出且不保存 wq:退出且保存 """ 注意:在Lin
阅读全文
摘要:Git的常用操作: git checkout -b 本地分支 #创建本地的分支—本地分支,并切换到该分支下。 git branch --set-upstream-to=origin/远程分支 本地分支 #本地分支关联上origin/远程分支。 git pull #本地分支与origin/远程分支进行
阅读全文
浙公网安备 33010602011771号