博客园 - 201506110167陈广鹏
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=120559
2018-05-21T14:50:45Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
feed.cnblogs.com
https://www.cnblogs.com/chenguangpeng/p/9064727.html
Hadoop综合大作业 - 201506110167陈广鹏
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。 启动hive: 将网络爬虫大作业产生的文件cgpword.txt上传至hdfs: 创建原始文档表: 导入文件数据: 进行词频统计,结果放在表cgp_count里: 查看统计结果: 2.用Hive对爬虫大作业产生
2018-05-20T13:41:00Z
2018-05-20T13:41:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。 启动hive: 将网络爬虫大作业产生的文件cgpword.txt上传至hdfs: 创建原始文档表: 导入文件数据: 进行词频统计,结果放在表cgp_count里: 查看统计结果: 2.用Hive对爬虫大作业产生 <a href="https://www.cnblogs.com/chenguangpeng/p/9064727.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/9046446.html
hive基本操作与应用 - 201506110167陈广鹏
通过hadoop上的hive完成WordCount 启动hadoop Hdfs上创建文件夹 上传文件至hdfs 启动Hive 创建原始文档表 导入文件内容到表docs并查看 进行词频统计,结果放在表word_count里 查看统计结果
2018-05-16T07:58:00Z
2018-05-16T07:58:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】通过hadoop上的hive完成WordCount 启动hadoop Hdfs上创建文件夹 上传文件至hdfs 启动Hive 创建原始文档表 导入文件内容到表docs并查看 进行词频统计,结果放在表word_count里 查看统计结果 <a href="https://www.cnblogs.com/chenguangpeng/p/9046446.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/9012265.html
用mapreduce 处理气象数据集 - 201506110167陈广鹏
用mapreduce 处理气象数据集 编写程序求每日最高最低气温,区间最高最低气温 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa 按学号后三位下载不同年份月份的数据(例如201506110136号同学,就下载2013年以6开头的数据,看具体数据情况
2018-05-09T00:28:00Z
2018-05-09T00:28:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】用mapreduce 处理气象数据集 编写程序求每日最高最低气温,区间最高最低气温 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa 按学号后三位下载不同年份月份的数据(例如201506110136号同学,就下载2013年以6开头的数据,看具体数据情况 <a href="https://www.cnblogs.com/chenguangpeng/p/9012265.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/9010208.html
熟悉常用的HBase操作,编写MapReduce作业 - 201506110167陈广鹏
1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据: 学生表(Student)(不包括最后一列) 学号(S_No) 姓名(S_Name) 性别(S_Sex) 年龄(S_Age) 课程(course) 2015001 Zhangsan male 23 2015003
2018-05-08T10:48:00Z
2018-05-08T10:48:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据: 学生表(Student)(不包括最后一列) 学号(S_No) 姓名(S_Name) 性别(S_Sex) 年龄(S_Age) 课程(course) 2015001 Zhangsan male 23 2015003 <a href="https://www.cnblogs.com/chenguangpeng/p/9010208.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8973475.html
爬虫大作业 - 201506110167陈广鹏
1.选一个自己感兴趣的主题。 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 4.对文本分析结果进行解释说明。 5.写一篇完整的博客,描述上述实现过程、遇到的问题及解决办法、数据分析思想及结论。 6.最后提交爬取的全部数据、爬虫及数据分析源代
2018-04-30T05:18:00Z
2018-04-30T05:18:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.选一个自己感兴趣的主题。 2.用python 编写爬虫程序,从网络上爬取相关主题的数据。 3.对爬了的数据进行文本分析,生成词云。 4.对文本分析结果进行解释说明。 5.写一篇完整的博客,描述上述实现过程、遇到的问题及解决办法、数据分析思想及结论。 6.最后提交爬取的全部数据、爬虫及数据分析源代 <a href="https://www.cnblogs.com/chenguangpeng/p/8973475.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8940009.html
熟悉常用的HDFS操作 - 201506110167陈广鹏
编程实现以下指定功能,并利用Hadoop提供的Shell命令完成相同任务: 在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词. 在本地查看文件位置(ls) 在本地显示文件内容 使用命令把本地文件系统中的“txt”上传到HDFS中的当前用户目录
2018-04-25T01:52:00Z
2018-04-25T01:52:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】编程实现以下指定功能,并利用Hadoop提供的Shell命令完成相同任务: 在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词. 在本地查看文件位置(ls) 在本地显示文件内容 使用命令把本地文件系统中的“txt”上传到HDFS中的当前用户目录 <a href="https://www.cnblogs.com/chenguangpeng/p/8940009.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8808712.html
数据结构化与保存 - 201506110167陈广鹏
1. 将新闻的正文内容保存到文本文件。 2. 将新闻数据结构化为字典的列表: 单条新闻的详情-->字典news 一个列表页所有单条新闻汇总-->列表newsls.append(news) 所有列表页的所有新闻汇总列表newstotal.extend(newsls) 3. 安装pandas,用pand
2018-04-12T08:38:00Z
2018-04-12T08:38:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1. 将新闻的正文内容保存到文本文件。 2. 将新闻数据结构化为字典的列表: 单条新闻的详情-->字典news 一个列表页所有单条新闻汇总-->列表newsls.append(news) 所有列表页的所有新闻汇总列表newstotal.extend(newsls) 3. 安装pandas,用pand <a href="https://www.cnblogs.com/chenguangpeng/p/8808712.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8794238.html
获取全部校园新闻 - 201506110167陈广鹏
1.取出一个新闻列表页的全部新闻 包装成函数。 2.获取总的新闻篇数,算出新闻总页数。 3.获取全部新闻列表页的全部新闻详情。 4.找一个自己感兴趣的主题,进行数据爬取,并进行分词分析。(爬取腾讯体育-NBA)
2018-04-11T02:40:00Z
2018-04-11T02:40:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.取出一个新闻列表页的全部新闻 包装成函数。 2.获取总的新闻篇数,算出新闻总页数。 3.获取全部新闻列表页的全部新闻详情。 4.找一个自己感兴趣的主题,进行数据爬取,并进行分词分析。(爬取腾讯体育-NBA) <a href="https://www.cnblogs.com/chenguangpeng/p/8794238.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8707561.html
爬取校园新闻首页的新闻的详情,使用正则表达式,函数抽离 - 201506110167陈广鹏
1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击
2018-04-03T07:11:00Z
2018-04-03T07:11:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文、show-info。 2. 分析info字符串,获取每篇新闻的发布时间,作者,来源,摄影等信息。 3. 将字符串格式的发布时间转换成datetime类型 4. 使用正则表达式取得新闻编号 5. 生成点击 <a href="https://www.cnblogs.com/chenguangpeng/p/8707561.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8671558.html
网络爬虫基础练习 - 201506110167陈广鹏
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(
2018-03-29T10:33:00Z
2018-03-29T10:33:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( <a href="https://www.cnblogs.com/chenguangpeng/p/8671558.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8663251.html
中文词频统计 - 201506110167陈广鹏
下载一长篇中文文章。 从文件读取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安装与使用jieba进行中文分词。 pip install jieba import jieba list(jieba.lcut(news)) 生成词频
2018-03-28T05:00:00Z
2018-03-28T05:00:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】下载一长篇中文文章。 从文件读取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安装与使用jieba进行中文分词。 pip install jieba import jieba list(jieba.lcut(news)) 生成词频 <a href="https://www.cnblogs.com/chenguangpeng/p/8663251.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8617135.html
字符串、组合数据类型练习 - 201506110167陈广鹏
字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news.g
2018-03-21T07:08:00Z
2018-03-21T07:08:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news.g <a href="https://www.cnblogs.com/chenguangpeng/p/8617135.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8571589.html
Python基础之五星红旗 - 201506110167陈广鹏
1 from turtle import * 2 3 def mygoto(x,y): 4 up() 5 goto(x,y) 6 down() 7 8 def draw(r): 9 begin_fill() 10 for i in range(5): 11 forward(r) 12 right(1
2018-03-15T01:14:00Z
2018-03-15T01:14:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1 from turtle import * 2 3 def mygoto(x,y): 4 up() 5 goto(x,y) 6 down() 7 8 def draw(r): 9 begin_fill() 10 for i in range(5): 11 forward(r) 12 right(1 <a href="https://www.cnblogs.com/chenguangpeng/p/8571589.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8555066.html
熟悉常用的Linux操作 - 201506110167陈广鹏
请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local cd /usr/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 ls /usr mkdir命令:新建新
2018-03-13T03:15:00Z
2018-03-13T03:15:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】请按要求上机实践如下linux基本命令。 cd命令:切换目录 (1)切换到目录 /usr/local cd /usr/local (2)去到目前的上层目录 cd .. (3)回到自己的主文件夹 cd ls命令:查看文件与目录 (4)查看目录/usr下所有的文件 ls /usr mkdir命令:新建新 <a href="https://www.cnblogs.com/chenguangpeng/p/8555066.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/8522776.html
大数据概述 - 201506110167陈广鹏
1.试述大数据对思维方式的重要影响。 在大数据时代背景下,数据无所不在,许多过去难以量化的信息都将转化为数据进行存储和处理。通过大数据时代的数据储备和技术理念,以前所未有的方式洞见事物的发展趋势,进而影响人们的价值体系、知识体系和生活方式。在大数据时代开启伊始的今天,能否激发和利用隐藏于数据内部尚未
2018-03-07T07:37:00Z
2018-03-07T07:37:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.试述大数据对思维方式的重要影响。 在大数据时代背景下,数据无所不在,许多过去难以量化的信息都将转化为数据进行存储和处理。通过大数据时代的数据储备和技术理念,以前所未有的方式洞见事物的发展趋势,进而影响人们的价值体系、知识体系和生活方式。在大数据时代开启伊始的今天,能否激发和利用隐藏于数据内部尚未 <a href="https://www.cnblogs.com/chenguangpeng/p/8522776.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/6188352.html
递归下降语法分析器 - 201506110167陈广鹏
实验三.递归下降语法分析程序 专业 商业软件工程 姓名 陈广鹏 学号201506110167 一、 实验目的 通过设计、编制、调试递归下降语法分析程序,对输入的符号串进行分析匹配,观察输入符号串是否为给定文法的句子。 二、 实验内容和要求 递归下降分析法是一种自顶向下的分析方法,文法的每个非终结符对
2016-12-16T12:49:00Z
2016-12-16T12:49:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】实验三.递归下降语法分析程序 专业 商业软件工程 姓名 陈广鹏 学号201506110167 一、 实验目的 通过设计、编制、调试递归下降语法分析程序,对输入的符号串进行分析匹配,观察输入符号串是否为给定文法的句子。 二、 实验内容和要求 递归下降分析法是一种自顶向下的分析方法,文法的每个非终结符对 <a href="https://www.cnblogs.com/chenguangpeng/p/6188352.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/6009423.html
关于c语言的文法分析问题 - 201506110167陈广鹏
<程序> -> <声明> | <程序> <函数> <声明> -> #include<stdio.h>|#include<string.h>|............ <函数> -> <修饰符> <标识符> <形参> <复合语句> <修饰符>-> void | char | int | double
2016-10-28T13:06:00Z
2016-10-28T13:06:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】<程序> -> <声明> | <程序> <函数> <声明> -> #include<stdio.h>|#include<string.h>|............ <函数> -> <修饰符> <标识符> <形参> <复合语句> <修饰符>-> void | char | int | double <a href="https://www.cnblogs.com/chenguangpeng/p/6009423.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/5960483.html
实验一、词法分析实验 - 201506110167陈广鹏
实验一、词法分析实验 专业:商软二班 姓名:陈广鹏 学号:201506110167 一、 实验目的 编制一个词法分析程序。 二、 实验内容和要求 a) 输入:源程序字符串 b) 输出:二元组(种别,单词符号本身) c) 要求:对字符串表示的源程序 从左到右进行扫描和分解 根据词法规则 识别出一个一个
2016-10-14T06:58:00Z
2016-10-14T06:58:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】实验一、词法分析实验 专业:商软二班 姓名:陈广鹏 学号:201506110167 一、 实验目的 编制一个词法分析程序。 二、 实验内容和要求 a) 输入:源程序字符串 b) 输出:二元组(种别,单词符号本身) c) 要求:对字符串表示的源程序 从左到右进行扫描和分解 根据词法规则 识别出一个一个 <a href="https://www.cnblogs.com/chenguangpeng/p/5960483.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/5925044.html
词法分析程序 - 201506110167陈广鹏
1.词法分析程序的功能: 输入:所给文法的源程序字符串。 输出:二元组构成的序列。 其中:syn为单词种别码。 token为存放的单词自身字符串。 2.符号与种别码的对照表 3.词法规则 <字母> A a|b|c|……y|z<数字> A→1|2|3|4|5|6|7|8|9S→A|SA|SA0 <整数
2016-09-30T14:03:00Z
2016-09-30T14:03:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.词法分析程序的功能: 输入:所给文法的源程序字符串。 输出:二元组构成的序列。 其中:syn为单词种别码。 token为存放的单词自身字符串。 2.符号与种别码的对照表 3.词法规则 <字母> A a|b|c|……y|z<数字> A→1|2|3|4|5|6|7|8|9S→A|SA|SA0 <整数 <a href="https://www.cnblogs.com/chenguangpeng/p/5925044.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/chenguangpeng/p/5856819.html
编译原理的几个问题的回答 - 201506110167陈广鹏
1.编译原理是计算机专业的一门重要专业课,旨在介绍编译程序构造的一般原理和基本方法。内容包括语言和文法、词法分析、语法分析、语法制导翻译、中间代码生成、存储管理、代码优化和目标代码生成。 编译原理是计算机专业设置的一门重要的专业课程.2.编译原理基本上是计算机科学与技术专业本科段最难的课程了,算法很
2016-09-09T07:28:00Z
2016-09-09T07:28:00Z
201506110167陈广鹏
https://www.cnblogs.com/chenguangpeng/
【摘要】1.编译原理是计算机专业的一门重要专业课,旨在介绍编译程序构造的一般原理和基本方法。内容包括语言和文法、词法分析、语法分析、语法制导翻译、中间代码生成、存储管理、代码优化和目标代码生成。 编译原理是计算机专业设置的一门重要的专业课程.2.编译原理基本上是计算机科学与技术专业本科段最难的课程了,算法很 <a href="https://www.cnblogs.com/chenguangpeng/p/5856819.html" target="_blank">阅读全文</a>