摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat 阅读全文
posted @ 2017-10-18 21:48 26黄培康 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1、获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数 2、获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数;获取所有新闻列表页的网址,调用上述函数 英国赫尔大学商学院副院长Mr. Lynne Brrow一行来我校访问交流 4920广东省教育厅高教处领导莅临我校调研 阅读全文
posted @ 2017-10-11 19:53 26黄培康 阅读(419) 评论(0) 推荐(0) 编辑
摘要: 习题1:用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源 代码; 结果: 习题2:选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备 练习1、对于校园新闻网的练习 练习2、 3 BeautifulSoup对象属性 soup.p 阅读全文
posted @ 2017-09-27 11:37 26黄培康 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: 1、中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) a、关于这门课的相关工作经历 b、自己对于这门课的看法 2、中文分词 a、之前的英文练习将要测试词频的文章放在一个TXT里, 然后引用 结果如下 b、测试jieba c、这次我选择的是对于小说雪山飞狐的 阅读全文
posted @ 2017-09-25 13:30 26黄培康 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 1、由字符串创建一个作业评分表,做增删改查询统计遍历操作,例如查询第一个3分的下标,统计1分的同学有几个,3分的同学有几个,增删改查等等。 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3、列表,元组,字典,集合的遍历,总结列表,元组,字典,集合的联系与区别。 list:是一种有序的序列 阅读全文
posted @ 2017-09-20 11:38 26黄培康 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 99乘法表 中国GDP 12星座 凯撒密码(+3) {}的格式控制<序号><填充><对齐>宽度<千分位><精度><类型> 输入姓名,格式输出:占4位、居中、不足4字的以空格填充 下载一首英文的歌词或文章,统计单词出现的次数,将所有,.?!替换为空格,将所有大写转换为小写 用webbrowser打开校 阅读全文
posted @ 2017-09-18 11:40 26黄培康 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 注意标准库的两种导入与使用方式,建议大家采用<库名>.<函数名>的方式。 对前面的代码进行优化,用for,while,if,def实现: 用函数定义画钻石花瓣的太阳花 阅读全文
posted @ 2017-09-13 20:10 26黄培康 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 思考: 阅读全文
posted @ 2017-09-06 11:48 26黄培康 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 1 .浏览百度指数,阿里指数,微指数等网站。 http://index.baidu.com/ https://alizs.taobao.com/ http://www.weizhishu.com/ 2.关于服务业与旅游的大数据分析 关于在广州的美食与旅游之间的趋势研究 关于在广州的美食与旅游之间的需 阅读全文
posted @ 2017-09-04 12:55 26黄培康 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 实验三进程调度模拟程序2.0 一、实验目的 用高级语言完成一个进程调度程序,以加深对进程的概念及进程调度算法的理解。 二、实验要求 设计一个有 N个进程并发执行的进程调度模拟程序。 1.模拟进程数据的生成 允许用户指定作业的个数(2-24),默认值为5。 允许用户选择输入每个进程的到达时间,所需运行 阅读全文
posted @ 2016-05-21 09:12 26黄培康 阅读(293) 评论(0) 推荐(0) 编辑