代码改变世界

[置顶]python爬取百度图片——翻页式网站爬取

2019-03-19 22:16 by water_chen, 3609 阅读, 1 推荐, 收藏, 编辑
摘要:小编大约于这个月月初写的这一份代码,但很不幸,大概20号,再次找百度图片翻页流的时候,发现是瀑布流且回不去了,还好代码里面留了翻页流的网址 所以,现在来分享给大家。 语言:python3.6 库:requests, re, urllib 除了requests需要pip install之外,其他两个是 阅读全文

[置顶]python硬刚倒排索引

2018-12-20 09:42 by water_chen, 1859 阅读, 0 推荐, 收藏, 编辑
摘要:需要导入的库:jieba, json json是python自带的库,jieba只需要在命令行输入pip install jieba即可 本代码采用直接硬刚倒排索引,可能会引起稍微不适,请选用。 代码分为三部分:分词、创建正排索引、创建倒排索引 需要文件:语料库、停用词库(停用词库请自行搜索即可) 阅读全文

python爬取百度图片——翻页式网站爬取

2019-03-19 22:16 by water_chen, 3609 阅读, 1 推荐, 收藏, 编辑
摘要:小编大约于这个月月初写的这一份代码,但很不幸,大概20号,再次找百度图片翻页流的时候,发现是瀑布流且回不去了,还好代码里面留了翻页流的网址 所以,现在来分享给大家。 语言:python3.6 库:requests, re, urllib 除了requests需要pip install之外,其他两个是 阅读全文

第五章作业

2018-12-22 23:36 by water_chen, 141 阅读, 0 推荐, 收藏, 编辑
摘要:一。对回溯算法的理解 回溯的实质是在问题的解空间进行深度优先搜索,在深度搜索时,向下搜索结点时若满足约束条件则返回到前一个结点向其另一个子结点进行深度搜索。 二。请说明“子集和”问题的解空间结构和约束函数 7-1 子集和问题 设集合S={x1,x2,…,xn}是一个正整数集合,c是一个正整数,子集和 阅读全文

python硬刚倒排索引

2018-12-20 09:42 by water_chen, 1859 阅读, 0 推荐, 收藏, 编辑
摘要:需要导入的库:jieba, json json是python自带的库,jieba只需要在命令行输入pip install jieba即可 本代码采用直接硬刚倒排索引,可能会引起稍微不适,请选用。 代码分为三部分:分词、创建正排索引、创建倒排索引 需要文件:语料库、停用词库(停用词库请自行搜索即可) 阅读全文

第五章实践报告

2018-12-20 09:30 by water_chen, 122 阅读, 0 推荐, 收藏, 编辑
摘要:1、实践题目:工作分配问题 2、题目描述:设有n件工作分配给n个人。将工作i分配给第j个人所需的费用为cij 。 设计一个算法,对于给定的工作费用,为每一个人都分配1 件不同的工作,并使总费用达到最小。 3、算法描述 解空间:排列树(三叉树) 代码描述: 时间复杂度:假设工作是n,则是n的平方 空间 阅读全文

算法第4章作业

2018-11-26 11:52 by water_chen, 142 阅读, 0 推荐, 收藏, 编辑
摘要:1、贪心算法:在对问题求解时,总是做出在当前看来是最好的选择。 也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。 我的理解是在某些问题下,设置符合最大样本的条件,尽可能多的将样本加入到自己的选择。 2、汽车加油问题。 汽车行驶过程中,应走到自己能走到并且离自己最远的那个加油站 阅读全文

算法第4章实践报告

2018-11-26 11:08 by water_chen, 155 阅读, 0 推荐, 收藏, 编辑
摘要:1、实践题目 2、问题描述 给定n位正整数a,去掉其中任意k≤n 个数字后,剩下的数字按原次序排列组成一个新 的正整数。对于给定的n位正整数a和正整数 k,设计一个算法找出剩下数字组成的新数最 小的删数方案。 输入格式: 第 1 行是1 个正整数 a。第 2 行是正整数k。 输出格式: 输出最小数。 阅读全文

C++第二次作业

2018-11-26 10:56 by water_chen, 171 阅读, 0 推荐, 收藏, 编辑
摘要:针对中段测试的结果、新手赛的比赛情况,以及之前的课前预习、课中学习、和课后作业情况,回答如下问题: 1 目前自己学习中存在的薄弱的知识点具体有哪些?每个薄弱的知识点都是如何获知的,每个薄弱的知识点需要列举具体的例子说明。(5分) 2 从第五章函数到第七章数组的函数题和编程题(主要是在PTA)中选出至 阅读全文

算法第3章上机实践报告

2018-11-03 10:12 by water_chen, 162 阅读, 0 推荐, 收藏, 编辑
摘要:给定n个整数(可能为负数)组成的序列a[1],a[2],a[3],…,a[n],求该序列如a[i]+a[i+1]+…+a[j]的子段和的最大值。当所给的整数均为负数时,定义子段和为0。 要求算法的时间复杂度为O(n)。 2、问题描述 输入格式: 输入有两行: 第一行是n值(1<=n<=10000); 阅读全文

算法第三章作业

2018-10-28 12:43 by water_chen, 402 阅读, 0 推荐, 收藏, 编辑
摘要:1、对动态规划算法的理解 动态规划算法和分治法的思想是类似的,将待求解问题分解成若干个子问题。但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。在用分治法求解时,有些子问题被重复计算了许多次。如果能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,就可以避免大量重 阅读全文

第二次结对编程作业

2018-10-21 21:20 by water_chen, 178 阅读, 0 推荐, 收藏, 编辑
摘要:已知有两个等长的非降序序列S1, S2, 设计函数求S1与S2并集的中位数。有序序列A​0​​,A​1​​,⋯,A​N−1​​的中位数指A​(N−1)/2​​的值,即第⌊(N+1)/2⌋个数(A​0​​为第1个数)。 输入格式: 输入分三行。第一行给出序列的公共长度N(0≤100000),随后每行输 阅读全文