07 2020 档案

班课7
摘要:1. edit distance 两个序列A与B,长度分别为n与m,通过增加删除或者修改的方式将A变成B, 其cost分别为c_I, c_D, c_R,找到总花费最低的方法 2. flow network: 一个有向图,每个边都有一个正数的容量,两个特殊的顶点分别为source与sink t,从s流 阅读全文

posted @ 2020-07-21 16:19 Eleni 阅读(162) 评论(0) 推荐(0)

班课5
摘要:1. 上周海啸的题目,利用BFS找到集合 strongly connected component:在有向图G中,如果两个顶点vi,vj间(vi>vj)有一条从vi到vj的有向路径,同时还有一条从vj到vi的有向路径,则称两个顶点强连通(strongly connected) 利用BFS找到所有有向 阅读全文

posted @ 2020-07-08 19:49 Eleni 阅读(155) 评论(0) 推荐(0)

班课5
摘要:1. Spark Shuffle 回顾一下MapReduce的shuffle,即先按照key聚合,再对key进行排序 而spark中的shuffle不一定按key排序,shuffle前称为MapTask阶段,shuffle之后称为ReduceTask阶段 每一个分区分配一个MapTask shuff 阅读全文

posted @ 2020-07-06 20:22 Eleni 阅读(202) 评论(0) 推荐(0)

班课4
摘要:1. 贪心算法 每一步都选择当前状态下的最优解,以期得到结果最优 2. 贪心算法例子:activity selection problem 有一系列的活动ai,(1<i<n)每个活动都有一个开始时间s以及结束时间f,一次只能做一个活动,要求最多可以完成的活动个数 尝试1:活动时间越短跟别的活动冲突的 阅读全文

posted @ 2020-07-03 15:49 Eleni 阅读(172) 评论(0) 推荐(0)

班课4
摘要:1. FlatMap要求传入的函数是一个集合,将输入的所有list打散放入同一个list中输出 2. Filter返回一个Boolean,collect之后打印符合条件的 3. ReduceByKey将key相同的元素根据需求合并起来,如将相同Key对应的Value相加 rdd.reduceByKe 阅读全文

posted @ 2020-07-03 08:19 Eleni 阅读(121) 评论(0) 推荐(0)

导航