第二次结对作业

整体概况

  • 结对信息

  • github链接

  • 设计说明

  • 关键代码解释

  • 性能分析

  • 所遇到的困难及对队友的评价

  • PSP、学习进度条更新



1、结对信息

  • 311 旭

  • 437 辉



2、github链接



3、设计说明


  • 类图


  • API接口设计

public MyC allocate 
{
    public  void Myjson();//读入与处理json数据
    public  void FDmatching();//实现第一次分配
    public  void SDmatching();//实现第二次分配
    public  void TDmatching();//实现第三次分配
    public void  Prin();//输出
}

  • 匹配算法的设计

1. 流程图





2.匹配思想

  • Step1:为了不让后生成的学生的优先级过低导致不能进入部门,首先以高考成绩换算成的评分(随机生成)排名,从高到低排名,给每个人一个rank排名。

  • Step2:在第一步的前提下,以第一志愿优先原则:从rank为1的学生开始,遍历其第一志愿,当第一志愿对应的部门的人数没有满的情况下,进行匹配判断,匹配判断分为以下两步:

  • Step 2.1 进行时间判断,将学生的空闲时间段与部门的基础活动时间段进行匹配,当两个时间段中有1个时间段互相匹配(同一时间段或者学生的空闲时间段大于部门的活动时间段),进行下一步判断。

  • Step 2.2 时间判断满足的情况下,进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比,只要其中有两个两两匹配,即满足判断,更新学生信息与部门信息(学生:加入部门信息、加入部门数 部门:成员信息、部门人数、部门人数上限等)

  • Step3 对所有的学生,依旧按照成绩排名,从rank为1的学生开始,遍历其所有志愿,当其志愿对应的部门的人数没有满的情况下,进行匹配判断,匹配判断分为以下两步:同上

  • Step 3.1 进行时间判断,将学生的空闲时间段与部门的基础活动时间段进行匹配,当两个时间段中有1个时间段互相匹配(同一时间段或者学生的空闲时间段大于部门的活动时间段),进行下一步判断。

  • Step 3.2 时间判断满足的情况下,进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比,只要其中有两个两两匹配,即满足判断,更新学生信息与部门信息(学生:加入部门信息、加入部门数 部门:成员信息、部门人数、部门人数上限等)

  • Step 4 最后一轮匹配,对所有的学生,依旧按照成绩排名,从rank为1的学生开始,遍历其所有志愿,当其志愿对应的部门的人数,且学生的已加入部门信息没有该部门没有满的情况下录取。


  • 测试数据如何生成(由队友完成)

部门部分

  • 部门名(department_name):部门名由事先设定好的字符串,通过随机数的组合进行随机生成,由于在下面学生的意向部门中需要用到部门名,因此先用一个字符串数组先存起来。

  • 人数上限(member_limit):单个,数值,在[0,15]内,这是题目要求,但是考虑到部门的实际情况,一个部门不可能纳新人数0人,而且数字比较小,也比较奇怪,因此我们加上底数限制,范围在[10,15]中,实现方法也比较简单,只要通过一个简单的随机程序,在这个区间内随意生成一个数字即可。

  • 部门特点标签(tags):首先我们预设9个标签,但是当我们数据测试的时候其实有考虑标签的匹配,如果总标签数少,这一层的匹配率相对来说太高,也就是标签匹配没有发挥作用,因此我们将其扩充到17个,经过测试,效果上有所改善,匹配率下降了2个百分点左右,表明标签匹配发挥了作用。我们的实现方法也比较简单,预取3个目标标签,但是要考虑重复部分,因此在0-16随机生成三个数,经过简单的if去重,得到三个不重复的随机数,作为数组标志,抓取标志。

  • 部门常规活动(schedule_time):最初的想法就是星期输与时间数的随机匹配,时间是控制在10点到23点。这是符合实际情况的,部门工作有一块很重要的内容就是值班,因此需要安排每个时间段都需要人值班,因此部门活动时间是一个跨度比较大的范围。实现方法也是,星期数是预存数组的随机,时间则是在10-21点随机一个数字,后一个是加上2,表示成字符串。

学生部分

  • 学生姓名(student_name):原先采取和部门名一样的生成方法,生成一个乱码的字母组合来表示,后来可能觉得蛋疼,太蠢了!于是觉得做一点合乎常理的事,名字嘛,就该有正常的姓和名。于是做了三个姓和名的数组,全是将我们班级的人的姓,慢慢打入,还有所有名字拆成两个字,考虑到最终有5000个,因此每个数组分别20、35、38个,总数20 * 35 * 38 > 5000,即直接投入使用。当然会考虑到重复的问题,在下面的模块会简单阐述。

  • 学号(student_number):作为一个并没有很大影响的标识(因为在名字设立板块采取去重,即无重复名字,因此名字可作为唯一标识),学号这块就主要是0315+8位的随机数组成学号,0315表示数计学院15级学生,也是有良好的寓意的。

  • 兴趣标签(Interests):本块内容与部门部分的标签相似,不做累赘说明。

  • 绩点(gap):绩点这块实现难度上就不说了,比较简单,谈谈实际情况。由于福州大学今年绩点改革,因此我们决定跟上潮流,才取阶梯制加上十分制,比如87分、80分和85分的绩点都算作9,65分和60分绩点都算作6.0,也就是不再是一分一绩点,而是一段一绩点的形式。

  • 意向部门(intention_dep):这一块内容也比较简单,将部门生成名字时存入的数组进行调用,随机产生三个不同的该范围内的随机场,进行调取部门。

  • 可用时间(available_time):最初的想法和部门常规活动时间一样,最终改变的原因主要有两个,一个是匹配的问题,因为时间以段为单位,在时间生成上产生了11*7=77种可能性,再加上部门和学生的可用时间需要三个标签最终进行匹配,导致匹配率极低;第二个是实际情况,如工作日的10点-17点,很明显是属于学生的学习时间,不太可能将部门活动时间定在这个时间段,正常的可用活动时间段应该控制在工作日的晚上19点-23点,以及周末的一整天,实现方法是在部门的简单随机上,加了两个if的判断,即可实现。



  • 如何评价自己的算法

         咳咳,算法方面一定要自我检讨一下了,因为匹配算法是自己写的。算法只考虑了匹配过程的可执行性,在复杂度方面没有做过多的考虑,甚至出现了三层嵌套for循环的情况,结果就是导致在最大的5000students、100departments时,要30几秒才能完成运行,每次都等得自己要疯,队友要打人。

         对不起队友,对不起老师,对不起国家。。。。。。。



  • 4、关键代码解释

         尴尬了,这种代码真的是来个freestyle就是:这个代码又臭又长,这个人他又笨又。。。。算了不骂自己了

int rank = 1;
	for (i = 0;;i++)
	{
		if (stu[i].rank == 0)
			break;
		else if (stu[i].rank == rank)             //找到当前排名的学生
		{
			j = 0;
			while (dep[j].departments_name != "NULL")
			{
				if (dep[j].departments_name == stu[i].intention_dep[0] && dep[j].member_limit!=0)
				{
					//判断时间是否冲突
					bool flag = false;
					int e = 0;
					while (dep[j].available_time[e] != "NULL")
					{
						int q = 0;
						while (stu[i].available_time[q] != "NULL")
						{
							if (mtime(dep[j].available_time[e], stu[i].available_time[q]))  //如果有一个时间段符合就被录取
								flag = true;
							q++;
						}
						e++;
					}
					if (flag == true)
					{
						//判断便签是否有一个符合
						bool tflag = false;
						int a = 0;
						while (dep[j].tags[a] != "NULL")
						{
							int b = 0;
							while (stu[i].interest[b] != "NULL")
							{
								if (dep[j].tags[a] == stu[i].interest[b])  //有一个标签符合就返回正确
									tflag = true;
								b++;
							}
							a++;
						}
						if (tflag == true)
						{
							//更新学生信息
							stu[i].match[stu[i].matching] = dep[j].departments_name;
							stu[i].matching++;
							//部门信息更新
							dep[j].member_limit--;
							dep[j].member[dep[j].matching] = stu[i].student_name;
							dep[j].matching++;
							break;
						}

					}
				}
				j++;
			}
	     	rank++;         //排名到下一位
			i = -1;         //让程序回到第一个学生重新开始遍历
		}
		else continue;   
	}

          自行感受。。已第一次匹配为例。我一定要把它改掉。用某神的话,要优雅。。。。。



5、性能分析

  • 接下来已s5000-d100为例,先上图


  •          还是我自身的问题,跑程序花费的时间过长,不够优雅。

  • 输入输出

  • s200-d20
    link

  • s500-d30
    link

  • s1000-d50
    link



  • 6、所遇到的困难以及对队友的评价

  • 遇到的困难

          刚开始对这次的例如json、匹配等两个人都不是很懂,也不找到该怎样入手,后来慢慢的摸索后总算走上了正轨。

          我自己在写算法时,再随着慢慢的数据的变大,里面一些内容的更新,也是不断的出现错误,到后来是自己一遍一遍一行一行的跑完,才完成了算法,虽然很不优雅,但是算是完成了吧。

  • 对队友的评价

         就祝你保重,越来越重。



  • 7、PSP、学习进度条

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 5
· Estimate · 估计这个任务需要多少时间 120 60
Development 开发 60 30
· Analysis · 需求分析 (包括学习新技术) 50 20
· Design Spec · 生成设计文档 20 20
· Design Review · 设计复审 (和同事审核设计文档) 20 10
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 10 20
· Design · 具体设计 20 30
· Coding · 具体编码 120 240
· Code Review · 代码复审 60 120
· Test · 测试(自我测试,修改代码,提交修改) 100 100
Reporting 报告 60 30
· Test Report · 测试报告 30 30
· Size Measurement · 计算工作量 20 30
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 30 30
合计 730 715

第N周 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1 120 120 3.5 3.5 了解了软工的艰难,坚定了信息
2 720 840 30 33.5 国庆屁颠屁颠得跑到学校打代码,很开心(心里mmp)
3 400 1240 21 54.5 开始学习Python
---更新
posted @ 2017-10-15 11:31  HuXUzi  阅读(190)  评论(1编辑  收藏  举报