3.1 预答辩复盘及后续大论文修改工作

预答辩已经过去一周多了，今天终于没有其他的学习任务，可以好好复盘一下了。这次一共有四名同学，我是最后一个，虽然勉强跟着大家一起过了，但因为一些其他的原因，还是要延毕了。因为大论文写的比较仓促，还是比较烂的，多出来半年的时间可以好好改改，然后好好找工作。

在这个环境里的人都是神仙打架，他们的专业能力都非常强，但这么多年我虽然比较蠢笨但也算是摸索出了自己的生存之道。前三个同学做的东西都很好，但是老师也还是提出了很多问题和建议，很多也是我应该注意和学习的。

第一个同学是 WYK，是做安全的，被问了很久。主要问题如下：

没有研究问题的整体框架，各个点比较散；
表格不合规，标题、参数名都没有；
一年的工作内容。因为是延毕一年，所以会问到一年间额外做了哪些工作，如果是多做的工作，未经过审稿论证的，可以先把工作写上，经过审稿论证的，把结论写上；
文献罗列不可取。我也是一样的问题，写研究现状就是简单罗列，没有深层次比较分析；
整体做得比较浅。老师们大多都是安全出身，所以看问题还是一眼中的，其实我也是存在同样的问题。

高老师对该同学的问题进行了总结：

要保证大论文的篇幅。但是该同学把不相关的内容加上去了，反而是减分项。应该把不相关的删掉，减少重复。
关于如何增加论文篇幅，为什么会没得写，高老师给出的建议感觉还挺有用的：把工作做细，就有的写。实验条件、环境，所得结果的最大值、最小值、平均值等。
有不规范的表述，表述比较口语。我觉着我也是一样的问题。

中间我导师也提了很多，重点是增加论文的篇幅、干货。最后立武老师也提了几点，和前面几条有重复的：

要明确目标，该补的章节补上；
写专业内容相关的东西，无关的删掉；
大面上大家都知道的东西，删掉，这些说不说无差别；
用词、语句不严谨，如 CIA 的定义，基本概念不能挑战、改写。

第二个是郭老师，郭老师做的工作比较多，呈现得也非常好，老师们说论文写的很规整，基本没有提太多问题。
只有立武老师提了几个小的注意事项：

摘要不要出现文献引用；
对于知识的定义。这个老师每次都会提到这个问题，并给出了建议：浙大、陈华钧《知识图谱导论》里面应该有，还提到 DIPW……，认知、感知、推理等。
对于 AI 核心问题的探讨。老师提了一个问题，问 AI 的核心问题是什么？我当时想的答案是“意识计算”，老师给出的答案是 “知识表示和利用”，但是却并不看好 KGE 的发展，我觉得非常赞同。

第三个是 HSK 师兄，做的是推理问答系统，比较偏应用。师兄有 5 篇论文，工作量也是非常充实了。老师们主要提出的问题如下：

因为师兄是最后才讲框架，姚老师指出研究框架应该放在前面来讲。而且我看到很多师兄师姐会把研究框架单独成为一章，用于强调自己各项研究内容之间的关系，但是我导指出框架最好是合到某一章节之中自成一章略显单薄。

翟老师提出了非常犀利的问题：文本知识的问答系统，很多人都在做，你的创新性在哪里？复杂推理也有人做，效果如何，与别人的不同？比别人（别的机构）强在哪里，研究的到底是不是一个科学问题。Anyway 都是很根本性的问题。这里想到我的缺陷，就是对于现在做到什么程度，讲的也不是很清楚；对于研究的问题，也应当确定是旧问题还是新问题，如果是新问题，最好有一个明确的定义。

立武老师提出的问题：图中文字太小、图的质量不好。又提到了知识的概念，数据库与知识库的异同：数据库不需要多次交互，而问答系统比检索系统需要多次与人的交互。这里提到一个新词：知识系统，指的是可以和人没有交互的系统，将文本视为黑盒。知识如果定义清楚了，可能不需要歧义处理了。这位老师说自然语言结构化是可以做的东西。我觉得很有启发，这方面的工作或许是比较实用的。

一个心得：博士的研究不在多、而在精、细。当然工作量的体现也是一部分，但更重要的就是把一个问题做到极致的工作，关于对问题的分析、解决方法、详细的实验分析、为什么好的解释等。要把呈现出来的东西都搞清楚，才能无懈可击。就是丁是丁卯是卯。

最后一个就是我了，我做的东西跟前几位同学比起来立刻就是高下立见，但是老师们都非常 nice，都从帮我搞得更好能顺利毕业的角度提出一些建议，没有任何严厉的批评，我想老师们可能是出于同情吧orz。都是很有用的建议：

Conv3D 效果很好，但没有给出合适的解释原因。这一点是一直就存在的问题，是每次都会被提到的缺陷，得需要找一个强有力的理由来说服自己和评阅人。高老师和逸飞师兄帮忙从视觉领域多通道推测了一下原因，嵌入向量堆到一起，可以抓住主成分，多通道类似并行多分量。后面看看图像领域的场景找找说法。可能还要具体说下参数的优势，做一些更有说服力的实验什么的。不能总是呈现一个好的结果，然后泛泛地说模型架构的优势。
翻译特性应该具体解释一下，\(h+r \approx t\)；同理，语义模糊也应该有个明确的解释。
第二章研究现状纯粹就是文献堆砌，不可取。应当突出与后面工作的联系：从语义、关系角度介绍研究现状：从卷积的语义空间呈现研究现状。
数据集那章需要有一个可以推广到其他领域的普适性方法。先说输入、讲方法的通用性，再说效果。要能延伸到其他领域，这个也得考虑下怎么整。（高老师对翟老师所提问题的解围和建议）

最后翟老师问了一个问题差点没答出来，说我最后的数据集构建怎么应用到其他领域，有什么用，让我说物流领域怎么用，可是物流领域我真的不懂，勉强招架了几句，最后提到了国网的主设备知识库，总算是圆过去了。

其他同学存在的问题我也应当改正的：

整体框架，几个研究点成体系；
增加篇幅，实验描述更详细，要增加干货；
表述口语化问题。

自己想到的自己问题：

研究内容一中，我对于实体和关系的多义问题，没有给出准确详细的解释说明；
KG2GM 的应用场景：存在多义现象的场景；（表明自己做的东西的实际应用价值很重要）
Conv3D 的优势：在维度低的情况下比其他模型好；
现在做到什么程度没有清晰描述，提出新问题要有定义。
（我的几个研究内容都比较粗糙，可能需要再搞细一些；可能不需要加太多新的东西了，把现在这几个呈现清楚就好了）
检查图片呈现效果。

虽然也给答辩时候的自己录了音，但还是没有勇气打开听。这次答辩又是没有提前练习预讲，总还是感觉自己做的东西很鸡肋。后面时间比较宽裕，就应该准备得更充分一些。虽然多了半年，但要消化过去半年进展过快带来的历史遗留问题，还要找工作，也不会太清闲。1月是个比较尴尬的时间点，但也就这么定了吧，在自己的世界，解决自己遇到的问题。后面的工作就是把之前攒的学习资料整理一下，然后根据上面列的问题改论文。

posted @ 2022-03-10 11:18 胡萝不青菜阅读(1228) 评论(12) 收藏举报

刷新页面返回顶部

胡萝不青菜

研究方向：KGE，安全事件分析

3.1 预答辩复盘及后续大论文修改工作

公告