专家意见

盲审意见

毕业论文.png

1.论文的3.5节指出了数据预处理过程中的行特征、身份特征等特征是从单词维度对漏洞描述和提交说明的文本信息提取特征,可能受到同义不同词和同义不同句等情况的影响。因此该论文使用了BERT模型对漏洞描述和提交说明进行了语义编码。是否可以对语义相关的问题进行举例说明,例如同义不同词导致基于单词的特征不准确。这种语义导致的问题是否具有普遍性,希望可以基于数据集进行统计说明。
2.论文的3.8节对实验结果进行说明和分析。在Top-K召回率和Top-K人工检测数的指标下,论文提出的方法获得了较好的实验结果。要证明该方法具有一定的实际应用价值,建议增加该方法与现有方法在时间开销与空间开销上的对比实验,进一步说明该方法具有实际应用的前景。

1.“开源软件往往静默修复漏洞,使得绝大部分的漏洞缺乏对应的漏洞补丁信息”,这是论文研究的出发点之一,需要提供统计数据等论据作为支撑。
2.相关研究工作调研方面,建议增加对“漏洞重现研究”工作的调研,有些漏洞研究工作也探讨了如何将补丁代码和git日志文本相结合。
3.论文的两个研究问题缺乏形式化的定义和描述。

第三章中实验数据部分的个别描述不够充分,如当前负样本中是否有一定数量其他漏洞的安全补丁?最好能够说明一下,使得整个实验的设置能够更贴近实际情况。
在3.8.3中,XGBoost模型与VCMatch的差异并不显著,训练多个不同的模型再进行投票排序的框架,效率与收益最好能够给出一些讨论与分析。
在3.8.5中,介绍了不同特征缺失情况下的效果,如果不考虑语义特征及模型的预测因素,仅使用数据预处理的特征进行匹配能够分别定位到多少安全补丁?
在3.8.6中,论文对比分析了在Wireshark和ImageMagick上结果的原因,而对于Moodle、Jenkins上不好的原因略过了一定的讨论与解释;此外,在该实验中,最好也将不同项目所构建的数据量差异显式地体现出来。
尽管第四章的方法有一个不错的切入点,但是实验部分数据量相对较少,导致整体表现力不够充足,可以考虑从对应的缺陷管理网站(如bugzilla等)或者邮件列表等渠道来尝试能否进一步将数据扩充。

预审意见

1.论文中的图片有些来自网络,建议使用矢量图或者dpi>300的图,比如图2.3,2.8建议重画,或者去掉。
- Done

2.对比方法使用的都是XGB,LGB等机器学习方法,依赖于特征的提取,而本文提出的方法基于embedding编码,那么有没有可能是特征提取的因素导致已有方法的局限。
- Done
- 本文采用的方法与已有方法没有相差过多的特征,之前也使用GDB树的特征重要性来查看过具体每个特征的使用情况,使用较多的特征均有覆盖。
- 而通过embedding编码的思路是之前没有涉及到的,是日后可以作为深度挖掘利用的一个方向。

3.缺少消融实验,和案例描述,用TopK进行比较,比较难刊出哪一个部分对模型有比较大的贡献。
- 存在消融实验,各特征维度重要性的实验结果分析就属于消融实验。

4.模型结构偏简单。
- Done
- 数据集大小有限,模型复杂会过拟合。在当前模型结构下,最终结果不错可以说明不需要太过复杂的模型。

5.图 3.5 ,3.6,建议纵坐标取log。
- Done

6.第二章背景介绍时,需要就当前研究课题进行分析。另外,这一章需要增加参考文献的引用。
- 在第三章有进行课题的分析与问题的定义。参考文献增加了一些。

7. 4.7节为本论文的关键内容,需要增加内容和分析深度。
- 有点难

论文撰写相关经验

  1. 答辩时评委能看到盲审专家的意见,因此如果盲审专家要求修改某章节内容但没有修改的话,答辩评委问道时需要进行解释。
  2. 虽然答辩时候,评审老师可能批评论文逻辑,但是,只要老师签字同意通过就可以,答辩过了好像就不需要改论文了。
  3. 图片如果不是自己的,需要:“图 1.1 图题(图引自[3])

经验 1

前两天收到了论文盲审通过的消息,十分欣喜地发了个帖子,没想到上了十大。看到帖子下面有同学想让我分享一下学位论文的撰写经验,于是就想着重新开一个帖子。其实与其说是经验,不如说是自己在论文撰写上的一点小心得吧,毕竟我也只是个科研菜鸡 TvT。不过回想自己在开题时被底下老师骂得狗血淋头想退学,到最后学位论文拿到三个优顺利通过,期间也确实踩了不少坑,在这个帖子里就跟大家简单地聊聊。如果大家觉得有用的可以点个赞,大佬们如果觉得没用也请轻喷。

关于论文篇幅

有不少同学向我咨询硕士学位论文应该写多少字,其实这个对于不同专业可能会有一些差异。不过就我所在的专业,从我看到的各位学长学姐的论文,大致都在六十至九十页之间。个人认为学位论文在到达一定页数之后,页数的多少其实并不是很重要了,身边就有六十页拿到 3A,而写了一百多页却要大修的例子。因此我个人认为学位论文的正文页数在七八十页最佳,对于不同专业有所调整。

关于论文评判的标准

从我个人的经验来看,学位论文评判的标准主要为以下四点:论文格式、创新点、工作量和核心亮点 其中论文格式和工作量决定了论文的下限,而创新点和核心亮点决定了论文的上限  下面我将逐点介绍:

  • 论文格式:不知道为什么,一些评审老师对论文的格式非常看重,可能是觉得格式的标准代表了学生撰写论文时的态度吧。因此希望大家在写论文时都对格式上点心,这里我还得特别感谢我的师兄,在阅读我的论文时提了很多格式上的错误,比如公式字体大小、目录是否对其、参考文献等等。其实有些错误我们自己在撰写时根本就不会意识到,所以非常建议大家请有经验的师兄师姐或者导师帮忙看一看,往往他们一眼就能看到问题所在。
  • 创新点:创新点往往是评审老师会重点看的部分,因此建议大家对这一部分反复斟酌提炼。这里我有个观点:写论文是为了感动读者,而不是为了感动自己。比如一些同学可能在创新点中会这么写:“本文详细阐述了 XXXXXXX,揭示了 XXXXXXXX 机制…..” 可能自己读完会觉得自己的课题很新颖,因此我们对自己的课题方向有充足的了解,但是评审老师却感受不到这一点。因此我建议大家在写完国内外研究进展之后,进行一个简要的总结,然后将创新点改为:“虽然前人研究了 XXXXXXXXXX,但对 XXXXX 方面尚未有人进行研究,因此本文 XXXXXXXX,填补了这方面研究的空缺…..” 并且反复强调你做的东西是别人没做过的。这样评审老师读完之后会觉得嗯,你的课题确实有创新所在。
  • 工作量:工作量这一点主要还是靠平时的积累,至少平时多做一些实验,在论文中罗列工况表时也不会显得那么匮乏。不过在论文撰写时,也有一些小技巧,你应该将自己论文的工作量尽量展现给评审老师:比如对于每一种实验工况你可能从不同方面做了多组实验,完全可以在论文中提及“每组工况重复了 X 次实验”;又比如可能有些实验一组耗时非常长,也可以在论文中提及“一组实验耗时 XX 小时”等等。总之就是尽可能的让老师体会到你确实做了很多工作,而不是觉得你做的东西很容易,这点我有血的教训 T^T。
  • 核心亮点:个人认为一篇论文如果能有一个非常好的亮点,对于整篇文章是大大加分的。其实从个人经验来看,评审老师在阅读一篇论文时,因为方向不同,很有可能不是很看得懂你的研究内容,因此最好在论文中有核心的亮点,说白了就是让评审老师觉得:“虽然我看不懂,但是一看就很牛逼!” 比如论文中涉及一段非常硬核的理论推导,或者对某个方法做了改进,大大提升了效率等等。希望大家在写论文时能够好好思考一下。

其他小经验

  • 全文总结:我个人非常建议大家在写最后一章之前,能够有一小节能够将你写的所有内容串起来做一个全面的机制总结,因为写论文就像讲故事,让你的故事听起来有逻辑是很重要的。有些同学可能写论文涉及面很广,东扯一点,西扯一点,看到最后可能老师看懵逼了,不知道你到底在讲啥。通过这一节目的就是将你的结果完整的展现出来,如果这里能够绘制一张描述机理的图,让老师一看就明白,那更是再好不过了。
  • 反复修改:写论文很容易陷入“当局者迷”的怪圈,我经常写完一段内容,过一段星期之后再看一遍觉得自己写了一坨 shit,因此反复不断地阅读和修改是非常重要的。这里不仅仅是自己看,最好还能让你的师兄导师帮忙看一遍,让他们从旁观者的角度看看有哪些语句是表述不清楚的,然后再在他们的意见上进行修改。

我想分享的大致就是这些了,最后祝愿无论是正在写论文即将毕业,还是低年级的学弟学妹们都能顺利写完毕业论文,顺利毕业!

送审经验

  1. 都是外校的,目前来看是水平差不多的大学之间相互传递(我导今年抽中武汉大学和中科院系统)
  2. 教育部负责递送
  3. 你看不到评审是谁,学院主管老师可以
  4. 硕导审硕士论文,博导估计博士硕士都可以
  5. 关键词和研究方向填写很重要,是根据这个送的
  6. 目前看来平台有抽成,我小老板说他审一本硕士论文审稿费 280 左右,但是硕士重评要交 400 块,不过第一次送外审不花钱,应该是官家出了
  7. 并不是老师想审就审,系统随机分的,不想审的可以拒绝。我小老板今年遇见分给他了又收回去了

送审大致有以下流程:
a 在研究生系统里提交论文;
b.通过教育部平台或专家库平台匹配专家;
c.平台联系专家是否同意评审;
d.等待专家返回结果。

针对各个送审环节,lz 经历过应注意的事项有:

1.与系统提交论文相关
(1)导出含高清图的电子稿
大家往往比较注重送审电子稿在格式、内容等方面的规范,因此这两方面一般不会有太大问题。LZ 的论文有大量的分析图,导出时发现 word 直接另存为 pdf 的图片质量较差,无法满足专业对图片的清晰度要求。最后关头 lz 尝试了多种办法发现在 word 里用 Adobe pdf 打印机里的高清打印效果是最好的

(2)建议不要卡着 ddl 送审
LZ 是卡着三月毕业周期的隐藏 ddl 送审的,等到送审周期截止了还有一个专家库的盲审没出结果。那几天真的是三点钟才入睡、不到六点钟就醒了睡不着了,眼睁睁看着时间到了是很心痛的事情。实际上学校的盲审政策存在诸多不合理之处,比如让渡了过多时间给专家导致学子们面对毕业各种 DDL 时相当被动。为了避免主动权的丧失,还是建议大家尽早送审,不管是有大修还是没返回结果都有时间余地做其它打算。

2.与匹配专家相关
建议仔细考量论文关键词和研究方向的填写。
听说平台匹配专家的依据为论文关键词和研究方向,为了减少被拒审的频率(其实就是变相节约时间)、同时准确地送到能“看懂”你的论文的专家手里,建议大家和导师以及师兄师姐好好讨论这两部分内容的填写。方向填的太大或者太小都是不好的,同时要考虑有无因为用词不当送到完全不相关专家那边的可能性。

3.与等待结果相关
(1)教育部和自建专家库的判定方法
LZ 的专业是送 1 个教育部+2 个专家库。在专家同意评审后,小萌新们进入研究生院系统后可以在评审专家里找到两个***,这两个就是专家库的专家,他们的评审意见是即填即出的。教育部的专家由于是学院老师人工录入的,所以***和具体的等第是一起出来的,可以通过这个办法判断专家的属性。一般来说,教育部平台的结果出的最早,也比专家库的严格。

(2)主动且持续关注盲审动向
专家同意评审后开始倒计时,具体周期教育部是 30 天,专家库平台是 45 天。切莫以为网上提交论文就万事大吉了,建议大家送教育部的定期和老师确认是否已联系到专家,送专家库的定期提醒老师提醒专家登陆系统填写意见。时间催促的权限据说是放在学院老师手里的,焦急的小伙伴可以多多联系学院负责老师了解进度。

其它一些 tips 或注意事项:
(1)论文降重
可以适当做一些与研究相关的文字附录,增加总字数以降低查重率。
(2)打印论文
最终答辩要打印论文,将 100 页左右的论文打出来就已经非常厚的一本了,非常不利于装订。这里提醒大家双面打印。

其他经验

没了知网怎么找学位论文?——学位论文检索全面指南
博士学位论文撰写-大修-延毕-过审-答辩-走人的碎碎念流程与经验分享
复盘人生第一次科研经历

论文时间线

Transclude of 毕业论文时间线