作业声明
这个作业属于哪个课程 | 班级链接 |
---|---|
这个作业要求在哪里 | 个人项目作业 |
这个作业的目标 | 论文查重 |
1.作业github链接
作业github链接
2、计算模块接口的设计与实现过程
想要算出第二篇论文是否抄袭了第一篇论文,并且计算出抄袭的程度,试着写一个程序来实现,上网搜资料后知道,可以用这样的一个方法:把论文变成一种叫做词嵌入的格式,然后再用神经网络再把词嵌入变成特征向量,但是用了很多次神经网络之后,向量就会变得太大太复杂,所以用几次之后就要简化一次特征向量,经过几轮重复之后,就可以用计算两个向量的相似度,也就是题目要的抄袭程度,重复率
流程图
实现过程
按照下面这样的命令依次输入和回车,就可以算出老师给的五篇论文的重复率
3、计算模块接口部分的性能改进
性能分析
消耗最大的函数
4、计算模块部分单元测试展示
输出覆盖率
5、计算模块部分异常处理说明
6.PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 15 | |
· Estimate | · 估计这个任务需要多少时间 | 20 | |
Development | 开发 | 600 | 800 |
· Analysis | · 需求分析 (包括学习新技术) | 180 | 240 |
· Design Spec | · 生成设计文档 | 30 | 45 |
· Design Review | · 设计复审 | ||
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | ||
· Design | · 具体设计 | 60 | 90 |
· Coding | · 具体编码 | 360 | 420 |
· Code Review | · 代码复审 | ||
· Test | · 测试(自我测试,修改代码,提交修改) | ||
Reporting | 报告 | ||
· Test Repor | · 测试报告 | ||
· Size Measurement | · 计算工作量 | ||
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 25 | |
· 合计 | 1495 | 1910`` |