天天看点

第一次个人作业

作业声明

这个作业属于哪个课程 班级链接
这个作业要求在哪里 个人项目作业
这个作业的目标 论文查重

1.作业github链接

作业github链接

2、计算模块接口的设计与实现过程

想要算出第二篇论文是否抄袭了第一篇论文,并且计算出抄袭的程度,试着写一个程序来实现,上网搜资料后知道,可以用这样的一个方法:把论文变成一种叫做词嵌入的格式,然后再用神经网络再把词嵌入变成特征向量,但是用了很多次神经网络之后,向量就会变得太大太复杂,所以用几次之后就要简化一次特征向量,经过几轮重复之后,就可以用计算两个向量的相似度,也就是题目要的抄袭程度,重复率

流程图

第一次个人作业

实现过程

按照下面这样的命令依次输入和回车,就可以算出老师给的五篇论文的重复率

第一次个人作业
第一次个人作业
第一次个人作业
第一次个人作业
第一次个人作业
第一次个人作业
第一次个人作业

3、计算模块接口部分的性能改进

性能分析

第一次个人作业
第一次个人作业

消耗最大的函数

第一次个人作业
第一次个人作业

4、计算模块部分单元测试展示

输出覆盖率

5、计算模块部分异常处理说明

6.PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 15
· Estimate · 估计这个任务需要多少时间 20
Development 开发 600 800
· Analysis · 需求分析 (包括学习新技术) 180 240
· Design Spec · 生成设计文档 30 45
· Design Review · 设计复审
· Coding Standard · 代码规范 (为目前的开发制定合适的规范)
· Design · 具体设计 60 90
· Coding · 具体编码 360 420
· Code Review · 代码复审
· Test · 测试(自我测试,修改代码,提交修改)
Reporting 报告
· Test Repor · 测试报告
· Size Measurement · 计算工作量
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 25
· 合计 1495 1910``

继续阅读