秦 颖,文秋芳,梁茂成
摘要:试卷自动评分研究中有个十分重要却常被忽略的环节———对于雷同内容的自动检测。翻译考试的雷同译文与一般的重复文档有着不同的特点。通过对比各种文档相似算法,最终选择了特征码的方法用于检测汉译英雷同译文,并结合翻译考试的特点,提出了随机特征码的方法,解决了特征码选取位置难以确定的问题,同时降低了特征码对于编辑差异的敏感度,提高了雷同内容检测的查准率和查全率。该算法的复杂度为线性,适用于大规模翻译试卷的快速检查。
关键词:自动评分;雷同内容检测;文本相似度;特征码
外语电化教学2009年6期
1《现代经济信息》2024年5期
2《中国中医药现代远程教育》2024年12期
3《创新创业理论研究与实践》2024年6期
4《江苏农业科学》2024年8期
5《吉林医学》2024年3期
6《电气技术与经济》2024年3期
7《影像研究与医学应用》2024年5期
8《安徽教育科研》2024年13期
9《北京文学·中篇小说月报》2024年5期
10《经济技术协作信息》2024年2期