谷歌浏览器插件
订阅小程序
在清言上使用

基于时间序列聚类算法的叙词表新术语遴选研究

Information Science(2021)

引用 0|浏览2
暂无评分
摘要
[目的/意义]为保证叙词表术语收录的完整性,需要及时将领域出现但未收录的新术语补充收录到叙词表中,结合候选词的时间及文档词频特征,从时间序列角度探索新术语的分布情况以指导新术语遴选是值得研究的问题.[方法/过程]文章主要对词汇文档词频对应的时间序列进行研究,将时间序列进行词频归一化及时间等长预处理,引入k-means聚类算法,对候选词汇进行基于时间序列趋势变化的聚类,探索术语以及非术语趋势变化的规律,进而总结新术语应该满足的趋势变化特征.[结果/结论]通过聚类研究,总结得出新术语普遍处于增长趋势.实证将处于增长状态的候选词汇遴选出来,经过专家判断,该方法可以有效从候选词汇中遴选出其中能补充到叙词表中的新术语,该方法有比较高的准确率.[创新/局限]创新之处表现为叙词表新术语的遴选中同时考虑了时间变化和文档词频因素,局限于数据处理规模,实证中只统计了论文关键词的词频数据.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要