电脑与信息技术

电力工业论文_基于类别混合嵌入的电力文本层次

 

文章摘要:通过对电力信息技术现有研究成果的深入分析可以为准确地评估当前电力系统智能化应用水平提供有效的决策支持依据。针对当前电力文本分类方法忽视类别标签之间潜在语义关联关系而导致分类性能低效的问题, 提出了基于层次化分类模型的电力文本分类方法。首先, 利用采集到的电力成果非结构化文档, 采用自动化信息提取技术和标注技术构建电力文本多标签分类训练集, 并结合领域知识分析构建类别标签之间的层次化关系。其次, 提出了基于类别结构和标签语义混合嵌入的文本分类模型HONLSTM-BERT, 利用类别标签之间的层次化结构关系进行自顶向下的层次化文本分类。最后, 通过与当前流行的文本分类模型进行实验对比分析, 实验结果显示HONLSTM-BERT方法具有更好的分类准确率, 可有效提高电力文本自动分类性能。

文章关键词:

论文DOI:10.13209/j.0479-8023.2021.104

论文分类号:TM73;TP391.1