中教数据库 > 西南科技大学学报 > 文章详情

基于TF-IDF的卷积神经网络新闻文本分类优化

更新时间:2023-05-28

【摘要】针对使用词语级别的预训练嵌入向量初始化卷积神经网络的嵌入层在计算资源有限时存在内存溢出和训练时间长的问题,对新闻文本作出假设:去除部分不重要的词语不会影响最终分类效果,并基于TF-IDF提出一种类别关键词提取方法。通过提取类别的关键词减少词表,进一步减小嵌入矩阵的大小。在THUCNews数据集上进行的实验表明:当嵌入矩阵参数减少近89%时,在CPU的训练时间减少约49%,模型大小减少约87%,分类性能不受影响。

【关键词】

20560 2页 免费

发表评论

登录后发表评论 (已发布 0条)

点亮你的头像 秀出你的观点

0/500
以上留言仅代表用户个人观点,不代表中教立场
相关文献

推荐期刊

Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved

京ICP备2021022288号-1

京公网安备 11011102000866号