【摘要】针对使用词语级别的预训练嵌入向量初始化卷积神经网络的嵌入层在计算资源有限时存在内存溢出和训练时间长的问题,对新闻文本作出假设:去除部分不重要的词语不会影响最终分类效果,并基于TF-IDF提出一种类别关键词提取方法。通过提取类别的关键词减少词表,进一步减小嵌入矩阵的大小。在THUCNews数据集上进行的实验表明:当嵌入矩阵参数减少近89%时,在CPU的训练时间减少约49%,模型大小减少约87%,分类性能不受影响。
【关键词】
《建筑知识》 2015-05-12
《中国医疗管理科学》 2015-05-12
《中国医疗管理科学》 2015-05-12
《中国医疗管理科学》 2015-05-12
《中外医疗》 2015-07-06
《现代制造技术与装备》 2015-07-02
《重庆与世界》 2015-07-01
《广西广播电视大学学报》 2015-07-01
Copyright © 2013-2016 ZJHJ Corporation,All Rights Reserved
发表评论
登录后发表评论 (已发布 0条)点亮你的头像 秀出你的观点