基于词向量语义聚类的微博热点挖掘方法
【出 处】:
【作 者】:
刘培磊
唐晋韬
王挺
谢松县
岳大鹏
刘海池
【摘 要】随着社交媒体的迅速发展,信息过载问题越发严重,因此如何从海量、短小而充满噪声的社交媒体数据中发现和挖掘出热点话题或者热点事件成为一个重要的问题.结合社交媒体数据实时性、地理性、包含较多元数据等特点,提出了用户行为分析与文本内容分析相结合的热点挖掘方法.在内容分析过程中,提出了从更细的词语粒度进行聚类,以代替传统的在消息粒度进行聚类的经典方法.为了提高话题关键词提取的效果,引入了基于词向量技术,并通过语义聚类的方法进行热点挖掘.在真实数据集上的实验结果表明,该方法提取的关键词语义关联性强、话题划分效果好,在主要指标上优于传统的热点挖掘方法.
相关热词搜索: 热点挖掘 社交媒体 词向量 语义聚类
上一篇: 改进的模糊聚类在控制系统故障诊断中的应用
下一篇: 面向谐波分析的电力系统数字仿真系统研究