R语言618电商大数据文本分析LDA主题模型可视化报告|附代码数据

发布时间 2023-06-25 22:32:20作者: 拓端tecdat

原文链接:http://tecdat.cn/?p=1078

最近我们被客户要求撰写关于文本分析LDA主题模型的研究报告,包括一些图形和统计输出。

618购物狂欢节前后,网民较常搜索的关键词在微博、微信、新闻三大渠道的互联网数据表现,同时通过分析平台采集618相关媒体报道和消费者提及数据

社交媒体指数趋势观察

图片

图片

平台数据显示,5月30日起,网上关于618的讨论明显热烈起来。5月30日网上声量相关讨论的主贴有3130条,其中提及最多的是关于“零点,天猫打响618大战第一枪“、”天猫618掀价格战:大家电比京东贵我就赔!“内容的转发,从媒体源数据对比中可见,此话题在微信的传播速度稍快于微博。

数据显示,5月30日至6月6日期间,消费者讨论最多的关键词、声量第一的是”天猫“,天猫以声量数12275位居618关键词搜索榜首。而在618的网络声量中,天猫的相关讨论均占据了40%以上内容。

图片

以微博为例,观察其用户活跃群体以女性较多,主要来自一/二线城市,他们关注的话题大多为购物等话题,日常分享女装化妆品等话题偏多,品牌通过与微博的合作,更易匹配到目标人群。

洞察销售数据

不仅买家们剁手不亦乐乎,卖家们也是八仙过海,花样百出。狂欢过后,理性的卖家逐渐发现,在电商平台上,并不是俺们家所有的商品都能搭上六一八的便车。那么,六一八销量与哪些因素有关?商家应选择怎样的促销策略?

为此,我们采集了线上电商平台的销售数据。从销量来看,这些产品有的成为爆款,有的却无人问津,甚至约有35.8%的产品销量为零。另外,从价格来看,大部分卖家经过历年六一八已经成为“老司机”,尽管也采取促销活动,但是降价甚微(约有84.9%的产品降价不超过10元)。

图片

从品类销售上来看,女士类产品销售较好,其中女鞋、女装都提升明显。看来,剁手主力还是以女性消费者为主。


点击标题查阅往期内容

图片

NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

图片

另外,从价格来看,大部分卖家经过历年双十一已经成为“老司机”,尽管也采取促销活动,但是降价很少(约有20%的产品没有降价),从销量和降价的关系来看,通过降价来促销的效果甚微。

图片

从不同维度的评分来看,消费者对卖家的服务态度满意程度最高,然而降价的幅度显然没有达到他们的预期。

女性消费者都喜欢买什么东西呢?通过简单的分词、词频统计,我们能够发现,在双十一期间销售量>0的商品中,出现了“夏季”、“清凉” 这样的季节性词汇;同时,也有“新款”、“韩版”、“时尚”这样的款式热词。

图片

** **

机器学习促销策略--LDA主题模型

主题模型(topic modeling)是一种常见的机器学习应用,主要用于对文本进行分类。形象来说,主题就是一个桶,里面装了出现概率较高的单词,这些单词与这个主题有很强的相关性。

如果机器能理解这个隐含语义,就能展示相应的广告——这样点击率会更高。在广告、搜索和推荐中,最重要的问题之一就是理解用户兴趣以及页面、广告、商品等的隐含语义。

图片

图片

通过对商品关键词使用LDA建模,我们得到模型有3个主题,主题1关于材质(主要的词为麝皮、山羊绒等),主题2关于风格(主要的词为商务、韩版等),主题3关于颜色(主要的词为咖啡色、蓝色等)。通过机器理解的隐含语义,我们就能展示相应的广告,从而提高点击率。

** **

结语

不论是近期的“天猫618”还是“京东618节”,众多电商巨头及品牌齐聚,正如马爸爸提出的,我们都处在一个全新的零售时代,正在逐步预见着消费需求的变化,在同质化严重的当下,如何走进消费者并赢得关注是每个品牌都非常重要的课题。


图片

点击文末 “阅读原文”

获取全文完整代码数据资料。

本文选自《618电商大数据分析可视化报告》。

点击标题查阅往期内容

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据
R语言对NASA元数据进行文本挖掘的主题建模分析
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
用于NLP的Python:使用Keras进行深度学习文本生成
长短期记忆网络LSTM在时间序列预测和文本分类中的应用
用Rapidminer做文本挖掘的应用:情感分析
R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究
R语言对推特twitter数据进行文本情感分析
Python使用神经网络进行简单文本分类
用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类
R语言文本挖掘使用tf-idf分析NASA元数据的关键字
R语言NLP案例:LDA主题文本挖掘优惠券推荐网站数据
Python使用神经网络进行简单文本分类
R语言自然语言处理(NLP):情感分析新闻文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
R语言对推特twitter数据进行文本情感分析
R语言中的LDA模型:对文本数据进行主题模型topic modeling分析
R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)