嘉兴一中实验学校
摘要:用户点评数据为用户选择汽车提供方便,同时也为厂家了解自身品牌及竞争对手提供了数据支持。文章基于太平汽车网,利用社会网络分析的方法,对汉兰达2022与奥迪A3的共性及差异性进行了比较,发现两款车型设计的注重点和受众人群有很大的差异。汉兰达作为一款suv, 有着更加大的空间而且保持了相对较好的油耗,而奥迪作为BBA的一员,在外观上能得到更多人的喜爱,更加运动的外观满足了消费者的心理,并且在动力和油耗方面做的也很好。而在缺点方面,汉兰达的动力遭到了诟病,并且车身造型和内饰的用料并不能令人满意;奥迪的缺点更多是在噪音和车内的气味问题。
关键词:用户点评汽车汉兰达2022奥迪A3
1. 引言
汽车业是近一个世纪内发展最为快速的产业,也是国民经济的支柱性产业,第二次工业革命和科技的飞速发展,更是使汽车作为消费品走入了千家万户。如何在众多品牌中选择自己适合的汽车,是消费者最直接的需要。此外,对于汽车厂商及庞大规模的汽车零部件供应商来说,了解自身产品及竞争对手产品的特征及用户反馈,一直是其产品研发、产品升级、服务以及营销的重要环节。但由于汽车产业链非常长,复杂性高,市场反馈传到到终端零部件商需要经过销售人员-4S店-汽车整车厂-上级零部件供应商-下级甚至多级零部件供应商。随着越来越多的汽车之家、太平洋汽车等互联网平台的出现,这些平台设计了车主点评频道,使汽车产业链上的所有节点,第一时间都能同步看到用户的反馈。但由于点评数据量大且分散,用户评价的内容仍需要进一步分析。近期,网络有讨论汉兰达2022与奥迪A3的选择争议,本文以这一主题为例,运用文本分析和社会网络分析方法,对两种品牌汽车进行系统地分析和比较。 以期为用户点评数据分析提供方法论。
2. 数据与方法
2.1 数据来源与采集工具
太平洋汽车网是汽车互联网平台,其中设置了车主点评频道,网址是:https://price.pcauto.com.cn/comment/,进入该页面,输入测评的汽车品牌及型号后,页面下出现10个车主的点评,翻页可以看到更多车主的点评。每位车主的点评均是从优点、缺点、外观、 内饰、 空间、配置、动力和油耗共8个维度进行评价。其中优点和缺点是两个最重要的字段,是对汽车综合性的,最全面的评价。为此,本研究分别选取了汉兰达2022与奥迪A3共计100条评价中的优点和缺点的评价(每种50条)。利用文本分析及社会网络分析方法,对数据进行处理和分析 。
数据采集选择八爪鱼软件进行采集。八爪鱼是一款数据爬取软件,采用该软件爬取太平洋汽车网中奥迪A3以及汉兰达2022车主的评论,利用,因为八爪鱼的自定义方法,建立数据采集任务,完成了近期两种车型100条点评数据的采集。
2.2 研究方法
(1)文本分析方法
文本(Text)主要指由一定的符号或符码组成的信息结构体,自媒体发展以来,出现大量网民创造的内容(文本),它反映出人的特定立场、观点、价值和利益等,了解和分析互联网用户内容,成为文本分析重要的应用场景。文本分析方法就是针对文本数据进行语义分析的一种方法。
集搜客(http://www.gooseeker.com/)是一款可以用于文本分析的工具。本研究利用集搜客,对采集的点评数据进行分词和词云可视化,为了进一步识别语义,再对高频词进行共词匹配(得到高频词在一个句子中同时出现的关系矩阵),得到共词关系矩阵,得到的共词矩阵导入社会网络分析软件,进行共词可视化分析。从中识别用户的评价。
(2)社会网络分析方法。
社会网络分析是适应研究社会结构和社会关系需要而发展起来的一种分析方法,主要分析行动者之间的关系状况,寻找关系的特征以及发现这些关系对组织的影响。社会网络分析方法经典的软件是Ucinet。在用户评价的文本数据分析中,分词之后,词与词之间如果在同一个句子中,如“这个车的空间还是很大的”,即“空间”和“很大”在同一个句子中,即识别出用户评价“空间很大”的语义。多个高频词构成的共词网络,就可能清楚地反映出用户评价的语义内容。
3. 数据分析
3.1 用户评分比较
八爪鱼爬取的数据中,不仅用评价的文本数据,还有对车辆、外观、内饰、空间、配置、动力油耗的评分数据。表1分别列出了汉兰达2022和奥迪A3在以上7个指标上的评分以及差值。从评分均值看,奥迪A3的评分高于汉兰达的评分。只有空间一项指标,汉兰达优于奥迪,而在内饰评分中,两车分数相差较大,说明用户给奥迪内饰评分更高。其他分数总体而言相差不多,说明汉兰达的其他方面与奥迪A3之间的差别不大。
表1汉兰达和奥迪评分
指标 车型 | 车辆评分 | 外观评分 | 内饰评分 | 空间 评分 | 配置评分 | 动力评分 | 油耗评分 | 评分均值 |
奥迪 | 4.5 | 4.9 | 4.7 | 4.58 | 4.68 | 4.62 | 4.64 | 4.66 |
汉兰达 | 3.6 | 4.58 | 3.96 | 4.62 | 4.4 | 4.42 | 4.62 | 4.31 |
差值 | 0.9 | 0.32 | 0.74 | -0.04 | 0.28 | 0.2 | 0.02 | 0.35 |
3.2 优点比较
将两车型的用户评价中的优点提取出来,形成“汉兰达优点”文档hy1和“奥迪优点”文档ay1,文档导入集搜客,分词和选词后,绘制出两个词云图(图1和图2)。将两车型的用户评价中的优点提取出来,形成“汉兰达优点”文档hy1和“奥迪优点”文档ay1,文档导入集搜客,分词和选词后,绘制出两个词云图(图1和图2)。词云图是用户优点评价中出现的高频词,依据高频词出现的次数同比例显示。 可以清楚地看到,空间是汉兰达2022最为突出的优点,外观是奥迪A3最突出的优点。两车在油耗、空间与外观方面都得到了车主的肯定,说明油耗与外观是这两车的共同优点。同样,这两车之间也有不同的优点,汉兰达被在设计方面被提到多次但奥迪A3几乎没有。奥迪A3在舒适度,动力,与外观上强与汉兰达,在词云中,这几个词明显大于汉兰达词云中的词。
(1)词云比较
图1汉兰达2020优点评论词云图2 奥迪A3优点评论词云
(2)共词分析:
对“汉兰达优点”文档hy1和“奥迪优点”文档ay1进行共词分析。在集搜客中,分词和选词完成之后,点击“共词匹配”,分别得到两车型的共词矩阵。将两个共词矩阵分别导入到Ucnet中,并利用可视化软件Netdraw, 得到两车型的共词关系网络。 由于汉兰达的评论数量较多和杂,所以为了方便找到更有效的信息,删除了共词关系不少于2次的词语,得到了图3;而奥迪由于评论比较少且密集,删除了共词关系不少于1次的词语,得到图4。可以看到,图3中最密集的有“空间,满意,不错”,这些词代表绝大部分的车主对于汉兰达的车身空间比较满意。而奥迪的词云图突出的词语为:“外观,造型,大气,高级,高贵”这些词有强相关性,说明大部分购车用户对于奥迪A3这款车较为运动的车身设计十分的满意,并且车主十分满意奥迪的品牌定位以及品牌调性,同时图中的动力和变速箱于其余很多词联系紧密,说明奥迪整车的动力强劲。在车内的空间内,车主点评中对于内饰的科技感和大气也都有提及。
图3汉兰达优点共词网络 图4 奥迪优点共词网络
3.3 缺点比较
将两车型的用户评价中的缺点提取出来,形成“汉兰达缺点”文档hy2和“奥迪缺点”文档ay2,文档导入集搜客,分词和选词后,绘制出两个词云图(图5和图6)。
图5显示,汉兰达动力、感觉等词较大说明在评论中出现次数多,说明汉兰达的动力与驾驶感觉较弱;图6显示,轮胎,难闻,油耗,空间,噪音,座椅,味道等词较大,说明在这些方面奥迪A3这几方面用户反映不好,作为小型车,空间不是其主要追求,但味道和噪音是其主要问题。
(1)词云图
图5 汉兰达缺点词云图 图6 奥迪缺点词云
(2)共词分析:
同样的方法,建立两车型的缺点共词网络(图7、图8)。图7中,汉兰达外观设计及噪音被用户多次批评,其次动力这个词也与众多表达不满意的词相连接。说明用户觉得该车动力不足。图8中,奥迪A3的缺点更加集中,不满意与气味共词次数高(线较粗),不满意与难闻共词次数高。可以看出车主对于车内难闻的气味多有抱怨;其次共词图中胎噪的次数也十分多,证明奥迪在胎噪的控制并没有达到客户的需求;油耗与不满意共词次数高,说明奥迪A3的油耗也被用户抱怨。
图7 汉兰达缺点共词图 图8 奥迪缺点共词图
4. 结语
本文从用户评分和用户优缺点的内容评价分析两个方面对汉兰达2022和奥迪A3进行了分析,从研究中看到,用户评价简介直观,但包括的信息量较少,用户在打分评价时,相对来说较为模糊,两车差异性不大。但在优点和缺点的内容表达中,却清楚地看到两车较大的差异。汉兰达总体指标差异性不大,即优点和缺点并不是很突出;而奥迪却体现了明显的差异性,优点就是漂亮,缺点就是气味和噪音。通过分析,两种车型的特征很清楚地表征出来。对于车主点评中关于外观、油耗等的单项评价,经过测试发现,与优点和缺点评价表现出很强的一致性。因此,用户点评的多项指标中,对优点和缺点进行评价,即能直到测评和比较的作用。
参考文献
1. 罗家德. 社会网分析讲义.社会科学文献出版社. 2020.5
2. http://www.gooseeker.com/