那些高评价,真的可以相信吗?识别虚假评论的新训练方法

那些高评价,真的可以相信吗?识别虚假评论的新训练方法

你能看穿五星评价的背后吗——假评论时代所需的“消费者解读能力”

在网上购物时,我们会关注什么呢?价格、图片、配送日期、品牌名称。而在很多情况下,最后的决定因素是评论。如果星级高,正面评论多,我们会觉得“买了也没问题”。相反,如果低评价突出,即使商品图片再吸引人,我们也会犹豫不决。

然而,这些星级真的可靠吗?

在线评论已成为现代消费行为中的“信任基础设施”。陌生人的体验会影响我们的购物决策。虽然这体现了集体智慧的力量,但也存在着故意操控购买决策的假评论问题。

在荷兰特温特大学进行博士研究的Michelle Walther氏从一个有趣的角度研究了这个问题。虽然利用AI自动检测假评论的研究越来越多,但Walther氏关注的是阅读评论的“消费者自身”的判断过程。人们如何阅读评论,信任哪些线索,以及在什么阶段决定“不参考这个评论”。她揭示了这一机制,并验证了通过训练能否提高识别假评论的能力。


消费者并不是为了“寻找假货”而阅读评论

这项研究的一个重要点是,消费者在阅读在线评论时,并不一定是为了“识别假评论”。对很多人来说,阅读评论的目的更为实用。

这款商品适合自己吗?尺寸如何?描述中有没有未提及的缺点?实际使用者是否满意?

也就是说,消费者首先寻找的是“有用的商品信息”。判断评论是否为假评论并不是购物的核心目的,而往往是在判断过程中产生的附带任务。

这就是假评论的棘手之处。在消费者没有警觉的状态下,看到看似自然的体验评论。如果星级高,文字也看似合理,甚至连发布者的名字和头像都很完美,读者很可能会不加怀疑地接受。假评论正是渗透进这种“正常阅读方式”中。


什么是CREM模型

Walther氏通过文献回顾、观察、思维发声法等方法,整理了消费者评估评论的过程。由此诞生了“消费者评论评估模型”,简称CREM模型。

CREM模型显示,消费者并不是一下子就信任评论,而是分阶段进行判断。大致来说,消费者首先查看评论的相关性。是否与自己想了解的商品信息相关,是否符合自己考虑的用途,是否描述了具体的使用场景。

接下来,评估发布者的可信度。是否看起来像实际使用过商品的人,发布历史和个人资料是否有不自然之处,评论内容和评分是否有偏差等都是线索。

最后,查看评论正文本身的可信度。内容是否具体,是否过度夸张,是否有相似的表达,情感表达和星级是否自然一致。通过这些多个因素,消费者决定是否将该评论纳入购买决策。

有趣的是,这一过程并不一定是像专家那样严格的验证。许多消费者在有限的时间内依赖直觉和经验阅读评论。因此,识别假评论不仅依赖于“知识”,也依赖于“阅读习惯”。


通过训练,识别假评论的能力可以提高

Walther氏的研究还指出,消费者识别假评论的能力可以通过训练得到改善。

基于CREM模型的训练,帮助消费者整理看评论时的视角,学习应该注意哪些线索。例如,不仅仅看星级,还要确认正文的具体性、发布者的可信度、评论内容和评分的一致性。极端的正面或负面表达、不涉及商品特征的抽象赞美、多个评论中出现的不自然表达等,也可能是需要警惕的信号。

研究表明,接受这种训练的参与者显著提高了识别假评论的能力。这表明,不仅可以依靠平台来对抗假评论,也可以作为消费者教育的一部分来推进。

当然,不应将所有责任都推给消费者。发布假评论的企业、买卖评论的商家、对策不充分的平台各自都有明确的责任。然而,现实中要完全消除假评论还需要时间。在此期间,消费者自身掌握“阅读评论的能力”是一个防御措施。


仅靠AI检测是不够的原因

在假评论对策中,AI自动检测也是一个重要的主题。相关研究中,通过结合评论正文的语言特征、发布行为、星级一致性、文章长度等,报告了高精度判定不正当评论的模型。

然而,AI检测也有其局限性。因为写假评论的一方也在进化。利用生成AI,可以比以前更自然地大量创作文章。如果仅仅关注简单的关键词或不自然的语言、相似的文体,可能会错过巧妙的假评论。

此外,评论的真伪不一定仅由文章决定。即使没有实际购买商品,也可以写出看似真实的体验。反之,真实的评论也可能简短抽象。AI判断为可疑的评论不一定是假货,AI通过的评论也不一定是真实的。

正因为如此,需要结合平台检测、法律法规、企业透明性和消费者教育。Walther氏的研究在于其关注“阅读者的认知过程”这一点上具有价值。


社交媒体上的反应——“要求严惩的声音”和“对AI的期待”

由于Phys.org的文章刚刚发布,目前在社交媒体上还没有大规模的讨论。在Phys.org上,分享数量较少,评论也不多。然而,针对假评论问题的整体社交媒体和商业社区的反应显示出相当高的关注度。

在相关的LinkedIn帖子中,关于识别假评论的AI模型的新闻,介绍了不仅仅是语言分析,还结合发布行为等信号的方法。虽然反应数量不大,但讨论的方向同时存在“如果能通过AI检测到就欢迎”的期待和“假评论方也会利用AI变得更巧妙”的警惕。

此外,在处理评论调查的行业帖子中,显示出消费者对进行假评论的企业要求处罚的声音很强烈。特别是,要求从评论网站中排除、从搜索结果中删除、罚款,甚至在某些情况下要求刑事处罚的意见被介绍,显示出消费者的不信任感已经相当深刻。

总结社交媒体的氛围,假评论不再是“稍微夸大的宣传”可以解决的问题。它被视为夺走消费者的时间和金钱,使认真做生意的企业处于不利地位,并破坏评论这一机制的行为。

另一方面,消费者也感到疲惫。“每个评论看起来都值得怀疑”,“星级5和星级1都不可信”,“最终只能查看官方信息和退货条件”等感受是许多人容易分享的。评论越多,选择可信信息的负担也越大。假评论问题也是信息过载时代的“信任疲劳”的一部分。


对企业来说,假评论也是一种风险

假评论不仅是消费者的问题,对企业来说也是一个巨大的风险。

短期内,假高评价评论可能会增加销售额。但一旦被发现不正当行为,品牌的信任将受到巨大损害。此外,美国FTC已出台禁止假评论和虚假推荐的规则,英国也要求Google等加强假评论对策。法律法规的趋势显然越来越严格。

企业需要注意的不仅仅是自己不写假评论。激励性评论的处理、员工或相关人员的评论、不当删除负面评论、伪装成评论网站的自我宣传等也可能成为问题。评论看似介于广告和口碑之间,但由于对消费者的影响很大,因此需要透明性和公正性。

对于认真的企业来说,假评论对策既是一种负担,也是一种差异化的机会。购买者认证、明确的评论发布政策、对低评价的诚实回复、不自然评论的举报、商品改进的反映。这些踏实的措施比短期的星级更能建立长期的信任。


消费者从今天开始可以做的评论阅读方法

那么,消费者在看评论时应该注意什么呢?如果将CREM模型的思维方式应用到日常购物中,首先要看“该评论是否回答了自己想知道的信息”。比起简单的“非常好”“推荐”,描述使用情况、时间、比较对象、缺点的评论更具参考价值。

其次,看发布者的可信度。是否有购买者认证,发布历史是否极端偏向,是否在同一天连续发布类似的高评价。虽然完美的个人资料不一定是真实的,但不自然的模式是警示材料。

此外,看评论正文的平衡。实际使用者通常会写出不仅是优点,还有小的不满。相反,像广告文一样只列出优点的评论或不涉及商品具体特征的赞美需要注意。星级和正文的温度差也是线索。星级5但内容过于简单,星级1但没有具体问题的情况下,不要仅凭该评论做出判断。

最后,重要的是看整体的分布,而不是单一评论。阅读高评价和低评价,寻找共同指出的问题。如果多个人具体描述了同样的缺点,那可能是重要信息。相反,如果相似的表达的高评价在短期内集中出现,最好谨慎对待。


从“相信”评论到“解读”评论

在线评论很方便。实际上,对于很多人来说,如果没有评论,网上购物会更加不安。问题不在于无条件地相信评论,也不在于怀疑一切。需要的是以信息的方式解读评论的姿态。

Walther氏的研究可视化了消费者如何评估评论,并展示了通过训练可以提高判断力的可能性。这不仅将假评论对策视为技术问题,还提供了将其视为包括消费者教育、平台设计、企业伦理、法律法规在内的社会问题的视角。

星级将继续影响我们的购物。因此,了解这些星级是如何产生的,由谁讲述的,以及可以信任到什么程度的能力是必要的。

评论社会的下一个课题不是增加评论,而是找到可信的评论,创造一个不被可疑评论左右的环境。而这第一步始于我们每个人稍微注意地看星级的背后。


出处URL