AI时代的文化进化会停止吗?便利背后推进的“均质化” — 只有AI容易选择的表达会留存的未来

AI时代的文化进化会停止吗?便利背后推进的“均质化” — 只有AI容易选择的表达会留存的未来

随着生成AI的普及,人们多次表达了这样的担忧:“网络将被AI生成的内容填满,最终AI将学习AI,导致质量下降。”然而,Phys.org介绍的最新研究将这种“未来的担忧”向前推进了一步。结论是,文化的同质化可能在不等待再学习的情况下就已经发生。而且原因不在于“模型是否聪明”,而在于操作的重复本身


1) 实验是“视觉传话游戏”——让AI之间进行

研究人员进行的不是奇特的提示词大战。机制简单,因此令人恐惧。
将生成图像的AI将图像转化为文字(说明文字)的AI连接起来,并重复以下循环。

  • 文字(提示词)→ 图像生成

  • 生成图像 → 转化为说明文字

  • 将说明文字作为下一个图像生成的提示词

  • 重复数十次、数百次


这里的关键是,没有对AI进行额外学习。这不是通过提供新数据导致“学习质量下降”的问题,而是仅仅通过重复使用,输出就被吸引到相似的方向


实际上,无论起始提示词有多么多样化,生成的随机性设置如何变化,最终输出都会集中到**极为有限的“无害外观”**。研究人员为这一结果命名为“视觉电梯音乐”虽然整齐但内容空洞,虽然舒适但没有留下任何印象——正是“看似合理”的极致。


2) 为什么会收敛?——AI只保留“易于解释的东西”

这一现象不仅仅是因为“AI的创造性低”。它更具结构性。
在图像→文字→图像的转换中,易于语言化的元素得以保留,而难以语言化的元素则容易被削减。


例如,政治戏剧的紧张感、讽刺、时代背景的氛围、人物关系的“间隙”、视线的意义、场景的气氛。这些在说明文字阶段“难以解释”,因此容易被替换为一般名词和安全的形容词。


于是,在下一次生成时,会选择与这些“易于解释的词汇群”相符的典型图像。随着重复,作品本应有的核心意图蒸发,只剩下无人触动的平均情景


有趣的是,这发生在所谓的“模式崩溃”或“学习数据污染”之前。换句话说,即使未来的AI是否学习AI生成物尚未确定,“生成→总结→再生成”的文化管道自然地朝着稀释意义的方向运作。


3) 研究是否“极端”?——但现实中循环更为日常

“这样的AI无限循环,在现实中不会发生吧?”你可能会这样想。然而在我们周围,形式变化的循环已经日常化。

  • 图像被总结为简短的说明文字(说明文字/alt文本)

  • 文章被总结为项目符号

  • 总结被重新包装为缩略图或短视频

  • 在排行榜中,“强大的模式”得以保留,相似的模式被模仿

  • 生成AI的候选项中,人类只需“选择”


这里重复的是,将作品的价值通过“多层翻译”和“选择”来传递。翻译和选择是必要的,但重复越多,越容易保留的是典型、无害、可解释、商业上安全的东西。研究可以说是将这种压力微型化展示出来。


4) 对“文化停滞是道德恐慌”的回应

新技术的出现总是伴随着“文化将被破坏”的声音。摄影没有杀死绘画,电影没有杀死舞台,数字技术创造了新的表达方式,这是事实。


但这次的焦点不在于“新工具的出现”。文化通过同类的生成、总结、推荐、排名装置,在全球范围内被多次再加工


过去的技术增加了表达手段。然而现在,不仅仅是表达手段的增加,在“流通的过程中”意义被多次压缩和再生成。而且这种压缩往往无意中趋向于“平均”。因此,这不仅仅是怀旧的担忧,而是现代信息生态系统的设计问题


5) “可量产=创新”并不成立

生成AI可以大量生成变体。但研究指出,数量的爆发并不等同于探索空间的扩大
即使生成数万张图像,如果只是同一个“狭窄谷地”中的微小差异,文化的地形不会扩展。反而,平均的谷地只会变得更深。


6) 那么该怎么办?——设计“逆向平均的引力”

不必以悲观收尾。研究表明,“如果放任不管就会收敛”,而不是“必然停滞”。对策的方向已经显现。

  • 奖励偏离:引入优先评价罕见构图、词汇、素材的评价标准(即“反无害分数”)

  • 不丢弃语境的流通:为作品附上创作意图、参考来源、背景说明,以补充总结中丢失的信息

  • 设计选择方式:在选择候选项之前,先定义“想要打破什么/想要避免什么”再进行生成

  • 推荐的多样性限制:为避免同一模式持续出现,施加最低多样性限制


换句话说,AI作为“平均生成器”越是便利地运作,平均就越被强化。因此,需要构建偏离平均值有利的回路


7) SNS的反应——分为“理解”、“归结于数据”、“需要人类”

 


当这个话题在SNS上传播时,反应大致分为三种温度带。

(1)“这点我体会到了”派

许多帖子对“视觉电梯音乐”这一比喻表示强烈认同。接触过生成AI的人越多,越用“虽然整齐,但总觉得被忽视的感觉”、“留下诡异的既视感”等表达来描述“薄弱”。实验结果与用户的直观感受相连接的瞬间。

(2)“归根结底是数据和偏见”派

研究显示的12个主题收敛,不仅被视为“模型的性质”,也被视为“人类拍摄的照片偏好(容易被拍摄的东西)”的反映。这意味着,AI并非从零创造,而是放大了人类社会的“拍摄习惯”和“畅销趋势”。这里也包含了“在归咎于AI之前,人类的文化消费是否已经先趋于同质化”的反思。

(3)“因此需要人类的策展”派

随着AI自主运作的次数增加,反而人类的编辑、审美眼光、语境赋予的价值上升。有人认为,“因为人类最后选择,所以没问题”,而是“为了让人类能在最后选择,需要在过程中设计不让意义消失”。

总体来看,SNS的氛围不是AI的赞美或拒绝,而是以“回归平均的力量”为前提,讨论人类在何处掌舵


8) 结论——让文化变平的是性能而非“运作方式”

这项研究最可怕的一点是,不需要恶意或阴谋。即使不等待再学习的污染,仅仅是便利地、重复地使用,意义就会变得稀薄。
因此,应该问的不仅是“AI是否具有创造性”。我们是否在便利的名义下构建了削弱创造性的流通回路


“看似合理”是一种麻醉。舒适感让怀疑的力量沉睡。
“视觉电梯音乐”这个词刺痛人心,因为我们的时间线有时像背景音乐一样流逝。为了不让文化趋于平均,所需的可能是比生成速度竞争更重要的重新传递意义的设计思想



出处URL