人工智能:技术如何助长误解

2021 年 1 月,人工智能研究实验室 OpenAI 发布了一款名为 Dall-E 的软件的限量版。该软件允许用户输入他们心中的图像的简单描述,在短暂的停顿之后,该软件对他们的提议提供了几乎出奇的好解释,值得聘请的插画师或精通 Adobe 的设计师 - - 但很多更快更免费。例如,输入“Antoine de Saint-Exupéry 插画的一只长着翅膀飞过月球的猪”,经过一两分钟的处理后,结果让人想起《小王子》的创作者的斑点但可辨认的水彩画笔。

 

AI DALL-E 截图

大约一年后,随着该软件的发布范围越来越广,互联网变得疯狂起来。社交媒体充斥着各种奇异而奇妙的创作,充满幻想和艺术风格的大杂烩。几个月后,它又发生了,这次是语音和一款名为 ChatGPT 的产品,也是由 OpenAI 生产的。要求 ChatGPT 创建一个诗人艾伦金斯伯格风格的约伯记概要,它会在几秒钟内提供一个合理的尝试。要求它以商业顾问幻灯片演示的形式呈现金斯伯格的诗《嚎叫》,它会这样做。这些节目用文字和图像创造出陌生的新世界的能力取悦了观众,并且渴望

后一种能力被称为“即时工程”:一种以系统最清楚地理解的方式制定指令的技术,以便它返回最接近 - - 或者可能超过 - - 预期的结果。技术评论员很快预测,在没有代码的未来,即时工程将成为令人垂涎且薪水丰厚的职位描述,其中与智能系统交互的最强大方式将是通过人类语言作为媒介。我们将不再需要能够绘制或编写计算机代码:我们只需向机器低声说出我们的愿望,剩下的就由它来完成。人工智能创造的极限就是我们自己想象力的极限。

Dall-E 模仿者和进一步的发展很快接踵而至。Dall-E mini(后来更名为 Craiyon)让那些没有受邀参加 OpenAI 私人服务的人有机会使用类似的、功能较弱但仍然非常令人印象深刻的工具。与此同时,独立商业公司 Midjourney 和开源程序 Stable Diffusion 使用不同的方法来分类和生成图像,以实现基本相同的目标。几个月内,该领域迅速发展为短视频和 3D 模型生成,每天都有来自学术部门和爱好者程序员的新工具出现,以及社交媒体和现在的 AI 巨头:Facebook(又名 Meta)。、谷歌、微软等。一个新的研究、软件和竞争领域已经开辟。

Dall-E 这个名字将迪士尼电影《机器人总动员》中的机器人主角与西班牙超现实主义画家萨尔瓦多·达利联系在一起。一方面,你有一个勇敢、自主、可爱的小机器的性格,正在扫除崩溃的人类文明的残骸;另一方面,你有一个最常说的人,“不寻求模仿的人什么也不生产。 “ 和“重要的是制造混乱,而不是消除混乱。” 两者都是以 AI 图像生成器而闻名的各种工具的令人钦佩的同名词。

消费者人工智能的新浪潮

在过去的一年里,包括图像生成和 ChatGPT 等工具在内的这一新的消费者 AI 浪潮激发了所有人的想象力。它还增加了大型科技公司的财富,尽管他们做出了很多努力,但未能让我们大多数人相信区块链或虚拟现实(“元宇宙”)是我们所有人都想要的未来。至少这个感觉有趣五分钟左右;而“人工智能”仍然具有那种闪闪发光的科幻品质,让人想起巨型机器人和超人的大脑,这让人们几乎无法接触到真正的新事物。当然,幕后发生的事情绝非新鲜事。

几十年来,人工智能学科一直没有重大突破。神经网络的基础技术 - - 一种基于物理大脑工作方式的机器学习方法 - - 早在 1990 年代就已被理论化甚至付诸实践。即便如此,你也可以用它来创造图像,但它们大多是无形的抽象,几乎没有情感或审美共鸣的色彩斑点。第一个令人信服的 AI 聊天机器人甚至更早。1964 年,麻省理工学院的计算机科学家 Joseph Weizenbaum 开发了一个名为 Eliza 的聊天机器人。伊丽莎以一位“以人为本”的心理治疗师为蓝本:无论你说什么都会反映给你。

早期的人工智能对世界知之甚少,学术部门缺乏大规模使用它的计算能力。今天的区别不在于智能,而在于数据和能力。大型科技公司花了 20 年的时间从文化和日常生活中收集大量数据,建立了巨大、耗电的数据中心,并配备了功能越来越强大的计算机来处理这些数据。曾经摇摇欲坠的旧神经网络已经成为超级大国,结果就是我们看到的人工智能的激增。

人工智能图像生成依赖于对数以百万计的标记图像的编译和分析;也就是说,已经提供了对其内容的某种描述的图像。然后,这些图像和描述由神经网络处理,神经网络学习将图像的特定和深度细微差别的特性 - 形状、颜色、构图 - 与特定的单词和短语相关联。然后,这些品质相互叠加,根据一个简单提示产生的数十亿个不同权重的联想,创造出新的形式、颜色和构图安排。但是所有这些原始图像是从哪里来的呢?

德国非营利组织 LAION 发布的数据集是用于训练大型 AI 模型的图像文本集合类型的一个很好的例子(它们构成了 Stable Diffusion 和 Google 的 Imagen 的基础)。十多年来,另一个非营利性网络组织 Common Crawl 已经索引并存储了尽可能多的公共万维网,每月归档多达 30 亿页。LAION 研究人员获取了一部分 Common Crawl 数据,并提取了每张带有“alt”标签的图像,一行文本或用于描述网页图像的内容。

名为 Lapine 的数字艺术家
 
2022 年 9 月,一位名叫 Lapine 的旧金山数字艺术家使用了一种名为 Have I Been Trained 的工具,该工具允许艺术家查看他们的作品是否被用于训练 AI 成像模型。Have I Been Trained 由艺术家 Mat Dryhurst 和 Holly Herndon 创作,他们自己的作品让他们探索了艺术家的作品被 AI 吸收的方式。当 Lapine 用它来搜索 LAION 数据库时,她找到了一张自己的脸。她能够将这张照片追溯到医生在治疗罕见遗传病期间拍摄的照片。这些照片是作为她的临床文件的一部分拍摄的,她签署了仅限于其医疗记录使用的文件。涉及的医生于 2018 年去世。不知何故,这些私人医学图像最终出现在网上,然后出现在 Common Crawl 档案和 LAION 的数据集中,并最终进入神经网络,因为他们了解图像的含义和新图像的创建。据我们所知,我们圣埃克苏佩里风格的小猪身上斑驳的粉红色质地,无论多么微妙,都可能是从癌症患者的生肉中混合而成的。

圣埃克苏佩里风格的小猪

“这相当于获得被盗财产的数字等价物。有人从我已故医生的档案中偷走了这张照片,它最终出现在互联网上的某个地方,然后它被刮进了这张记录,”Lapine 告诉 Ars Technica。“照片被泄露已经够糟糕了,但现在它是产品的一部分. 这适用于所有照片、医疗记录与否。而且未来滥用的可能性非常高。”(根据她的 Twitter 帐户,Lapine 继续使用像 Dall-E 这样的工具来创作她自己的艺术作品。)

所有这类公开可用的人工智能,无论是处理图像还是文字,以及许多此类数据驱动的应用程序,都是基于对现有文化的大量挪用,其程度我们几乎无法理解。公共或私人、合法或其他方式,这些系统拼凑在一起的大多数文本和图像都处于“合理使用”的模糊领域(在美国允许,但在欧盟如果不是完全非法则值得怀疑)。与高级神经网络中的大多数操作一样,从外部了解它们的工作原理确实是不可能的,除了像 Lapine 这样的罕见情况。   但我们可以肯定:  这类人工智能的结果远非神奇,

人工智能拥有艺术

人工智能图像和文本生成是纯粹的原始积累:  征用许多人的劳动来丰富和推进一些硅谷科技公司及其亿万富翁所有者。这些公司通过干预日常生活的方方面面来赚钱,包括我们生活中最私人和最具创造力的领域:我们的秘密激情、我们的私人谈话、我们的相似之处和我们的梦想。他们围绕着我们的想象力,就像地主和强盗大亨曾经围绕着公共土地一样。他们承诺,通过这样做,他们将开辟人类经验的新领域,让我们获得所有人类知识,并创造新型的人际关系。

AI成像的怪异之处在于输出和输入。一位用户尝试输入无意义的表达,但发现 Dall-E mini 似乎很清楚什么是“Crungus”时感到困惑和不安:这是一种不熟悉的表达,始终以咆哮的裸体食人魔图像为特色-样的人物产生。Crungus 在程序的想象中如此清晰,以至于他很容易被操纵:其他用户很快提供了古代 Crungus 挂毯的图像、罗马风格的 Crungus 马赛克、Crungus 的油画、Crungus 拥抱各种名人的照片,而且,这就是互联网,在,“性感”克鲁格斯。

那么 Crungus 是谁或什么?Twitter 用户很快称他为“第一个 AI cryptid”,这是一种像 Bigfoot 这样的生物,在这种情况下,它存在于 AI 想象中尚未开发的领域。鉴于我们对系统工作原理的了解有限,这是目前我们可以获得的最明确的答案。我们无法研究它的决策过程,因为这些神经网络“思考”的方式本质上是不人道的。它是世界极其复杂的数学排序的产物,与人们排序思维的历史、情感方式相反。Crungus 是一个从 AI 的世界模型中浮现出来的梦想,它由数十亿个参考组成,它们已经脱离了它们的起源,并融入了一个脱离人类经验的神话人物。哪个好,甚至令人惊叹 - 但它引出了一个问题,我们在这里借鉴了谁的梦想?什么样的人类文化构成,什么样的视角,造成了这场噩梦?

另一位正在尝试负面提示的数字艺术家也有类似的经历,这是一种创建系统认为与所描述内容截然相反的技术。当艺术家输入“Brando::-1”时,系统返回的内容有点像一家名为 DIGITA PNTICS 的视频游戏公司的徽标。在系统世界观的多个维度上,这可能与马龙白兰度相反,这似乎很合理。但是,当他们通过输入“DIGITA PNTICS skyline logo::-1”来验证它是反方向时,更奇怪的事情发生了:所有的图像都显示了一个看起来阴险的女人,眼睛凹陷,脸颊通红,艺术家给她起名叫 Loab 。一旦被发现,Loab 似乎异常执着,令人不安。将图像重新送入程序,

这是对 Loab 和可能的 Crungus 的解释:虽然很难想象机器的想象力是如何工作的,但可以想象它有一种形式。这种形状永远不会是光滑的或整齐的圆形,而是会有山谷和山峰,山脉和山谷,信息丰富的区域和缺乏许多特征的区域。这些信息含量高的区域对应于系统“了解”很多的关联网络。考虑到通过检查整个 Internet 发现的图像分布,可以想象与人脸、汽车和猫等相关的区域非常密集。

人工智能图像生成器在创建图像时将最依赖这些区域。但是当使用负面提示 - 或者实际上是无意义的短语 - 时,还有其他较少访问的地方会发挥作用。为了回答此类问题,机器必须求助于更深奥、更不安全的连接,甚至可能从其全部知识中推断出相反的结果。在偏远地区,可以找到 Loab 和 Crungus。

这是一个令人满意的理论,但它提出了一些令人不安的问题,即为什么 Crungus 和 Loab 看起来像这样;为什么他们倾向于恐怖和暴力,为什么他们暗示噩梦。人工智能图像生成器似乎在试图理解和复制所有人类视觉文化的过程中重现了我们最黑暗的恐惧。也许这只是一个迹象,表明这些系统真的非常擅长模仿人类意识,一直到潜伏在存在深处的恐惧:我们对污秽、死亡和腐败的恐惧。如果是这样,我们必须承认,这些将是我们按照自己的形象建造的机器的永久组成部分。无法摆脱这种困扰和危险,也无法缓和或消除人类存在的现实。

这很重要,因为 AI 图像生成器将做所有以前的技术所做的事情,但它们还会走得更远。它们将重现创造它们的人的偏见和成见,例如只能识别白人面孔的网络摄像头,或围攻低收入社区的预测性警察系统。他们也将改进游戏:人工智能性能的规模从狭隘的谜题和挑战领域 - - 下国际象棋或围棋或遵守交通规则 - - 转移到更广泛的想象力和创造力领域。

虽然人工智能“创造力”的说法可能被夸大了 - - 在图像生成方面没有真正的独创性,只有非常熟练的模仿和拟态 - - 但这并不意味着它无法承担许多常见的“艺术”任务,长期以来被认为是技术人员的专利工人,从插画家和平面设计师到音乐家、摄像师甚至作家。这是一个巨大的转变。人工智能现在正在参与感受、情绪和情绪的潜在体验,这将使其能够在更深层次和更引人注目的层面上塑造和影响世界。

人工智能和人类创造力可能会相互作用

ChatGPT 由 OpenAI 于 2022 年 11 月推出,继续改变我们对人工智能和人类创造力如何相互作用的理解。ChatGPT 的结构类似于聊天机器人 - 一种模仿人类对话的程序 - ChatGPT 可以做的不仅仅是对话。当提示时,它能够编写工作计算机代码、解决数学问题并模仿常见的写作任务,从书评到学术论文、婚礼演讲和法律合同。

很明显,该程序可以如何为那些发现难以撰写电子邮件或论文的人带来福音,而且还可以如何使用它,如图像生成器,来取代那些以这些任务为生的人。由于担心学生会用它来撰写论文,许多学校和大学已经出台了禁止使用 ChatGPT 的政策,而学术期刊《自然》不得不发布政策解释为什么该程序不被视为研究作者执行(不能征得同意)并且不能追究责任)。但机构本身也无法避免不当使用该工具:2 月,田纳西州范德比尔特大学的皮博迪教育与人类发展学院,在密歇根州校园枪击事件发生后,它发出了一封慰问信和建议,震惊了学生们。虽然这封信谈到了社区的价值、相互尊重和团结,但末尾的注释表明它是由 ChatGPT 撰写的 - - 这在道德上是错误的,而且在某种程度上对许多人来说是错误的或令人毛骨悚然的。在生活的许多领域,机器干预似乎都需要更深入的思考。相互尊重和团结,最后的注释说它是由 ChatGPT 编写的 - - 这在道德上是错误的,而且在某种程度上对许多人来说是错误的或令人毛骨悚然的。在生活的许多领域,机器干预似乎都需要更深入的思考。相互尊重和团结,最后的注释说它是由 ChatGPT 编写的 - - 这在道德上是错误的,而且在某种程度上对许多人来说是错误的或令人毛骨悚然的。

如果用 ChatGPT 代替我们所有的通信是不合适的,那么一个明显的趋势是它正在成为一种聪明的助手,引导我们穿过可用知识的泥潭找到我们正在寻找的信息。微软是这方面的先驱,将其经常被鄙视的 Bing 搜索引擎重新配置为带有 ChatGPT 的聊天机器人,从而大大提高了它的知名度。但是,尽管在线(和新闻界)急于就几乎任何可以想象的问题咨询 ChatGPT,但它与知识本身的关系有点不稳定。

最近和ChatGPT的一次面对面互动是这样的。我请她根据一个新的兴趣领域推荐一些书籍供我阅读:多物种民主,让非人类生物参与政治决策的想法。这几乎是该工具最有用的应用程序:“嘿,这是我正在考虑的事情,你能告诉我更多吗?” 和 ChatGPT 有义务。它给了我几本书的清单,这些书深入探索了这个感兴趣的新领域,并用引人入胜的人类语言解释了为什么我应该阅读它们。这太棒了!然而,列出的四本书中只有一本被证明是真实存在的,而我认为 ChatGPT 应该进一步探讨的一些概念,

好吧,这并没有发生,因为 ChatGPT 本质上是右翼的。这是因为它天生愚蠢。它阅读了大部分互联网内容,知道人类的语言应该听起来像什么,但它与现实无关。它们是听起来不错的梦想短语,老实说,听他说话就像听别人的梦想一样有趣。它非常擅长制造听起来合理的东西,并且最擅长制造构成其饮食大部分的陈词滥调和陈词滥调,但仍然无法与现实世界有意义地联系起来。不要相信任何假装这是意识的回声甚至近似的人。(当这篇文章即将发布时,

相信这种类型的人工智能实际上知识渊博或有意义是非常危险的。存在毒化集体思维和我们思考能力的风险。如果像科技公司所建议的那样,ChatGPT 查询的结果被提供给那些在线搜索知识的人的答案,如果像一些评论者所建议的那样,ChatGPT 被用作课堂教学工具,那么幻觉就会出现进入永久记录,有效地将自己置于我们与更合法、可验证的信息来源之间,直到两者之间的界限变得如此模糊以至于看不见。此外,我们作为个人代表我们自己探索和批判性评估知识的能力从未如此必要,尤其是因为科技公司已经对信息传播方式造成了损害。如果我们完全相信编程不佳的机器的梦想,就等于完全放弃这种批判性思维。


 人工智能技术对地球也有害。根据 2019 年发表的一项研究,训练单个 AI 模型可能会排放相当于超过 284 吨的二氧化碳,这几乎是美国普通汽车整个生命周期(包括其制造过程)的五倍。随着地球继续升温、海洋酸化、野火点燃、引发超级风暴并导致物种灭绝,这些排放量预计在未来五年内将增加近 50%。很难想象还有什么比今天所实践的人工智能更愚蠢的了。

所以,让我们退后一步。如果这些当前的“人工”“智能”化身如此乏味,那么还有哪些选择呢?我们能否想象用于分类和交流信息的强大技术不会剥削、滥用、误导和取代我们?是的,我们可以 - - 一旦我们走出定义当前 AI 浪潮的企业权力网络。

事实上,已经有 AI 绕过企业根深蒂固的权力,使特定社区受益的例子。土著语言在世界范围内受到威胁。联合国估计每两周就会有一个人消失,伴随着这些消失而来的是一代又一代的知识和经验。这个问题是几个世纪以来殖民主义和种族主义同化政策的结果,随着机器学习语言模型日益占据主导地位而加剧,机器学习语言模型确保流行语言增加它们的力量,而鲜为人知的语言被剥夺了它们的名声和专业知识。

在新西兰的 Aotearoa,一家名为 Te Hiku Media 的毛利语小型非营利广播电台决定解决这种不同语言在技术中的表现方式之间的差异。他拥有 20 多年的大量广播档案,代表了广泛的习语、俚语表达和独特的习语,其中许多已被数字化,但必须被转录以供语言学家和语言研究人员使用毛利人社区。作为回应,广播电台决定训练自己的语音识别模型,以便能够“收听”其档案并创建转录。

在接下来的几年里,Te Hiku Media 使用开源技术和自主开发的系统,实现了几乎不可能完成的任务:由其自己的语言社区构建并拥有的高精度毛利语语音识别系统。这不仅仅是软件费用。该电台联系了它能找到的每个毛利社区团体,并要求他们记录自己的预写陈述,以提供带注释的演讲语料库,这是训练他们的模型的要求。

提交最多句子的人可以获得现金奖励 - - 活动家 Te Mihinga Komene 仅记录了 4,000 个句子 - - 但组织者发现,贡献者最大的动机是复兴语言的共同愿景,同时他们拥有社区。在数周内,它创建了一个识别录制语音的模型,准确率为 86% - - 足以开始转录其整个档案。

Te Hiku Media 的成就为其他土著群体铺平了道路,他们现在正在开展加拿大东南部莫霍克族和夏威夷原住民的类似项目。它还确立了与土著语言有关的数据主权原则,因此也与其他形式的土著知识有关。随着国际营利性公司开始求助于讲毛利语的人来帮助建立自己的模型,Te Hiku Media 反对这些努力,争论说:“他们压制了我们的语言,并从我们的祖父母那里用肉体将它们淘汰,现在他们想卖掉我们的语言作为一种服务返回给我们。”


“数据是殖民化的最后边界,”土生土长的夏威夷人、Te Hiku Media 的联合创始人之一 Keoni Mahelona 写道。Te Hiku 的所有作品都是根据所谓的 Kaitiakitanga 许可证发布的,这是一种监护和保管的法律保证,确保进入语言模型和其他项目的所有数据仍然是创建它们的社区的财产 - - 在这种情况下,说毛利语的人提供了他们的帮助 - - 他们可能会或可能不会根据他们的 tikanga(毛利人习俗和礼仪)在他们认为合适的情况下许可他们。通过这种方式,毛利语在反抗和改造数字殖民主义制度的同时得到复兴,

我认为当前“人工”“智能”浪潮的教训是,在企业的想象中,智能是一件坏事。如果你的世界观是利润最大化是美德之王,所有事情都应该以股东价值为标准,那么你的艺术、想象力、审美和情感表达当然会贫乏得可怜。在我们使用的工具、我们消费的媒体和我们生活的社区中,我们应该得到更好的东西,只有当我们能够尽最大努力参与其中时,我们才会得到我们应得的。也不要让它们吓到你 - - 它们真的没有那么复杂。   Ursula K. Le Guin   写道:“技术是我们可以学习的东西。”

 

 

发表评论

0评论
发表评论 (0)

#buttons=(接受) #days=(20)

我们的网站使用 cookie 来增强您的体验。 了解更多
Accept !