大型语言模型要避免的六个陷阱

王林

发布时间：2023-05-12 13:01:35

1713人浏览过

来源于51CTO.COM

转载

从安全和隐私问题到错误信息和偏见，大型语言模型带来了风险和回报。

最近人工智能(AI)取得了令人难以置信的进步，这主要是由于开发大型语言模型的进步。这些都是文本和代码生成工具的核心，例如ChatGPT、Bard和GitHub的Copilot。

这些模式正在被所有部门采用。但是，它们是如何被创造和使用的，以及它们如何被滥用，仍然令人担忧。一些国家已经决定采取激进的方法，暂时禁止特定的大型语言模型，直到适当的法规到位。

以下来看看基于大型语言模型的工具在现实世界中的一些不利影响，以及减轻这些影响的一些策略。

1.恶意的内容

大型语言模型可以在很多方面提高生产力。它们能够解释人们的请求并解决相当复杂的问题，这意味着人们可以把平凡、耗时的任务交给最喜欢的聊天机器人，然后简单地检查结果。

当然，权力越大，责任越大。虽然大型语言模型可以创建有用的材料并加快软件开发，但它们也可以快速访问有害信息，加速坏人的工作流程，甚至生成恶意内容，如网络钓鱼电子邮件和恶意软件。当进入门槛低到只需编写一个构造良好的聊天机器人提示符时，“脚本小子”一词就有了全新的含义。

虽然有一些方法可以限制访问客观上危险的内容，但它们并不总是可行或有效的。就像聊天机器人这样的托管服务而言，内容过滤至少可以帮助没有经验的用户减慢速度。实现强大的内容过滤器应该是必要的，但它们并不是无所不能的。

2.提示注射

特制的提示符可以迫使大型语言模型忽略内容过滤器并产生非法输出。这个问题普遍存在于所有llm，但随着这些模型与外部世界的联系，这个问题将被放大;例如，作为ChatGPT的插件。这可以使聊天机器人“eval”用户生成的代码，从而导致任意代码的执行。从安全的角度来看，为聊天机器人配备这种功能是非常有问题的。

为了帮助缓解这种情况，了解基于llm的解决方案的功能以及它如何与外部端点交互是很重要的。确定它是否已连接到API，是否正在运行社交媒体帐户，或者是否在没有监督的情况下与客户交互，并相应地评估线程模型。

虽然提示注入在过去可能看起来无关紧要，但这些攻击现在可能会产生非常严重的后果，因为它们开始执行生成的代码，集成到外部API中，甚至读取浏览器选项卡。

3.隐私资料/侵犯版权

训练大型语言模型需要大量的数据，有些模型的参数超过5000亿个。在这种规模下，了解出处、作者身份和版权状态是一项艰巨的任务，如果不是不可能的话。未经检查的训练集可能导致模型泄露私有数据、错误地归因于引用或剽窃受版权保护的内容。

关于大型语言模型使用的数据隐私法也非常模糊。正如我们在社交媒体上了解到的那样，如果某样东西是免费的，那么很可能用户就是产品。值得记住的是，如果人们要求聊天机器人在我们的代码中找到错误或编写敏感文档，我们就会将这些数据发送给第三方，他们最终可能会将其用于模型培训、广告或竞争优势。人工智能提示的数据泄露在商业环境中尤其具有破坏性。

Groq

GroqChat是一个全新的AI聊天机器人平台，支持多种大模型语言，可以免费在线使用。

下载

随着基于大型语言模型的服务与Slack和Teams等工作场所生产力工具集成在一起，仔细阅读提供商的隐私政策、了解人工智能提示的使用方式，并相应地规范大型语言模型在工作场所的使用，这一点至关重要。在版权保护方面，我们需要通过选择加入或特殊许可来规范数据的获取和使用，而不妨碍我们今天拥有的开放和基本上自由的互联网。

4.错误信息

虽然大型语言模型们可以令人信服地假装聪明，但他们并不真正“理解”他们生产的东西。相反，他们的货币是单词之间的概率关系。他们无法区分事实和虚构——一些输出可能看起来非常可信，但结果是一个自信的措辞不真实。这方面的一个例子是ChatGPT篡改引文，甚至整篇论文，正如一位Twitter用户最近直接发现的那样。

大型语言模型工具在大量的任务中可以证明是非常有用的，但人类必须参与验证其响应的准确性、益处和总体合理性。

对于LLM工具的输出，应该始终持保留态度。这些工具在大量任务中非常有用，但人类必须参与验证其响应的准确性、益处和总体合理性。否则，我们会失望的。

5.有害的建议

在网上聊天时，越来越难以分辨你是在和人说话还是在和机器说话，一些实体可能会试图利用这一点。例如，今年早些时候，一家心理健康科技公司承认，一些寻求在线咨询的用户在不知情的情况下与基于gpt3的机器人而不是人类志愿者进行了互动。这引起了人们对在精神卫生保健和任何其他依赖于解释人类情感的环境中使用大型语言模型的伦理担忧。

目前，几乎没有监管监督来确保公司在没有最终用户明确同意的情况下不能以这种方式利用人工智能。此外，对手可以利用令人信服的人工智能机器人进行间谍活动、诈骗和其他非法活动。

人工智能没有情感，但它的反应可能会伤害人们的感情，甚至导致更悲惨的后果。认为人工智能解决方案可以负责任地、安全地充分解释和回应人的情感需求是不负责任的。

在医疗保健和其他敏感应用中使用大型语言模型应受到严格监管，以防止对用户造成任何伤害的风险。基于llm的服务提供商应该始终告知用户AI对服务的贡献范围，并且与bot交互应该始终是一种选择，而不是默认设置。

6.偏见

人工智能解决方案的好坏取决于它们所接受的训练数据。这些数据通常反映了我们对政党、种族、性别或其他人口统计数据的偏见。偏见会给受影响的群体带来负面影响，在这种情况下，模型会做出不公平的决定，而且可能既微妙又可能难以解决。在未经审查的互联网数据上训练的模型总是会反映出人类的偏见;不断从用户交互中学习的模型也容易被故意操纵。

为了减少歧视的风险，大型语言模型服务提供商必须仔细评估他们的培训数据集，以避免任何可能导致负面后果的不平衡。机器学习模型也应该定期检查，以确保预测保持公平和准确。

大型语言模型完全重新定义了我们与软件交互的方式，为我们的工作流程带来了无数的改进。然而，由于目前缺乏针对人工智能的有意义的法规，以及针对机器学习模型的安全性缺乏，广泛而仓促的大型语言模型实施可能会出现重大挫折。因此，必须迅速监管和保护这项宝贵的技术。?

ai怎么做表格_ai表格制作快速入门【指南】

ai怎么做立体字_ai立体字制作方法步骤【教程】

如何优化简历中的领导力描述利用DeepSeek展示跨团队协作与资源调配能力

斑马ai课思维怎么样_斑马ai课程质量评价【测评】

如何优化简历中由于GAP导致的空白期利用DeepSeek进行职场能量包装

相关专题

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

763

2023.08.10

github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started，GitHub 是一种基于云的平台，可在其中存储、共享并与他人一起编写代码。通过将代码存储在GitHub 上的“存储库”中，你可以： “展示或共享”你的工作。持续“跟踪和管理”对代码的更改。

3759

2026.01.21

ChatGPT注册

ChatGPT注册方法：1、访问OpenAI的官方网站，进入注册页面；2、完成注册后收到一份邮件，打开后点击验证账号；3、选择一个适合您需求的订阅计划；4、获得访问ChatGPT的权限即可。

556

2023.09.12

国内免费ChatGPT大全

ChatGPT是一种基于深度学习技术的自然语言处理模型，由OpenAI开发。它是GPT的一个变体，专门设计用于生成上下文相关的文本回复。ChatGPT被训练成一个聊天机器人，可以与用户进行对话交互。更多关于ChatGPT的文章详情请查看本专题，希望对大家能有所帮助。

615

2023.10.25

手机安装chatgpt的方法

手机安装chatgpt的方法：1、在ChatGTP官网或手机商店上下载ChatGTP软件；2、打开后在设置界面中，选择语言为中文；3、在对局界面中，选择人机对局并设置中文相谱；4、开始后在聊天窗口中输入指令，即可与软件进行交互。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

3014

2024.03.05

chatgpt国内可不可以使用

chatgpt在国内可以使用，但不能注册，港澳也不行，用户想要注册的话，可以使用国外的手机号进行注册，注意注册过程中要将网络环境切换成国外ip。想了解更多chatgpt的相关内容，可以阅读本专题下面的文章。

1091

2024.03.05

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

164

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板