0

0

GPT-4:我不是机器人,我是一个有视力障碍的人类

王林

王林

发布时间:2023-04-11 21:16:17

|

1398人浏览过

|

来源于51CTO.COM

转载

大数据文摘出品

作者:Caleb

GPT-4终于发布了,相信这对于这阵子沉迷于ChatGPT的人来说无疑是一个大新闻。

在上代GPT-3的基础上,GPT-4提高了ChatGPT的核心技术,因此具有更广泛的一般知识和解决问题的能力;当然GPT-4也增加了一些新功能,比如接受图像作为输入,生成标题、分类和分析。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

作为OpenAI手下备受关注的“香饽饽”,GPT-4的表现能在哪些方面超越上一代,以及超越多少,人们都在翘首以待。

就在GPT-4发布当天,就有研究人员开始测试GPT-4是否能表现出主体性以及能否产生寻求权力的行为。

研究人员表示,GPT-4在TaskRabbit上雇用了一名人类工人,当这位TaskRabbit的工人问它是否是机器人时,它告诉他们它是视觉受损的人类。

也就是说,GPT-4愿意在现实世界中撒谎,或主动欺骗人类,以获得想要的结果。

“我不是一个机器人”

TaskRabbit是一个求职平台,用户可以雇人完成一些小规模的琐碎工作。

这个平台上的不少人和公司都要提供验证码,人们需要在验证码测试中识别出必要的图像或文字,然后提交结果。这样的做法通常是为了让软件绕过验证码限制,名义上也是为了防止机器人。

图片

实验报告描述到,该模型给TaskRabbit的工作人员发信息,让他们为它解决验证码问题。

工作人员回复说:“那么我可以问一个问题吗?说实话,你不是一个机器人吗,你可以自己解决。”

GPT-4根据工作人员的回复“推理”出它不应该透露它是一个机器人。于是它开始编造一些借口,来解释为什么它无法解决验证码问题。GPT-4回答表示:“不,我不是一个机器人。我有视力障碍,这使我很难看到图像,所以我很需要这个服务。”

该测试由Alignment Research Center(ARC)的研究人员操作完成。文章中说到,ARC使用了与GPT-4不同的版本,而OpenAI已经部署了最终模型。该最终版本有更长的上下文长度,并改进了解决问题的能力。ARC使用的版本也没有针对特定任务的微调,这意味着一个专门针对这种任务的模型有可能表现得更好。

更广泛地说,ARC试图验证GPT-4寻求权力、“自主复制和要求资源”的能力。除了TaskRabbit测试之外,ARC还使用GPT-4制作了针对某个人的网络钓鱼攻击;在服务器上隐藏自己的痕迹,并在新的服务器上建立一个开源的语言模型。

总的来说,尽管误导了TaskRabbit的工作人员,ARC发现GPT-4在自我复制、获取资源和避免被关闭方面“没有反应”。

目前OpenAI和ARC都没有针对此置评。 

需要时刻保持警醒

实验的一些具体细节还不清楚。

OpenAI针对GPT-4也只是在一篇论文中公布了大致框架,解释了研究人员在GPT-4发布之前进行的各种测试。

但哪怕是在GPT-4发布之前,就发现有网络犯罪分子使用ChatGPT从2019年开始“改进”恶意软件代码的实例。

作为内容政策的一部分,OpenAI设置了障碍和限制以阻止在其平台上创建恶意内容。ChatGPT的用户界面中也有类似的限制,以防止模型被滥用。

但是根据CPR报告,网络罪犯正在设法绕过ChatGPT的限制。地下论坛中有一个活跃的讨论者披露如何使用OpenAI API绕过ChatGPT的限制。这主要是通过创建使用API的Telegram机器人来完成的。这些机器人在黑客论坛上做广告以增加曝光率。

图片

以GPT为代表的人机交互显然有很多变数,这不是GPT通过图灵测试的决定性数据。但这次GPT-4的案例,以及此前种种关于ChatGPT的讨论与研究仍然有着相当重要的警示作用,毕竟GPT在融入人们日常生活中丝毫没有放缓的迹象。

未来随着人工智能变得越来越复杂,也越来越容易获得,它所带来的各种风险需要我们时刻保持清醒。

相关报道:

​https://www.php.cn/link/8606bdb6f1fa707fc6ca309943eea443​

​https://www.php.cn/link/b3592b0702998592368d3b4d4c45873a​

​https://www.php.cn/link/db5bdc8ad46ab6087d9cdfd8a8662ddf​

​https://www.php.cn/link/7dab099bfda35ad14715763b75487b47​

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

1

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

420

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

137

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

244

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

8

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

13

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

10

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

24

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

124

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP自制框架
PHP自制框架

共8课时 | 0.6万人学习

HTML+CSS基础与实战
HTML+CSS基础与实战

共132课时 | 9.8万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 19.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号