0

0

更好、更安全、更不依赖OpenAI,微软的AI新动向,推出大模型安全工具Azure AI

WBOY

WBOY

发布时间:2024-04-02 20:22:14

|

1336人浏览过

|

来源于51CTO.COM

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

更好、更安全、更不依赖openai,微软的ai新动向,推出大模型安全工具azure ai

编译丨伊风

出品 | 51CTO技术栈(微信号:blog51cto)

塔猫ChatPPT
塔猫ChatPPT

塔猫官网提供AI一键生成 PPT的智能工具,帮助您快速制作出专业的PPT。塔猫ChatPPT让您的PPT制作更加简单高效。

下载

生成性人工智能(generative AI)的需求正不断增长,而对LLM安全和可靠性的担忧也变得比以往任何时候都更加突出。企业希望能确保为内外部使用而开发的大规模语言模型(LLM)能够提供高质量的输出,而不会偏离到未知领域。 为了满足这一需求,有几个关键方面需要考虑。首先,应该加强对LLM模型的可解释性,使其能够透明地展示其生成结果的来源和逻辑推理过程。这将有助于用户理解输出的质量,并评估其可信度。 其次,需要提供更多的工具和技术来验证和检测LLM输出的准确性和正确性。这些工具可以帮助用户在使用

微软认识到这些担忧,长期以来,微软使用OpenAI的模型只能调用API,对黑盒里的秘密缺少掌控的方法。微软近期宣布推出了新的Azure AI工具,用以帮助解决大模型的幻觉问题,同时能够够解决安全漏洞问题,如提示输入攻击,即模型被攻击生成侵害隐私或其他有害内容——就像微软自己的AI图像创作器生成的泰勒·斯威夫特深度伪造图像一样。

据悉,安全工具将在未来几个月内广泛推出,目前尚未公开具体的时间表。

1.Azure AI在大模型的安全做些什么?

随着LLM的普及,提示注入攻击问题变得格外突出。本质上,攻击者可以以一种方式改变模型的输入提示(prompt),以绕过模型的正常操作,包括安全控制,并操纵它以显示个人或有害内容,从而危及安全或隐私。这些攻击可以通过两种方式进行:直接攻击,即攻击者直接与LLM交互;或间接攻击,这涉及使用第三方数据源,如恶意网页。

为了解决这两种形式的提示注入,微软正在将提示盾(Prompt Shields)添加到Azure AI。这是一个综合能力,使用先进的机器学习(ML)算法和自然语言处理自动分析提示和第三方数据的恶意意图,并阻止它们到达模型。

它将集成到微软的三个相关产品中:Azure OpenAI服务(编者注:Azure OpenAI 是微软推出的一款基于云的服务产品,它提供了对OpenAI强大语言模型的访问能力。Azure OpenAI 的核心优势在于它结合了OpenAI的先进技术和微软Azure的安全性及企业级承诺)、Azure AI内容安全和Azure AI工作室。

除了努力阻止威胁安全和安全的提示注入攻击外,微软还引入了专注于生成型AI应用程序可靠性的工具。这包括预建的安全中心系统消息模板和一个新的功能,称为“基础性检测”(Groundedness Detection)。

正如微软所解释的,安全中心系统消息模板允许开发人员构建引导模型行为朝着安全、负责和数据基础输出的系统消息。而基础性检测使用一个经过微调的定制语言模型来检测模型产生的文本输出中的幻觉或不准确材料。两者都将在Azure AI工作室和Azure OpenAI产品中提供服务。

值得注意的是,检测基础性的指标还将伴随着自动化评估,以压力测试生成型AI应用程序的风险和安全性。这些指标将衡量应用程序被越狱并产生任何不适当内容的可能性。评估还将包括自然语言解释,以指导开发人员如何构建适当的缓解措施来解决问题。

“今天,许多组织缺乏压力测试其生成型AI应用程序的资源,以便他们可以自信地从原型转向市场应用。首先,构建一个反映新出现风险范围的高质量测试数据集可能是具有挑战性的,例如越狱攻击。即使有高质量的数据,评估也可能是一个复杂且手动的过程,开发团队可能会发现很难解释结果以通知有效的缓解措施,”微软安全AI首席产品官Sarah Bird在博客文章中指出。

2.Azure AI将实时“监控”大模型

Azure AI在实际使用过程中,微软将提供实时监控,帮助开发人员密切关注触发安全功能(如提示盾)的输入和输出。这项功能被集成在Azure OpenAI服务和AI工作室产品中,将生成详细的可视化图表,突出显示被阻止的用户输入/模型输出的数量和比例,以及按严重性/类别的细分。

利用这种可视化的实时监测,开发人员能够了解有害请求趋势随时间的变化,并调整其内容过滤器配置、控制以及更广泛的应用程序设计,以增强安全性。

微软致力于加强其AI产品已经有很长的时间了。此前,微软CEO萨提亚·纳德拉(Satya Nadella)在采访中强调,微软并没有完全依赖于OpenAI,同时也在发展自己的AI项目,以及帮助OpenAI建设其产品:“我对于我们现在的关系感到很满意。我也认为,这样有助于我们掌握各自公司的命运。”

改变了“All in OpenAI”的格局,微软也使用了包括Mistral在内的大模型。最近,微软新成立的团队Microsoft AI动作频频,它甚至聘请了来自Inflection AI的Mustafa Suleyman及其团队。这似乎是一种减少对Sam Altman及OpenAI依赖的方法。

现在,这些新的安全和可靠性工具的加入建立在公司已经完成的工作基础上,为开发人员提供了一个更好、更安全的方式来构建其提供的模型之上的生成型AI应用程序。

参考链接:https://venturebeat.com/ai/microsoft-launches-new-azure-ai-tools-to-cut-out-llm-safety-and-reliability-risks/

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

393

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

574

2023.08.10

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

404

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

431

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

307

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

632

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

34

2025.10.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2026

2024.08.16

C++ 高级模板编程与元编程
C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术,涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例,帮助开发者掌握 如何利用 C++ 模板机制编写高效、可扩展的通用代码,并提升代码的灵活性与性能。

2

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.4万人学习

Go 教程
Go 教程

共32课时 | 4万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号