0

0

如何管理生成式AI

王林

王林

发布时间:2024-03-11 12:04:10

|

1186人浏览过

|

来源于51CTO.COM

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如何管理生成式ai

作者丨Dom Couldwell

编译丨诺亚

出品 | 51CTO技术栈(微信号:blog51cto)

Lovart
Lovart

全球首个AI设计智能体

下载

据麦肯锡公司估计,生成式人工智能预计每年将为全球经济带来2.6万亿至4.4万亿美元的经济效益。这一预测是建立在63个新的应用场景之上的,这些场景有望在多个市场中为客户带来改进、效率提升和新产品。对于开发者和IT领导者而言,这无疑是一个巨大的机遇。

生成式AI的核心在于数据。数据不仅赋予了生成式AI理解和分析周围世界的能力,也为其变革性的潜能提供了动力。在生成式AI领域取得成功,公司需要有效地管理和准备数据。

为成功构建和运营大规模的AI服务,以及支持生成式AI项目,你需要确保在数据准备方面做足功课,并采取明智可持续的资金支持策略。缓慢的步伐和逐渐减弱的支持方式无法在人工智能领域取得优势。因此,除了扩大AI服务规模外,还要确保项目的资金来源稳定,以助长长期发展和持续创新。

如果我们不改进数据管理方式,或未能采取正确的方法来应对规模扩大和成本控制问题,那么生成式AI蕴含的巨大潜力将会被白白浪费掉。以下是一些关于我们如何改进数据管理方法以及如何长期支持生成式AI项目的思考。

1.数据从哪里来

数据以多种形态存在,每种形态的数据如果使用得当,都能提升生成式AI洞察的丰富性和质量。

第一种形式是结构化数据,它以规则有序且一致的方式组织起来,包括产品信息、客户人口统计资料或库存水平等项目。这类数据提供了有组织的事实基础,可以添加到生成式AI项目中以提高响应的质量。

此外,您可能还有外部数据源可以补充内部结构化数据源,例如天气报告、股票价格或交通流量等。这些数据能够为决策过程带来实时和真实世界的背景信息,将其融入项目可提供额外高质量数据,但可能没有必要自行生成这类数据。

另一种常见的数据集是衍生数据,涵盖了通过分析和建模场景创建的数据。此类深度见解可能包括客户意图报告、季节性销售预测或群体分析等。

最后一种常见数据形式是非结构化数据,与分析师习惯的常规报告或数据格式不同,这类数据包括图像、文档和音频文件等格式。这些数据捕捉到了人类沟通和表达的细微之处。生成式AI程序常常围绕图像或音频工作,它们是生成式AI模型的常见输入和输出。

2.要让生成式AI实现大规模应用

所有这些多样的数据集各自存在于自己的环境中。为了使其对生成式AI项目有用,关键在于使这一多样化的数据景观在实时情况下可供访问。由于涉及如此大量的潜在数据,任何方法都必须能够在需求增长时动态扩展,并在全球范围内复制数据,确保资源在接到请求时能靠近用户,从而避免停机时间并减少交易请求中的延迟。

此外,还需要对这些数据进行预处理,以便生成式AI系统能够有效利用。这涉及到创建嵌入(embeddings),即代表语义含义的数学值,即向量。嵌入使得生成式AI系统能够超越特定文本匹配,而是涵盖数据内含的意义和上下文。无论原始数据形式如何,创建嵌入意味着数据能够被生成式AI系统理解并使用,同时保留其意义和上下文。

通过这些嵌入,企业可以支持跨所有数据的向量搜索或混合搜索,同时结合价值和意义。然后将这些结果收集起来传递回用于整合结果的大规模语言模型(LLM)。通过从多个源头提供更多数据,而不是仅仅依赖LLM本身,你的生成式AI项目就能为用户提供更准确的结果,并降低虚构内容的风险。

为了在实践中实现这一点,必须选择正确的底层数据架构。在这个过程中,应尽可能避免数据分散在不同解决方案中形成碎片化拼凑,因为每一个这样的解决方案都代表着一个需要长期支持、查询和管理的数据孤岛。用户应该能够快速向LLM提问并迅速得到回应,而不是等待多个组件响应并由模型权衡其结果。统一的数据架构应当提供无缝的数据集成,使生成式AI能够充分利用所有可用的数据频谱。

3.模块化方法的优势

为了扩展生成式AI实施,需要在加快采用速度与保持对关键资产的控制之间取得平衡。采用模块化的方式来构建生成式AI代理可以使这个过程变得更容易,因为它可以分解实施过程,避免潜在的瓶颈。    

类似于微服务设计在应用程序中的应用,AI服务的模块化方法也鼓励围绕应用程序和软件设计的最佳实践,消除故障点,并让更多潜在用户能够接触这项技术。这种方法还使得监控整个企业中AI代理的表现变得更容易,能够更精确地找出问题发生的位置。

模块化的第一个好处是可解释性,因为参与生成式AI系统的各组成部分彼此分离,这样就更容易分析代理是如何运作和作出决策的。AI通常被视为“黑箱”,而模块化使得跟踪和解释结果变得更加容易。

第二个好处是安全性,因为各个组件可以通过最佳认证和授权机制进行保护,确保只有授权用户才能访问敏感数据和功能。模块化还使得合规和治理变得更容易,因为个人身份识别信息(PII)或知识产权(IP)可以得到保障,与底层LLM保持分离。

4.提供持续灵活的资金模型

除了采用微服务方法之外,还应在整体生成式AI项目中采用平台思维模式。这意味着取代传统的基于项目的软件项目资金模型,转而提供一种持续和灵活的资金模型。这种方法赋予参与者基于价值做决策的能力,能够响应新兴机会,并发展最佳实践,而不受制于僵硬的资金周期或商业案例。

以这种方式管理预算还能鼓励开发人员和业务团队将生成式AI视为组织已有的基础设施的一部分,从而更容易平滑规划工作负载的高峰和低谷,更容易采取“卓越中心”的方法并在长期内保持一致性。

类似的做法是将生成式AI视为企业自身运营的产品,而非单纯的软件。AI代理应作为产品来管理,因为这更能有效地体现其所创造的价值,并使整合、工具和提示方面的支持资源更容易获得。简化这种模式有助于在整个组织内普及对生成式AI的理解,促进最佳实践的采纳,并营造出共享专业知识和协作的生成式AI开发文化。

生成式AI具有巨大的潜力,各公司正竞相在其运营中实施新的工具、代理和提示。然而,要将这些潜在项目投入生产,就需要有效管理数据、奠定系统规模化发展的基础,并建立合适的预算模型以支持团队。合理安排流程和优先级将有助于你和你的团队释放这项技术的变革潜力。

参考地址:https://www.infoworld.com/article/3713461/how-to-manage-generative-ai.html

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

DOM是什么意思
DOM是什么意思

dom的英文全称是documentobjectmodel,表示文件对象模型,是w3c组织推荐的处理可扩展置标语言的标准编程接口;dom是html文档的内存中对象表示,它提供了使用javascript与网页交互的方式。想了解更多的相关内容,可以阅读本专题下面的文章。

4341

2024.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2913

2024.08.16

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

136

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

47

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

90

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.6万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

Excel 教程
Excel 教程

共162课时 | 21.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号