0

0

FATE 2.0发布:实现异构联邦学习系统互联

WBOY

WBOY

发布时间:2024-01-16 11:48:12

|

1835人浏览过

|

来源于机器之心

转载


  • FATE 2.0全面升级,推动隐私计算联邦学习规模化应用


FATE开源平台宣布发布FATE 2.0版本,作为全球领先的联邦学习工业级开源框架。此次更新实现了联邦异构系统之间的互联互通,持续增强了隐私计算平台的互联互通能力。这一进展进一步推动了联邦学习与隐私计算规模化应用的发展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通

FATE 2.0以全面互通为设计理念,采用开源方式对应用层、调度、通信、异构计算(算法)四个层面进行改造,实现了系统与系统、系统与算法、算法与算法之间异构互通的能力


FATE 2.0的设计兼容了北京金融科技产业联盟的《金融业隐私计算互联互通API技术文档》[3]等业内规范,在发布前,FATE 2.0已经和多个异构隐私计算平台完成了互联互通验证。近期北京金融科技产业联盟发布文档时提到,“课题组联合FATE开源社区、头部科技公司完成了五方跨平台、跨算法的互通联调,验证了接口文档在支持多方异构平台互联互通的可行性与安全性”。


访问以下网址获取FATE 2.0版本:

https://www.php.cn/link/99113167f3b816bdeb56ff1af6cec7af


  • FATE 2.0亮点概述
  • 应用层互联互通构建标准可扩展的联邦DSL,支持应用层互联互通,统一DSL适配多种异构隐私计算平台任务描述


  • 调度层互联互通:从多层面解耦系统模块来构建开放标准化的互联互通调度平台支持多种异构隐私计算平台间任务调度


  • 传输层跨站点互联互通:构建开放跨站点互联互通通信组件,支持多种传输模式以及多种通信协议, 可适配多种异构隐私计算平台间数据传输,增强传输效率和系统稳定性


  • 联邦异构计算互联互通构建分布式和明密文Tensor/DataFrame, 解耦HEMPC等安全协议和联邦算法协议,助力联邦异构计算引擎互联互通


  • 核心算法迁移和扩展,算法开发体验和性能显著增强:采用分布式,明密文Tensor/Dataframe编程模式,实现核心算法迁移和扩展;核心算法性能提升:PSI隐私保护求交算法性能提升1.8+倍,纵向联邦SSHE-LR算法性能提升4.3+倍,纵向联邦神经网络算法性能提升143倍等

FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通

FATE 2.0互联互通整体架构示意图


  • FATE 2.0功能一览

FATE-Client 2.0: 构建可扩展的联邦DSL支持应用层的互联互通

1. 引入新的可扩展和标准化的联邦DSL IR,即联邦建模流程DSL标准化中间层表示

2. 支持将python客户端联邦建模流程代码编译成DSL IR

3. DSL IR协议扩展增强: 支持多方不对称调度

4. 支持FATE的标准化联邦DSL IR与其他协议转化,如北京金融科技产业联盟互联互通BFIA协议的互相转化

5. 完成Flow Cli和Flow SDK功能迁移


FATE-Flow 2.0: 构建开放标准化的互联互通调度平台

1.适配可扩展和标准化的FATE 2.0 联邦DSL IR

2. 构建互联调度层框架,通过适配器方式支持其他协议,如《隐私计算互联互通API技术文档》所涉及的控制层接口。

3. 优化流程调度,调度逻辑解耦且可定制化,并增加了优先级调度

4. 优化算法组件调度,支持容器级算法加载,提升对跨平台异构场景的支持

5. 优化多版本算法组件注册,支持对组件运行模式的注册

6. 联邦DSL IR扩展增强:支持多方不对称调度

7. 优化客户端身份验证逻辑,支持多个客户端的权限管理

8. 优化RESTful接口,使入参字段和类型、返回字段和状态代码更加清晰

9.增加了OFX(Open Flow Exchange)模块:封装调度客户端,允许跨平台调度

10.支持新的通信引擎OSX,同时与FATE Flow 1.x中的所有引擎保持兼容

11. 系统层和算法层解耦,系统配置从FATE存储库移到Flow存储库

12. 在PyPI中发布FATE Flow包,并新增了用于服务管理的服务级别的CLI

13. 完成1.x主要功能迁移


OSX(Open Site Exchange) 1.0: 构建开放跨站点互联互通通信组件

  1. 参考北京金融科技产业联盟发布的《金融业隐私计算互联互通API技术文档》实现互联互通传输接口,传输接口兼容FATE 1.X版本和FATE 2.X版本
  2. 支持grpc同步传输和流式传输,支持TLS安全传输协议,兼容FATE 1.X  rollsite组件
  3. 支持Http 1.X协议传输,支持TLS安全传输协议
  4. 支持消息队列模式传输,用于替代FATE1.X中的rabbitmq 以及pulsar组件
  5. 支持eggroll 、spark计算引擎
  6. 支持作为Exchange组件组网,支持FATE 1.X 、FATE 2.X 接入
  7. 相比rollsite组件完善了传输中异常处理逻辑,提供更精确日志输出用于快速定位异常
  8. 路由配置与原rollsite基本一致,降低了移植难度
  9. 支持http接口修改路由表,并提供简单权限校验
  10. 完善了网络连接管理逻辑,降低连接泄露风险,提升传输效率
  11. 对集群内外部访问请求使用不同端口处理,方便对不同的端口采用不同的安全策略


FATE-Arch 2.0: 构建统一标准化的API,助力联邦异构计算引擎互联互通

  1. Context: 引入“Context”来管理对开发者友好的API,例如“分布式计算”、“联邦学习”、“加密算法”、“张量运算”、“度量指标”和“输入输出管理”
  2. Tensor: 引入Tensor数据结构处理本地及分布式矩阵运算,支持内建的异构加速;PHETensor 抽象层优化,通过标准接口使用多种底层PHE实现,自由切换
  3. DataFrame: 引入“DataFrame”二维表格数据结构,用于数据输入输出和基础特征工程新增数据块管理器支持列多类型管理,支持特征匿名逻辑;新增统计、比较、索引、数据分箱及转化等30+算子接口
  4. 重构Federation:提供统一的联邦通信接口,包括统一的序列化/反序列化控制和更友好的API
  5. Config:为 FATE 提供统一的配置设置,包括安全配置、系统配置和算法配置
  6. 重构“logger”根据不同使用方式和需求定制日志记录细节
  7. Launcher:一个简化的联邦程序执行工具,特别适合单机运行和本地调试
  8. 协议层:支持SSHE(混合安全多方计算和同态加密协议)、ECDH、安全聚合协议
  9. 整合Deepspeed:通过Eggroll支持分布式GPU集群的训练调度
  10. 实验性集成Crypten:支持SMPC,未来将添加更多协议和功能


FATE-Component 2.0: 构建标准化的算法组件,适配不同调度引擎

  1. 引入组件工具箱:将机器学习模块封装为标准可执行程序
  2. 通过spec和loader提供清晰的API,便于内部扩展和与外部系统集成
  3. 输入输出:进一步解耦FATE-Flow,提供标准化的黑盒调用流程
  4. 组件定义:支持基于类型的定义,自动检查组件参数,支持多种数据和模型输入输出类型,以及多重输入


FATE-ML 2.0: 核心算法迁移和扩展算法开发体验和性能显著增强

  1. 采用分布式,明密文Tensor/Dataframe编程模式,实现核心算法迁移和扩展:
  2. 数据预处理:新增DataFrame Transformer, 完成Reader、PSI、Union和DataSplit迁移
  3. 特征工程:完成HeteroFederatedBinning、HeteroFeatureSelection、DataStatistics、Sampling、FeatureScale和Pearson Correlation迁移
  4. 联邦训练算法迁移:包括HeteroSecureBoost、HomoNN、HeteroCoordinatedLogisticRegressio、HeteroCoordinatedLinearRegression、SSHE-LogisticRegression和SSHE-LinearRegression
  5. 新增联邦训练算法协议:基于MPC和同态加密混合协议的SSHE-HeteroNN

基于FedPASS协议的FedPASS-HeteroNN

  1. 性能显著提升
  2.  PSI隐私保护求交:在一亿id的数据集上测试,且交集结果为1亿,性能为FATE-1.11的1.8+倍
  3. 纵向联邦分箱算法:在guest 十万行*三十维特征,host 十万行*三百维特征的数据上测试,性能为FATE-1.11 的1.5+倍
  4. 纵向联邦SSHE-LR算法: 在guest 十万行*三十维特征,host 十万行*三百维特征的数据上测试,性能为FATE-1.11的4.3+倍
  5. 纵向联邦带协调方的LR算法:在guest 十万行*三十维特征,host 十万行*三百维特征的数据上测试,性能为FATE-1.11的1.2+倍
  6. 纵向联邦神经网络(基于FedPass协议):在guest 十万行*三十维特征, host 十万行*三百维特征的数据上测试,与明文性能基本一致,性能为FATE-1.11的143+倍


Eggroll 3.0: 系统性能、可用性和可靠性全面增强

1. JVM增强

  • 核心组件重构:cluster-manager 和 node-manager 组件使用Java语言全面重建,确保统一性和提升性能
  • 传输组件修改:移除 rollsite 传输组件,用更高效的 osx 组件替代
  • 进程管理改进:实现了更高级的进程管理逻辑,显著降低进程泄露风险
  • 数据存储逻辑增强:数据存储机制优化,提高性能和可靠性
  • 并发控制改进:升级原有组件中的并发控制逻辑,提升性能
  • 可视化组件:新增可视化组件,方便监控计算信息
  • 日志完善:日志系统增强,输出更精确,有助于快速检测异常

2. Python升级

  • roll_pair和 egg_pair重构:支持由调用方控制的序列化和分区方法序列化安全由调用方统一管理
  • 中间表自动清理:解决了联邦和计算之间中间表自动清理问题,无需调用方额外操作
  • 配置控制统一:引入灵活的配置系统,支持直接传递、配置文件和环境变量,以满足多样化需求
  • 客户端PyPI安装:Eggroll 3.0.0 支持客户端通过PyPI进行简易安装
  • 日志配置优化:调用方可以根据需要自定义日志格式
  • 代码结构调整:代码库精简,结构和逻辑更清晰,并移除了大量冗余代码



  • 汇聚开源力量,助力隐私计算行业发展

跨行业、跨机构的数据融合在金融、电信、医疗、政务、广告营销、智慧城市等诸多场景都有着广泛的需求。隐私计算已成为打破行业间数据壁垒的利器,互联互通则是充分发挥这把利器作用的磨刀石。FATE 2.0提供了一个开源框架来实现互联互通,解决了业内的一大痛点。大多数隐私计算平台都可以通过实现开放的互通接口,达到和异构系统交互和集成的目的。

FATE 2.0版本重磅发布:实现异构联邦学习系统互联互通

FATE 2.0的推出为实现异构平台之间的互联互通提供了有力支持,持续的迭代展现了技术不断完善的承诺。不仅关乎数据隐私保护,更涉及到整个行业向前发展。在这一进程中,隐私计算行业用户和技术合作伙伴有了更多参与的机会。通过社区的共同努力,我们可以更好地应对数据安全和隐私保护挑战,为建设更加安全可靠的数字社会奠定坚实基础。FATE 2.0的发布是行业合作与共赢的新篇章,期待更多的创新者和实践者加入其中,共同推动隐私计算技术的蓬勃发展。

[1] 国家数据局:国家数据局等部门关于印发《“数据要素×”三年行动计划(2024—2026年)》的通知

[2] 中国信通院吕艾临等:我国数据要素市场培育进展与趋势

[3] 《金融业隐私计算互联互通API技术文档》v1.0版本已在FATE社区仓库进行托管:https://github.com/FederatedAI/InterOp

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
rabbitmq和kafka有什么区别
rabbitmq和kafka有什么区别

rabbitmq和kafka的区别:1、语言与平台;2、消息传递模型;3、可靠性;4、性能与吞吐量;5、集群与负载均衡;6、消费模型;7、用途与场景;8、社区与生态系统;9、监控与管理;10、其他特性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

202

2024.02.23

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

6

2026.01.28

PHP API接口开发与RESTful实践
PHP API接口开发与RESTful实践

本专题聚焦 PHP在API接口开发中的应用,系统讲解 RESTful 架构设计原则、路由处理、请求参数解析、JSON数据返回、身份验证(Token/JWT)、跨域处理以及接口调试与异常处理。通过实战案例(如用户管理系统、商品信息接口服务),帮助开发者掌握 PHP构建高效、可维护的RESTful API服务能力。

155

2025.11.26

什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

235

2023.10.07

c语言union的用法
c语言union的用法

c语言union的用法是一种特殊的数据类型,它允许在相同的内存位置存储不同的数据类型,union的使用可以帮助我们节省内存空间,并且可以方便地在不同的数据类型之间进行转换。使用union时需要注意对应的成员是有效的,并且只能同时访问一个成员。本专题为大家提供union相关的文章、下载、课程内容,供大家免费下载体验。

125

2023.09.27

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

538

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

17

2025.12.22

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

17

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 9.5万人学习

Rust 教程
Rust 教程

共28课时 | 4.9万人学习

Vue 教程
Vue 教程

共42课时 | 7.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号