0

0

每日学术速递7.31

星夢妙者

星夢妙者

发布时间:2025-04-27 15:38:01

|

674人浏览过

|

来源于php中文网

原创

  1. 适应还是不适应?语义分割的实时适应(iccv 2023)

每日学术速递7.31标题:适应还是不适应?语义分割的实时适应

作者:Marc Botet Colomer, Pier Luigi Dovesi, Theodoros Panagiotakopoulos, Joao Frederico Carvalho, Linus Härenstam-Nielsen, Hossein Azizpour, Hedvig Kjellström, Daniel Cremers, Matteo Poggi

文章链接:https://www.php.cn/link/69ae57a20fbf05b1b85b4f1ed95c3fee

项目代码:https://www.php.cn/link/93252740625b1bcb6dfa091de2d09202

每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31摘要:

在线域适应在语义分割中的目标是应对部署过程中出现的不可预测的域变化,例如突如其来的天气事件。然而,暴力适应的高计算成本使得这种方法在现实世界的应用中不可行。本文提出了 HAMLET,一种针对实时域适应的硬件感知模块化最便宜训练框架。我们的方法包括一个硬件感知的反向传播编排代理(HAMT)和一个专用的域转移检测器,可以主动控制模型何时以及如何进行调整(LT)。得益于这些创新,我们的方法能够在单个消费级 GPU 上以超过 29FPS 的速度执行语义分割并进行调整。我们的框架在 OnDA 和 SHIFT 基准上的实验结果展示了令人鼓舞的准确性和速度平衡。

主题:cs.RO

  1. 放大和缩小:语言引导的机器人技能习得

每日学术速递7.31标题:放大和缩小:语言引导的机器人技能习得

作者:Huy Ha, Pete Florence, Shuran Song

文章链接:https://www.php.cn/link/8ed700a6d0de777200111377efb82f53

项目代码:https://www.php.cn/link/746d3a5820bf0745b12072c64be03429

每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31摘要:

我们提出了一个机器人技能获取框架,该框架1)有效地扩大了语言标记机器人数据的数据生成,2)有效地将这些数据提炼成强大的多任务语言条件视觉运动策略。对于(1),我们使用大型语言模型(LLM)来指导高级规划,并使用基于采样的机器人规划器(例如运动或抓取采样器)来生成多样化且丰富的操作轨迹。为了增强此数据收集过程,LLM 还推断每个任务成功条件的代码片段,同时使数据收集过程能够检测失败和重试,并自动标记成功/失败的轨迹。对于(2),我们将扩散策略单任务行为克隆方法扩展到具有语言调节的多任务设置。最后,我们提出了一个新的多任务基准,包含跨五个领域的 18 项任务,以测试长期行为、常识推理、工具使用和直观物理。我们发现,我们的精炼策略成功地学习了数据收集策略中稳健的重试行为,同时将五个域的绝对成功率平均提高了 34.8%。

主题:cs.CL

魔方网站开发包WDK企业完整版 wdk2.02
魔方网站开发包WDK企业完整版 wdk2.02

魔方网站开发包WDK(Website Development Kit)2.0 是适应互联网网站建设的发展的需求,在网站开发技术日渐成熟和普及的前提下,为广大建站团队,互联网创业者,网站建设专业学习者及广大建站爱好者提供的一套实用、易用且能掌握了解网站建设、推广、运营的普及型开发包。网站建设者可以轻松、迅速且高效的构建拥有自己的行业门户、企业展示和个人主页的网站。当前绝大多数的建站系统都采用模块化建

下载
  1. 将 TransNormer 扩展到 1750 亿个参数(上海 AI 实验室)

标题:将 TransNormer 扩展到 1750 亿个参数

作者:Zhen Qin, Dong Li, Weigao Sun, Weixuan Sun, Xuyang Shen, Xiaodong Han, Yunshen Wei, Baohong Lv, Fei Yuan, Xiao Luo, Yu Qiao, Yiran Zhong

文章链接:https://www.php.cn/link/5ed9f910a5a0bb195a269bda9d82af81

项目代码:https://www.php.cn/link/1c21b0912f1088c26479be9299203f2b

每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31每日学术速递7.31摘要:

我们提出了 TransNormerLLM,这是第一个基于线性注意力的大语言模型 (LLM),它在准确性和效率上都优于传统的基于 softmax 注意力的模型。TransNormerLLM 从之前的线性注意力架构 TransNormer 演变而来,进行了高级修改,包括位置嵌入、线性注意力加速、门控机制、张量归一化、推理加速和稳定性。具体来说,我们将 LRPE 与指数衰减结合使用,以避免注意力稀释问题,同时允许模型保留令牌之间的全局交互。此外,我们提出了闪电注意力(Lightning Attention),这是一种尖端技术,可以在运行时将线性注意力加速两倍以上,并将内存使用量减少四倍。为了进一步增强 TransNormer 的性能,我们利用门控机制来平滑训练,并利用新的张量归一化方案来加速模型,从而获得超过 20% 的令人印象深刻的加速。此外,我们开发了一种强大的推理算法,无论序列长度如何,都能确保数值稳定性和一致的推理速度,从而在训练和推理阶段展现出卓越的效率。可扩展性是我们模型设计的核心,可以在大规模集群上实现无缝部署,并促进扩展到更广泛的模型,同时保持出色的性能指标。我们的模型设计是通过对我们自收集的语料库进行一系列综合实验来实现的,该语料库的大小超过 6TB,包含超过 2 万亿个代币。为了确保数据质量和相关性,我们实施了新的自我清理策略来过滤收集的数据。我们将发布预先训练的模型,以促进高效 LLM 社区的进步。

推荐阅读每日学术速递7.30

2023-07-30

每日学术速递7.31每日学术速递7.29

2023-07-29

每日学术速递7.31这次来真的?室温常压超导全球复现一文速览

2023-07-28

每日学术速递7.31

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
li是什么元素
li是什么元素

li是HTML标记语言中的一个元素,用于创建列表。li代表列表项,它是ul或ol的子元素,li标签的作用是定义列表中的每个项目。本专题为大家li元素相关的各种文章、以及下载和课程。

436

2023.08.03

github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

3726

2026.01.21

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

489

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2862

2024.08.16

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

28

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

68

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

164

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

84

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

114

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 8万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2.1万人学习

ECMAScript6 / ES6---十天技能课堂
ECMAScript6 / ES6---十天技能课堂

共25课时 | 2.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号