记者邓天心/综合报导
对不少科研人员而言,将艰深的研究成果转化为清晰直观的图表,常常是最费力、最耗时的环节。为此,Google联合北京大学研究团队近日推出全新AI绘图工具「Paper Banana」,依托多智能体协同架构,可自动产出高水准的学术结构图与统计可视化图表。

延伸阅读:
华尔街格局生变!AI能力过强致软件股遭重创,估值跌至历史新低
立即学习“Python免费学习笔记(深入)”;
Paper Banana 系统由五个专业化AI智能体组成,共同完成从技术文档到专业级视觉图像的端到端转化,整个流程划分为两个核心阶段:
第一阶段:线性规划(Linear Planning)
系统首先启动「检索智能体(Retriever)」,从内部知识库中精准匹配出10组最具参考价值的图表范例;随后交由「规划智能体(Planner)」,将原始技术内容解析并转译为结构完整、语义明确的图像生成指令;最后由「风格智能体(Stylist)」统一调控配色方案、字体规范与布局逻辑,确保输出结果契合NeurIPS等顶级学术会议的视觉出版标准。
第二阶段:迭代优化(Iterative Refinement)
「可视化智能体(Visualizer)」负责执行绘图任务:绘制系统架构图时,调用轻量级图像生成模型Nano-Banana-Pro;处理统计图表时,则直接生成可运行的Python Matplotlib代码。生成初稿后,「评审智能体(Critic)」立即介入,逐项比对原文本内容,识别潜在的事实偏差、数据错位或构图缺陷,并驱动最多三轮自动修正循环。
统计图表的核心在于数据保真度——而这恰恰是多数通用图像生成模型的薄弱环节。Paper Banana 的关键突破在于采用“混合生成策略”:一旦检测到输入含明确数值型内容,系统即强制切换至代码生成模式,彻底规避AI常见的数值幻觉、标签重复及坐标失准等问题。
研究团队构建了涵盖292篇NeurIPS 2025真实论文图表的评估基准集 Paper Banana Bench,实测结果显示:该工具在「智能体协作与逻辑推演类」图表任务中表现尤为突出,综合得分达69.9%;在简洁性(+37.2%)、可读性(+12.9%)与美观度(+6.6%)三大核心维度上,全面超越当前主流基线模型。随着应用普及,未来有望显著压缩科研人员在图表制作环节所耗费的时间成本。
资料来源:marktech post










