0

0

LangChain 流式响应中持久化对话记忆的完整实践方案

霞舞

霞舞

发布时间:2026-03-18 09:31:03

|

497人浏览过

|

来源于php中文网

原创

LangChain 流式响应中持久化对话记忆的完整实践方案

本文详解如何在 LangChain 的流式(streaming)RAG 链中正确保存对话历史到内存,解决 save_context 无法直接接入流式链的痛点,提供可落地的自定义 Runnable 组件方案与工程化注意事项。

本文详解如何在 langchain 的流式(streaming)rag 链中正确保存对话历史到内存,解决 `save_context` 无法直接接入流式链的痛点,提供可落地的自定义 runnable 组件方案与工程化注意事项。

在 LangChain 构建流式 RAG 应用时,一个常见却棘手的问题是:如何在 stream() 模式下安全、可靠地将用户提问与模型回答持久化到对话记忆(如 ConversationBufferMemory)中? 原生链式调用(如 | StrOutputParser() | model.stream())不支持在流结束时自动触发 save_context,因为流返回的是 Iterator[Chunk],而非最终聚合结果;而若强行在链尾插入 RunnableLambda(_save_context),其输入参数将为单个文本块(chunk),而非完整的 answer 字符串——导致记忆内容被截断或重复保存。

官方目前尚未提供开箱即用的流式记忆保存机制(GitHub Issue #11945 仍处于 open 状态),因此需通过自定义 Runnable 组件实现“流收集 + 结束回调”语义。核心思路是:构建一个能透传流式输出、同时在流终止时聚合全部 chunk 并执行副作用(如保存记忆)的中间件。

✅ 推荐方案:自定义 RunnableCollector

以下是一个生产就绪的 RunnableCollector 实现,它继承 RunnableLambda,重写 _transform 方法,在迭代完成时自动拼接所有 chunk 并调用指定回调函数:

from langchain_core.runnables import RunnableLambda
from langchain_core.callbacks import CallbackManagerForChainRun
from langchain_core.runnables.config import RunnableConfig
from typing import Iterator, Any, Callable, cast, Dict, Optional

class RunnableCollector(RunnableLambda):
    def __init__(
        self,
        func: Callable[[Any], None],
        *args,
        **kwargs
    ) -> None:
        super().__init__(func=func, *args, **kwargs)

    def _transform(
        self,
        input: Iterator[Any],
        run_manager: CallbackManagerForChainRun,
        config: RunnableConfig,
        **kwargs: Any,
    ) -> Iterator[Any]:
        final_output = None
        chunks = []

        # 1. 透传每个 chunk 给下游
        for chunk in input:
            yield chunk
            chunks.append(chunk)

        # 2. 流结束后,聚合结果并调用回调
        if not chunks:
            return

        # 尝试智能合并(支持 str / AIMessage / dict 等常见类型)
        try:
            if isinstance(chunks[0], str):
                final_output = "".join(chunks)
            elif hasattr(chunks[0], "__add__") and hasattr(chunks[0], "content"):
                # 如 AIMessage 支持 + 操作且含 content 属性
                final_output = chunks[0]
                for c in chunks[1:]:
                    final_output += c
            else:
                final_output = chunks[-1]  # 默认取最后一个(最安全)
        except Exception:
            final_output = chunks[-1]

        # 3. 执行副作用:保存记忆
        if final_output is not None:
            self.func(final_output)

✅ 集成到你的 RAG 链中(关键修改点)

回到你原始代码中的 answer_chain,只需在 .stream() 前插入 RunnableCollector 即可:

MidReal AI
MidReal AI

MidReal AI是一款革命性的AI小说生成工具,同时也是一个文本互动冒险游戏平台。

下载
# ✅ 在 answer_chain 末尾添加记忆保存逻辑
def save_memory_context(inputs: Dict[str, Any], answer: str, session_id: str):
    memory = _get_memory_with_session_id(session_id)
    # inputs 包含 question 和 docs(可选),answer 是完整响应字符串
    memory.save_context(
        {"question": inputs["question"]},
        {"answer": answer}
    )
    print(f"[✓] Memory saved for session {session_id}")

# 修改后的 answer_chain(注意:需将 session_id 闭包传入)
answer_chain = (
    {"docs": RunnablePassthrough()}
    | {
        "context": lambda x: _combine_documents(x["docs"]),
        "question": itemgetter("question"),
    }
    | ANSWER_PROMPT
    | model
    | StrOutputParser()
    | RunnableCollector(
        lambda full_answer: save_memory_context(
            docs,  # 注意:此处需确保 docs 和 query 在作用域内
            full_answer,
            session_id
        )
      )
)

⚠️ 重要注意事项:

  • 作用域问题:RunnableCollector 的回调函数无法直接访问链外变量(如 session_id, query, docs)。推荐做法是:将 session_id 作为 input 的一部分注入链中(例如通过 RunnablePassthrough.assign(session_id=lambda _: session_id)),并在回调中从 inputs 解构获取。
  • 内存实例生命周期:确保 get_memory(session_id) 返回的是同一个内存实例引用,而非每次调用都新建。否则 load_memory_variables() 与 save_context() 将操作不同对象,导致记忆丢失。建议使用单例缓存(如 lru_cache 或全局字典)管理 session-aware memory 实例。
  • 流式内容类型兼容性:StrOutputParser() 输出 str,可直接拼接;若使用 AIMessage 输出(如 ChatModel 直出),需改用 AIMessageChunk 合并逻辑,并调用 .content 提取文本。
  • 错误防御:在 RunnableCollector._transform 中加入 try/except,避免因 chunk 类型异常导致整个流中断。

✅ 最佳实践总结

场景 推荐做法
单次问答流 使用 RunnableCollector 聚合 + 回调保存,简洁可控
多轮会话流 将 session_id 作为链输入字段,统一管理 memory 生命周期
调试与可观测性 在 save_memory_context 中打印 memory.load_memory_variables({}) 验证是否生效
性能敏感场景 避免在回调中执行耗时 I/O(如写数据库),可改为异步队列解耦

通过以上方案,你既能享受流式响应的低延迟体验,又能确保每一轮人机交互都被准确记录到对话记忆中,为后续的上下文感知 RAG 提供坚实基础。记住:LangChain 的流式能力强大,但记忆持久化需要你主动“收网”——而 RunnableCollector 正是那张可靠的网。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是中间件
什么是中间件

中间件是一种软件组件,充当不兼容组件之间的桥梁,提供额外服务,例如集成异构系统、提供常用服务、提高应用程序性能,以及简化应用程序开发。想了解更多中间件的相关内容,可以阅读本专题下面的文章。

184

2024.05.11

Golang 中间件开发与微服务架构
Golang 中间件开发与微服务架构

本专题系统讲解 Golang 在微服务架构中的中间件开发,包括日志处理、限流与熔断、认证与授权、服务监控、API 网关设计等常见中间件功能的实现。通过实战项目,帮助开发者理解如何使用 Go 编写高效、可扩展的中间件组件,并在微服务环境中进行灵活部署与管理。

226

2025.12.18

session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

337

2023.10.17

session失效解决方法
session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法:1、延长session的生存时间;2、使用持久化存储;3、使用cookie;4、异步更新session;5、使用会话管理中间件。

776

2023.10.18

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

97

2025.08.19

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1571

2023.10.24

抖漫入口地址合集
抖漫入口地址合集

本专题整合了抖漫入口地址相关合集,阅读专题下面的文章了解更多详细地址。

17

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号