0

0

使用 Nodejs 创建 ReAct AI 代理(维基百科搜索)en

DDD

DDD

发布时间:2024-09-25 09:42:28

|

1042人浏览过

|

来源于dev.to

转载

使用 nodejs 创建 react ai 代理(维基百科搜索)en

介绍

我们将创建一个能够搜索维基百科并根据收集到的信息回答问题的人工智能代理。
该 react(推理和行动)代理使用 google generative ai api 来处理查询并生成响应。

我们的代理将能够:

  1. 在维基百科上搜索相关信息。
  2. 从维基百科页面中提取特定部分。
  3. 对收集到的信息进行分析并制定回复。

[2] 什么是react代理?

react agent 是一种遵循反射-操作循环的特定类型的代理。它根据可用信息和可以采取的操作来反映当前任务,然后决定采取什么操作或是否完成任务。

[3] 规划代理

3.1 所需工具

  • node.js
  • 用于 http 请求的 axios 库
  • google 生成式 ai api (gemini-1.5-flash)
  • 维基百科 api

3.2 代理结构

我们的 react agent 将具有三个主要状态:

  1. 思想(反思)
  2. 行动(执行)
  3. 回答(回复)

3.3 思想状态

思考状态是reactagent对收集到的信息进行反思并决定下一步应该做什么的时刻。

async thought() {
    // ...
}

3.4 动作状态(action)

在动作状态下,代理根据先前的想法执行可用功能之一。
请注意,有行动(执行)和决定(哪个行动)。

async action() {
    // chama a decisão
    // executa a ação e retorna um actionresult
}

async decideaction() {
    // chama o llm com base no pensamento (reflexão) para formatar e adequar a chamada de função.
    // procure por um modo de função-ferramenta na [documentação da api do google](https://ai.google.dev/gemini-api/docs/function-calling)
}

[4] 实现代理

让我们逐步构建 react agent,突出显示每个状态。

4.1 初始配置

首先,配置项目并安装依赖项:

mkdir projeto-agente-react
cd projeto-agente-react
npm init -y
npm install axios dotenv @google/generative-ai

在项目根目录创建一个.env文件:

google_ai_api_key=sua_chave_api_aqui

这里有免费的 api 密钥

VISBOOM
VISBOOM

AI虚拟试衣间,时尚照相馆。

下载

4.2 角色声明

此文件是 node.js 将用来执行对维基百科的 api 调用的 javascript 文件。
我们在 functiondescription 中描述了该文件的内容。

使用以下内容创建 tools.js:

const axios = require("axios");

class tools {
  static async wikipedia(q) {
    try {
      const response = await axios.get("https://pt.wikipedia.org/w/api.php", {
        params: {
          action: "query",
          list: "search",
          srsearch: q,
          srwhat: "text",
          format: "json",
          srlimit: 4,
        },
      });

      const results = await promise.all(
        response.data.query.search.map(async (searchresult) => {
          const sectionresponse = await axios.get(
            "https://pt.wikipedia.org/w/api.php",
            {
              params: {
                action: "parse",
                pageid: searchresult.pageid,
                prop: "sections",
                format: "json",
              },
            },
          );

          const sections = object.values(
            sectionresponse.data.parse.sections,
          ).map((section) => `${section.index}, ${section.line}`);

          return {
            pagetitle: searchresult.title,
            snippet: searchresult.snippet,
            pageid: searchresult.pageid,
            sections: sections,
          };
        }),
      );

      return results
        .map(
          (result) =>
            `snippet: ${result.snippet}\npageid: ${result.pageid}\nsections: ${json.stringify(result.sections)}`,
        )
        .join("\n\n");
    } catch (error) {
      console.error("error fetching from wikipedia:", error);
      return "error fetching data from wikipedia";
    }
  }

  static async wikipedia_with_pageid(pageid, sectionid) {
    if (sectionid) {
      const response = await axios.get("https://pt.wikipedia.org/w/api.php", {
        params: {
          action: "parse",
          format: "json",
          pageid: parseint(pageid),
          prop: "wikitext",
          section: parseint(sectionid),
          disabletoc: 1,
        },
      });
      return object.values(response.data.parse?.wikitext ?? {})[0]?.substring(
        0,
        25000,
      );
    } else {
      const response = await axios.get("https://pt.wikipedia.org/w/api.php", {
        params: {
          action: "query",
          pageids: parseint(pageid),
          prop: "extracts",
          exintro: true,
          explaintext: true,
          format: "json",
        },
      });
      return object.values(response.data?.query.pages)[0]?.extract;
    }
  }
}

module.exports = tools;

4.3 创建reactagent.js文件

使用以下内容创建 reactagent.js:

require("dotenv").config();
const { googlegenerativeai } = require("@google/generative-ai");
const tools = require("./tools");

const genai = new googlegenerativeai(process.env.google_ai_api_key);

class reactagent {
  constructor(query, functions) {
    this.query = query;
    this.functions = new set(functions);
    this.state = "thought";
    this._history = [];
    this.model = genai.getgenerativemodel({
      model: "gemini-1.5-flash",
      temperature: 1.8,
    });
  }

  async run() {
    this.pushhistory(`**tarefa: ${this.query} **`);
    try {
      return await this.step();
    } catch (e) {
      console.error("erro durante a execução:", e);
      return "desculpe, não consegui processar sua solicitação.";
    }
  }

  async step() {
    const colors = {
      reset: "\x1b[0m",
      yellow: "\x1b[33m",
      red: "\x1b[31m",
      cyan: "\x1b[36m",
    };
    console.log("====================================");
    console.log(
      `next movement: ${
        this.state === "thought"
          ? colors.yellow
          : this.state === "action"
            ? colors.red
            : this.state === "answer"
              ? colors.cyan
              : colors.reset
      }${this.state}${colors.reset}`,
    );
    console.log(`last movement: ${this.history[this.history.length - 1]}`);
    console.log("====================================");
    switch (this.state) {
      case "thought":
        return await this.thought();
        break;
      case "action":
        return await this.action();
        break;
      case "answer":
        return await this.answer();
    }
  }

  async thought() {
    const funcoesdisponiveis = json.stringify(array.from(this.functions));
    const contextohistorico = this.history.join("\n");
    const prompt = `sua tarefa é ${this.consulta}
o contexto posui todas as reflexões que você fez até agora e os resultadoação que coletou.
açõesdisponíveis são funções que você pode chamar sempre que precisar de mais dados.

contexto: "${contextohistorico}" <<

açõesdisponíveis: "${funcoesdisponiveis}" <<

tarefa: "${this.consulta}" <<

reflita sobre sua tarefa usando o contexto, resultadoação e açõesdisponíveis para encontrar seu próximo_passo.
imprima seu próximo_passo com um pensamento ou finalize cumprindo sua tarefa caso tenha as informações disponíveis`;

    const thought = await this.promptmodel(prompt);
    this.pushhistory(`\n **${thought.trim()}**`);

    if (
      thought.tolowercase().includes("cumprida") ||
      thought.tolowercase().includes("cumpra") ||
      thought.tolowercase().includes("cumprindo") ||
      thought.tolowercase().includes("finalizar") ||
      thought.tolowercase().includes("finalizando") ||
      thought.tolowercase().includes("finalize") ||
      thought.tolowercase().includes("concluída")
    ) {
      this.state = "answer";
    } else {
      this.state = "action";
    }
    return this.step();
  }

  async action() {
    const action = await this.decideaction();
    this.pushhistory(`** ação: ${action} **`);
    const result = await this.executefunctioncall(action);
    this.pushhistory(`** resultadoação: ${result} **`);
    this.state = "thought";
    return this.step();
  }

  async decideaction() {
    const availablefunctions = json.stringify(array.from(this.functions));
    const historycontext = this.history;
    const prompt = `reflita sobre o pensamento, consulta e ações disponíveis

    ${historycontext[historycontext.length - 2]}

    pensamento <<< ${historycontext[historycontext.length - 1]}

    consulta: "${this.query}"

    ações disponíveis: ${availablefunctions}

    retorne apenas a função,parâmetros separados por vírgula. exemplo: "wikipedia,ronaldinho gaucho,1450"`;

    const decision = await this.promptmodel(prompt);
    return decision.replace(/`/g, "").trim();
  }

  async answer() {
    const historycontext = this.history.join("\n");
    const prompt = `com base no seguinte contexto, forneça uma resposta completa e detalhada para a tarefa: ${this.query}.

    contexto:
    ${historycontext}

    tarefa: "${this.query}"`;

    const finalanswer = await this.promptmodel(prompt);
    return finalanswer;
  }

  async promptmodel(prompt) {
    const result = await this.model.generatecontent(prompt);
    const response = await result.response;
    return response.text();
  }

  async executefunctioncall(functioncall) {
    const [functionname, ...args] = functioncall.split(",");
    const func = tools[functionname.trim()];
    if (func) {
      return await func.call(null, ...args);
    }
    throw new error(`função ${functionname} não encontrada`);
  }

  pushhistory(value) {
    this._history.push(value);
  }

  get history() {
    return this._history;
  }
}

module.exports = reactagent;

4.4 运行代理并解释可用工具 (index.js)

使用以下内容创建index.js:

const reactagent = require("./reactagentptbr.js");

async function main() {
  const query = "que clubes ronaldinho gaúcho jogou para?";
  // const query = "quais os bairros de joinville?";
  // const query = "qual a capital da frança?";

  const functions = [
    [
      "wikipedia",
      "params: query",
      "busca semântica na wikipedia api por pageid e sectionids >> \n ex: pontos turísticos de são paulo \n são paulo é uma cidade com muitos pontos turísticos, pageid, sections : []",
    ],
    [
      "wikipedia_with_pageid",
      "params: pageid, sectionid",
      "busca na wikipedia api usando pageid e sectionindex como parametros. \n ex: 1500,1234 \n informações sobre a seção blablalbal",
    ],
  ];

  const agent = new reactagent(query, functions);
  const result = await agent.run();
  console.log("resultado do agente:", result);
}

main().catch(console.error);

角色描述

尝试添加新工具或功能时,请务必对其进行良好描述。
在我们的示例中,这已经完成并在调用新实例时添加到我们的 reactagent 类中。

const functions = [
    [
        "google", // nomeDaFuncao
        "params: query", // NomeDoParâmetroLocal
        "Pesquisa semântica na API da Wikipedia por snippets, pageIds e sectionIds >> \n ex: Quando o Brasil foi colonizado? \n O Brasil foi colonizado em 1500, pageId, sections : []", // breve explicação e exemplo (isso será encaminhado para o LLM)
    ]
];

[5] 维基百科部分如何运作

与维基百科的互动分两个主要步骤完成:

  1. 初始搜索(维基百科功能):

    • 向维基百科搜索 api 发出请求。
    • 最多返回 4 个与查询相关的结果。
    • 对于每个结果,搜索页面的各个部分。
  2. 详细搜索(wikipedia_with_pageid函数):

    • 使用页面 id 和分区 id 搜索特定内容。
    • 返回请求部分的文本。

此过程允许代理首先获得与查询相关的主题的概述,然后根据需要深入到特定部分。

[6] 执行流程示例

  1. 用户提问。
  2. 智能体进入思考状态并反思问题。
  3. 他决定搜索维基百科并进入 action 状态。
  4. 运行维基百科函数并获取结果。
  5. 返回thought状态反思结果。
  6. 您可以决定寻找更多细节或不同的方法。
  7. 根据需要重复思想和行动循环。
  8. 当它有足够的信息时,它进入answer状态。
  9. 根据收集到的所有信息生成最终响应。
  10. 只要维基百科没有可收集的数据,就进入无限循环。用计时器解决这个问题=p

[7] 最后的考虑

  • 模块化结构可以轻松添加新工具或 api。
  • 实施错误处理和时间/迭代限制非常重要,以避免无限循环或过度的资源使用。
  • 此示例使用温度 2。温度越低,代理在迭代过程中的创造力就越低。通过实验了解温度对 llm 的影响。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

512

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

244

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js是什么意思
js是什么意思

JS是JavaScript的缩写,它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言,通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果,如表单验证、页面元素操作、动画效果、数据交互等。

5306

2023.08.17

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

481

2023.09.01

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

Js中concat和push的区别
Js中concat和push的区别

Js中concat和push的区别:1、concat用于将两个或多个数组合并成一个新数组,并返回这个新数组,而push用于向数组的末尾添加一个或多个元素,并返回修改后的数组的新长度;2、concat不会修改原始数组,是创建新的数组,而push会修改原数组,将新元素添加到原数组的末尾等等。本专题为大家提供concat和push相关的文章、下载、课程内容,供大家免费下载体验。

218

2023.09.14

js截取字符串的方法介绍
js截取字符串的方法介绍

JavaScript字符串截取方法,包括substring、slice、substr、charAt和split方法。这些方法可以根据具体需求,灵活地截取字符串的不同部分。在实际开发中,根据具体情况选择合适的方法进行字符串截取,能够提高代码的效率和可读性 。

219

2023.09.21

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
快速入门Node.JS全套完整版
快速入门Node.JS全套完整版

共83课时 | 8.4万人学习

nodejs开发基础教程
nodejs开发基础教程

共15课时 | 4.5万人学习

JavaScript设计模式视频教程
JavaScript设计模式视频教程

共28课时 | 5.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号