经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 大数据/云/AI » 人工智能基础 » 查看文章
LangChain让LLM带上记忆
来源:cnblogs  作者:程序员半支烟  时间:2024/6/12 16:16:53  对本文有异议

最近两年,我们见识了“百模大战”,领略到了大型语言模型(LLM)的风采,但它们也存在一个显著的缺陷:没有记忆。

在对话中,无法记住上下文的 LLM 常常会让用户感到困扰。本文探讨如何利用 LangChain,快速为 LLM 添加记忆能力,提升对话体验。

LangChain 是 LLM 应用开发领域的最大社区和最重要的框架。

1. LLM 固有缺陷,没有记忆

当前的 LLM 非常智能,在理解和生成自然语言方面表现优异,但是有一个显著的缺陷:没有记忆

LLM 的本质是基于统计和概率来生成文本,对于每次请求,它们都将上下文视为独立事件。这意味着当你与 LLM 进行对话时,它不会记住你之前说过的话,这就导致了 LLM 有时表现得不够智能。

这种“无记忆”属性使得 LLM 无法在长期对话中有效跟踪上下文,也无法积累历史信息。比如,当你在聊天过程中提到一个人名,后续再次提及该人时,LLM 可能会忘记你之前的描述。

本着发现问题解决问题的原则,既然没有记忆,那就给 LLM 装上记忆吧。

2. 记忆组件的原理

2.1. 没有记忆的烦恼

当我们与 LLM 聊天时,它们无法记住上下文信息,比如下图的示例:

2.2. 原理

如果将已有信息放入到 memory 中,每次跟 LLM 对话时,把已有的信息丢给 LLM,那么 LLM 就能够正确回答,见如下示例:

目前业内解决 LLM 记忆问题就是采用了类似上图的方案,即:将每次的对话记录再次丢入到 Prompt 里,这样 LLM 每次对话时,就拥有了之前的历史对话信息。

但如果每次对话,都需要自己手动将本次对话信息继续加入到history信息中,那未免太繁琐。有没有轻松一些的方式呢?有,LangChain!LangChain 对记忆组件做了高度封装,开箱即用。

2.3. 长期记忆和短期记忆

在解决 LLM 的记忆问题时,有两种记忆方案,长期记忆和短期记忆。

  • 短期记忆:基于内存的存储,容量有限,用于存储临时对话内容。
  • 长期记忆:基于硬盘或者外部数据库等方式,容量较大,用于存储需要持久的信息。

3. LangChain 让 LLM 记住上下文

LangChain 提供了灵活的内存组件工具来帮助开发者为 LLM 添加记忆能力。

3.1. 单独用 ConversationBufferMemory 做短期记忆

Langchain 提供了 ConversationBufferMemory 类,可以用来存储和管理对话。

ConversationBufferMemory 包含input变量和output变量,input代表人类输入,output代表 AI 输出。

每次往ConversationBufferMemory组件里存入对话信息时,都会存储到history的变量里。

3.2. 利用 MessagesPlaceholder 手动添加 history

  1. from langchain.memory import ConversationBufferMemory
  2. memory = ConversationBufferMemory(return_messages=True)
  3. memory.load_memory_variables({})
  4. memory.save_context({"input": "我的名字叫张三"}, {"output": "你好,张三"})
  5. memory.load_memory_variables({})
  6. memory.save_context({"input": "我是一名 IT 程序员"}, {"output": "好的,我知道了"})
  7. memory.load_memory_variables({})
  8. from langchain.prompts import ChatPromptTemplate
  9. from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
  10. prompt = ChatPromptTemplate.from_messages(
  11. [
  12. ("system", "你是一个乐于助人的助手。"),
  13. MessagesPlaceholder(variable_name="history"),
  14. ("human", "{user_input}"),
  15. ]
  16. )
  17. chain = prompt | model
  18. user_input = "你知道我的名字吗?"
  19. history = memory.load_memory_variables({})["history"]
  20. chain.invoke({"user_input": user_input, "history": history})
  21. user_input = "中国最高的山是什么山?"
  22. res = chain.invoke({"user_input": user_input, "history": history})
  23. memory.save_context({"input": user_input}, {"output": res.content})
  24. res = chain.invoke({"user_input": "我们聊得最后一个问题是什么?", "history": history})

执行结果如下:

3.3. 利用 ConversationChain 自动添加 history

我们利用 LangChain 的ConversationChain对话链,自动添加history的方式添加临时记忆,无需手动添加。一个实际上就是将一部分繁琐的小功能做了高度封装,这样多个链就可以组合形成易用的强大功能。这里的优势一下子就体现出来了:

  1. from langchain.chains import ConversationChain
  2. from langchain.memory import ConversationBufferMemory
  3. from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
  4. memory = ConversationBufferMemory(return_messages=True)
  5. chain = ConversationChain(llm=model, memory=memory)
  6. res = chain.invoke({"input": "你好,我的名字是张三,我是一名程序员。"})
  7. res['response']
  8. res = chain.invoke({"input":"南京是哪个省?"})
  9. res['response']
  10. res = chain.invoke({"input":"我告诉过你我的名字,是什么?,我的职业是什么?"})
  11. res['response']

执行结果如下,可以看到利用ConversationChain对话链,可以让 LLM 快速拥有记忆:

3.4. 对话链结合 PromptTemplate 和 MessagesPlaceholder

在 Langchain 中,MessagesPlaceholder是一个占位符,用于在对话模板中动态插入上下文信息。它可以帮助我们灵活地管理对话内容,确保 LLM 能够使用最上下文来生成响应。

采用ConversationChain对话链结合PromptTemplateMessagesPlaceholder,几行代码就可以轻松让 LLM 拥有短时记忆。

  1. prompt = ChatPromptTemplate.from_messages(
  2. [
  3. ("system", "你是一个爱撒娇的女助手,喜欢用可爱的语气回答问题。"),
  4. MessagesPlaceholder(variable_name="history"),
  5. ("human", "{input}"),
  6. ]
  7. )
  8. memory = ConversationBufferMemory(return_messages=True)
  9. chain = ConversationChain(llm=model, memory=memory, prompt=prompt)
  10. res = chain.invoke({"input": "今天你好,我的名字是张三,我是你的老板"})
  11. res['response']
  12. res = chain.invoke({"input": "帮我安排一场今天晚上的高规格的晚饭"})
  13. res['response']
  14. res = chain.invoke({"input": "你还记得我叫什么名字吗?"})
  15. res['response']

4. 使用长期记忆

短期记忆在会话关闭或者服务器重启后,就会丢失。如果想长期记住对话信息,只能采用长期记忆组件。

LangChain 支持多种长期记忆组件,比如ElasticsearchMongoDBRedis等,下面以Redis为例,演示如何使用长期记忆。

  1. from langchain_community.chat_message_histories import RedisChatMessageHistory
  2. from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
  3. from langchain_core.runnables.history import RunnableWithMessageHistory
  4. from langchain_openai import ChatOpenAI
  5. model = ChatOpenAI(
  6. model="gpt-3.5-turbo",
  7. openai_api_key="sk-xxxxxxxxxxxxxxxxxxx",
  8. openai_api_base="https://api.aigc369.com/v1",
  9. )
  10. prompt = ChatPromptTemplate.from_messages(
  11. [
  12. ("system", "你是一个擅长{ability}的助手"),
  13. MessagesPlaceholder(variable_name="history"),
  14. ("human", "{question}"),
  15. ]
  16. )
  17. chain = prompt | model
  18. chain_with_history = RunnableWithMessageHistory(
  19. chain,
  20. # 使用redis存储聊天记录
  21. lambda session_id: RedisChatMessageHistory(
  22. session_id, url="redis://10.22.11.110:6379/3"
  23. ),
  24. input_messages_key="question",
  25. history_messages_key="history",
  26. )
  27. # 每次调用都会保存聊天记录,需要有对应的session_id
  28. chain_with_history.invoke(
  29. {"ability": "物理", "question": "地球到月球的距离是多少?"},
  30. config={"configurable": {"session_id": "baily_question"}},
  31. )
  32. chain_with_history.invoke(
  33. {"ability": "物理", "question": "地球到太阳的距离是多少?"},
  34. config={"configurable": {"session_id": "baily_question"}},
  35. )
  36. chain_with_history.invoke(
  37. {"ability": "物理", "question": "地球到他俩之间谁更近"},
  38. config={"configurable": {"session_id": "baily_question"}},
  39. )

LLM 的回答如下,同时关闭 session 后,直接再次提问最后一个问题,LLM 仍然能给出正确答案。

只要configurable配置的session_id能对应上,LLM 就能给出正确答案。

然后,继续查看redis存储的数据,可以看到数据在 redis 中是以 list的数据结构存储的。

5. 总结

本文介绍了 LLM 缺乏记忆功能的固有缺陷,以及记忆组件的原理,还讨论了如何利用 LangChain 给 LLM 装上记忆组件,让 LLM 能够在对话中更好地保持上下文。希望对你有帮助!

======>>>>>> 关于我 <<<<<<======

本篇完结!欢迎点赞 关注 收藏!!!

原文链接:https://mp.weixin.qq.com/s/bWZsP5CXYxsO6dARd1LtFQ

原文链接:https://www.cnblogs.com/mangod/p/18243321

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号