写点什么

5 分钟明白 LangChain 的输出解析器和链

作者:EquatorCoco
  • 2024-05-27
    福建
  • 本文字数:2489 字

    阅读完需:约 8 分钟

本文介绍 LangChain 的输出解析器OutputParser的使用,和基于 LangChain 的LCEL构建


1. 输出解析器 OutputParser


1.1、为什么需要 OutputParser


常规的使用 LangChain 构建 LLM 应用的流程是:Prompt 输入、调用 LLM 、LLM 输出。有时候我们期望 LLM 给到的数据是格式化的数据,方便做后续的处理。


这时就需要在 Prompt 里设置好要求,然后 LLM 会在输出内容后,再将内容传给输出解析器,输出解析器会解析成我们预期的格式。



1.2、代码实践


调用系统自带的输出解析器


示例 1:将调用 LLM 的结果,解析为逗号分隔的列表。比如询问某个城市有 N 个景点。

from langchain_openai import ChatOpenAIfrom langchain.output_parsers import CommaSeparatedListOutputParserfrom langchain.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([ ("system", "{parser_instructions}"), ("human", "列出{cityName}的{viewPointNum}个著名景点。")])
output_parser = CommaSeparatedListOutputParser()parser_instructions = output_parser.get_format_instructions()# 查看解析器的指令内容print(parser_instructions)
final_prompt = prompt.invoke({"cityName": "南京", "viewPointNum": 3, "parser_instructions": parser_instructions})
model = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", openai_api_base="https://api.aigc369.com/v1")response = model.invoke(final_prompt)print(response.content)
ret = output_parser.invoke(response)print(ret)
复制代码



自定义格式的输出解析器


除了使用自带的一些输出格式,还可以使用自定义的输出格式。使用步骤如下:


  • 定义数据结构类,继承pydanticBaseModel

  • 使用输出解析器PydanticOutputParser

  • 后续是常规操作:生成 prompt、调用 LLM 执行、将输出按照 Parser 解析


示例 2:比如给 LLM 一段书籍的介绍,让他按照指定的格式总结输出。

from typing import List
from langchain.output_parsers import PydanticOutputParserfrom langchain.prompts import ChatPromptTemplatefrom langchain.schema import HumanMessagefrom langchain_core.pydantic_v1 import BaseModel, Fieldfrom langchain_openai import ChatOpenAI

class BookInfo(BaseModel): book_name: str = Field(description="书籍的名字") author_name: str = Field(description="书籍的作者") genres: List[str] = Field(description="书籍的体裁")

output_parser = PydanticOutputParser(pydantic_object=BookInfo)# 查看输出解析器的内容,会被输出成json格式print(output_parser.get_format_instructions())
prompt = ChatPromptTemplate.from_messages([ ("system", "{parser_instructions} 你输出的结果请使用中文。"), ("human", "请你帮我从书籍的概述中,提取书名、作者,以及书籍的体裁。书籍概述会被三个#符号包围。\n###{book_introduction}###")])
book_introduction = """《朝花夕拾》原名《旧事重提》,是现代文学家鲁迅的散文集,收录鲁迅于1926年创作的10篇回忆性散文, [1]1928年由北京未名社出版,现编入《鲁迅全集》第2卷。此文集作为“回忆的记事”,多侧面地反映了作者鲁迅青少年时期的生活,形象地反映了他的性格和志趣的形成经过。前七篇反映他童年时代在绍兴的家庭和私塾中的生活情景,后三篇叙述他从家乡到南京,又到日本留学,然后回国教书的经历;揭露了半殖民地半封建社会种种丑恶的不合理现象,同时反映了有抱负的青年知识分子在旧中国茫茫黑夜中,不畏艰险,寻找光明的困难历程,以及抒发了作者对往日亲友、师长的怀念之情 [2]。文集以记事为主,饱含着浓烈的抒情气息,往往又夹以议论,做到了抒情、叙事和议论融为一体,优美和谐,朴实感人。作品富有诗情画意,又不时穿插着幽默和讽喻;形象生动,格调明朗,有强烈的感染力。"""
model = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key="sk-BuQK7SGbqCZP2i2z7fF267AeD0004eF095AbC78d2f79E019", openai_api_base="https://api.aigc369.com/v1")final_prompt = prompt.invoke({"book_introduction": book_introduction, "parser_instructions": output_parser.get_format_instructions()})response = model.invoke(final_prompt)print(response.content)result = output_parser.invoke(response)print(result)
复制代码


2. 利用 LCEL 构建链


2.1、LCEL 是啥


LCEL 是 LangChain 表达式语言(LangChain Expression Language)的简称。使用 LCEL 可以快速将各种组合到一起,那又是啥呢?


在 LangChain 里只要实现了Runnable接口,并且有invoke方法,都可以成为。实现了Runnable接口的类,可以拿上一个链的输出作为自己的输入。



比如以上代码的ChatPromptTemplate 、ChatOpenAI 、PydanticOutputParser等,都实现了Runnable接口,且都有invoke方法。


LCEL 提供了多种方式将链组合起来,比如使用管道符 |,这种方式既方便书写,表达力也很强劲。



2.2、使用区别


不使用 LCEL


不使用 LCEL 时,代码写起来是,各种invoke满天飞。比如这样:

final_prompt = prompt.invoke({"book_introduction": book_introduction,                              "parser_instructions": output_parser.get_format_instructions()})response = model.invoke(final_prompt)result = output_parser.invoke(response)
复制代码


使用 LCEL


使用 LCEL 时,代码简洁,并且表达力强许多,比如这样:

chain = prompt | model | output_parserret = chain.invoke({"book_introduction": book_introduction,                    "parser_instructions": output_parser.get_format_instructions()})
复制代码


3、总结


本文主要聊了 LangChain 的输出解析器 和 使用 LCEL 构建链,希望对你有帮助!


文章转载自:程序员半支烟

原文链接:https://www.cnblogs.com/mangod/p/18214717

体验地址:http://www.jnpfsoft.com/?from=infoq


用户头像

EquatorCoco

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

评论

发布
暂无评论
5分钟明白LangChain 的输出解析器和链_Java_EquatorCoco_InfoQ写作社区