5 分钟明白 LangChain 的输出解析器和链

作者：EquatorCoco

2024-05-27
福建
本文字数：2489 字
阅读完需：约 8 分钟

本文介绍 LangChain 的输出解析器OutputParser的使用，和基于 LangChain 的LCEL构建链。

1. 输出解析器 OutputParser

1.1、为什么需要 OutputParser

常规的使用 LangChain 构建 LLM 应用的流程是：Prompt 输入、调用 LLM 、LLM 输出。有时候我们期望 LLM 给到的数据是格式化的数据，方便做后续的处理。

这时就需要在 Prompt 里设置好要求，然后 LLM 会在输出内容后，再将内容传给输出解析器，输出解析器会解析成我们预期的格式。

1.2、代码实践

调用系统自带的输出解析器

示例 1：将调用 LLM 的结果，解析为逗号分隔的列表。比如询问某个城市有 N 个景点。

from langchain_openai import ChatOpenAIfrom langchain.output_parsers import CommaSeparatedListOutputParserfrom langchain.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([    ("system", "{parser_instructions}"),    ("human", "列出{cityName}的{viewPointNum}个著名景点。")])
output_parser = CommaSeparatedListOutputParser()parser_instructions = output_parser.get_format_instructions()# 查看解析器的指令内容print(parser_instructions)
final_prompt = prompt.invoke({"cityName": "南京", "viewPointNum": 3, "parser_instructions": parser_instructions})
model = ChatOpenAI(model="gpt-3.5-turbo",                   openai_api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",                   openai_api_base="https://api.aigc369.com/v1")response = model.invoke(final_prompt)print(response.content)
ret = output_parser.invoke(response)print(ret)

复制代码

自定义格式的输出解析器

除了使用自带的一些输出格式，还可以使用自定义的输出格式。使用步骤如下：

定义数据结构类，继承pydantic的BaseModel
使用输出解析器PydanticOutputParser
后续是常规操作：生成 prompt、调用 LLM 执行、将输出按照 Parser 解析

示例 2：比如给 LLM 一段书籍的介绍，让他按照指定的格式总结输出。

from typing import List
from langchain.output_parsers import PydanticOutputParserfrom langchain.prompts import ChatPromptTemplatefrom langchain.schema import HumanMessagefrom langchain_core.pydantic_v1 import BaseModel, Fieldfrom langchain_openai import ChatOpenAI

class BookInfo(BaseModel):    book_name: str = Field(description="书籍的名字")    author_name: str = Field(description="书籍的作者")    genres: List[str] = Field(description="书籍的体裁")

output_parser = PydanticOutputParser(pydantic_object=BookInfo)# 查看输出解析器的内容，会被输出成json格式print(output_parser.get_format_instructions())
prompt = ChatPromptTemplate.from_messages([    ("system", "{parser_instructions} 你输出的结果请使用中文。"),    ("human", "请你帮我从书籍的概述中，提取书名、作者，以及书籍的体裁。书籍概述会被三个#符号包围。\n###{book_introduction}###")])
book_introduction = """《朝花夕拾》原名《旧事重提》，是现代文学家鲁迅的散文集，收录鲁迅于1926年创作的10篇回忆性散文， [1]1928年由北京未名社出版，现编入《鲁迅全集》第2卷。此文集作为“回忆的记事”，多侧面地反映了作者鲁迅青少年时期的生活，形象地反映了他的性格和志趣的形成经过。前七篇反映他童年时代在绍兴的家庭和私塾中的生活情景，后三篇叙述他从家乡到南京，又到日本留学，然后回国教书的经历；揭露了半殖民地半封建社会种种丑恶的不合理现象，同时反映了有抱负的青年知识分子在旧中国茫茫黑夜中，不畏艰险，寻找光明的困难历程，以及抒发了作者对往日亲友、师长的怀念之情 [2]。文集以记事为主，饱含着浓烈的抒情气息，往往又夹以议论，做到了抒情、叙事和议论融为一体，优美和谐，朴实感人。作品富有诗情画意，又不时穿插着幽默和讽喻；形象生动，格调明朗，有强烈的感染力。"""
model = ChatOpenAI(model="gpt-3.5-turbo",                   openai_api_key="sk-BuQK7SGbqCZP2i2z7fF267AeD0004eF095AbC78d2f79E019",                   openai_api_base="https://api.aigc369.com/v1")final_prompt = prompt.invoke({"book_introduction": book_introduction,                              "parser_instructions": output_parser.get_format_instructions()})response = model.invoke(final_prompt)print(response.content)result = output_parser.invoke(response)print(result)

复制代码

2. 利用 LCEL 构建链

2.1、LCEL 是啥

LCEL 是 LangChain 表达式语言（LangChain Expression Language）的简称。使用 LCEL 可以快速将各种链组合到一起，那链又是啥呢？

在 LangChain 里只要实现了Runnable接口，并且有invoke方法，都可以成为链。实现了Runnable接口的类，可以拿上一个链的输出作为自己的输入。

比如以上代码的ChatPromptTemplate 、ChatOpenAI 、PydanticOutputParser等，都实现了Runnable接口，且都有invoke方法。

LCEL 提供了多种方式将链组合起来，比如使用管道符 |，这种方式既方便书写，表达力也很强劲。

2.2、使用区别

不使用 LCEL

不使用 LCEL 时，代码写起来是，各种invoke满天飞。比如这样：

final_prompt = prompt.invoke({"book_introduction": book_introduction,                              "parser_instructions": output_parser.get_format_instructions()})response = model.invoke(final_prompt)result = output_parser.invoke(response)

复制代码

使用 LCEL

使用 LCEL 时，代码简洁，并且表达力强许多，比如这样：

chain = prompt | model | output_parserret = chain.invoke({"book_introduction": book_introduction,                    "parser_instructions": output_parser.get_format_instructions()})

复制代码

3、总结

本文主要聊了 LangChain 的输出解析器和使用 LCEL 构建链，希望对你有帮助！

文章转载自：程序员半支烟
原文链接：https://www.cnblogs.com/mangod/p/18214717
体验地址：http://www.jnpfsoft.com/?from=infoq

发布于: 刚刚阅读数: 4

EquatorCoco

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

发布

暂无评论

创作场景

5 分钟明白 LangChain 的输出解析器和链

1. 输出解析器 OutputParser

1.1、为什么需要 OutputParser

1.2、代码实践

2. 利用 LCEL 构建链

2.1、LCEL 是啥

2.2、使用区别

3、总结

EquatorCoco

评论