当前位置: 首页 > news >正文

朝阳seo建站网站收录没了

朝阳seo建站,网站收录没了,创可贴网站怎么做图片大全,wordpress php 采集分类目录#xff1a;《自然语言处理从入门到应用》总目录 索引#xff08;Indexes#xff09;是指为了使LLM与文档更好地进行交互而对其进行结构化的方式。在链中#xff0c;索引最常用于“检索”步骤中#xff0c;该步骤指的是根据用户的查询返回最相关的文档#xff1a…分类目录《自然语言处理从入门到应用》总目录 索引Indexes是指为了使LLM与文档更好地进行交互而对其进行结构化的方式。在链中索引最常用于“检索”步骤中该步骤指的是根据用户的查询返回最相关的文档 索引不仅可用于检索还可用于其他目的检索可以使用除索引之外的其他逻辑来查找相关文档 因此我们有一个称为Retriever的接口概念这是大多数链所使用的接口。当我们谈论索引和检索时通常是指索引和检索非结构化数据如文本文档。对于与结构化数据例如SQL表等或API的交互请参阅相应的用例部分以获取相关功能的链接。 LangChain 主要关注于构建索引目标是使用它们作为检索器。为了更好地理解这意味着什么有必要突出显示基本检索器接口是什么。LangChain 的baseRetriever类如下 from abc import ABC, abstractmethod from typing import List from langchain.schema import Documentclass BaseRetriever(ABC):abstractmethoddef get_relevant_documents(self, query: str) - List[Document]:Get texts relevant for a query.Args:query: string to find relevant texts forReturns:List of relevant documents上述代码中的get_relevant_documents方法可以按照我们认为合适的方式实现。当然我们也协助构建我们认为有用的检索器。我们主要关注的检索器类型是Vectorstore检索器。在本文的其余部分中我们都将关注这一点。为了理解什么是向量库检索器理解向量库是什么非常重要。默认情况下LangChain使用Chroma作为向量存储来索引和搜索嵌入。要执行下面的代码我们首先需要安装chromadb。 pip install chromadb下面这个例子展示了对文档的问题回答。我们选择这个例子作为开始的例子因为它很好地组合了许多不同的元素如文本分割器、嵌入、向量存储等 还演示了如何在链中使用它们。通过文件回答问题包括四个步骤 创建索引从该索引创建检索器创建一个问题回答链提出问题 每个步骤都有多个子步骤和可能的配置。在本文中我们将主要关注创建索引。我们将展示这样做的一行程序然后分解实际发生的情况。首先让我们导入一些无论如何都会使用的通用类 from langchain.chains import RetrievalQA from langchain.llms import OpenAI接下来在通用设置中让我们指定要使用的文档加载程序。我们可以在Github下载state_of_the_union.txt文件 from langchain.document_loaders import TextLoader loader TextLoader(../state_of_the_union.txt, encodingutf8)创建索引 为了尽快开始我们可以使用VectorstoreIndexCreator。 from langchain.indexes import VectorstoreIndexCreator index VectorstoreIndexCreator().from_loaders([loader])日志输出 Running Chroma using direct local API. Using DuckDB in-memory for database. Data will be transient.现在已经创建了索引我们可以使用它来询问数据的问题。需要注意的是在引擎盖下这实际上也在执行一些步骤我们将在本文后面介绍这些步骤。 query What did the president say about Ketanji Brown Jackson index.query(query)输出 The president said that Ketanji Brown Jackson is one of the nations top legal minds, a former top litigator in private practice, a former federal public defender, and from a family of public school educators and police officers. He also said that she is a consensus builder and has received a broad range of support from the Fraternal Order of Police to former judges appointed by Democrats and Republicans.输入 query What did the president say about Ketanji Brown Jackson index.query_with_sources(query)输出 {question: What did the president say about Ketanji Brown Jackson,answer: The president said that he nominated Circuit Court of Appeals Judge Ketanji Brown Jackson, one of the nations top legal minds, to continue Justice Breyers legacy of excellence, and that she has received a broad range of support from the Fraternal Order of Police to former judges appointed by Democrats and Republicans.\n,sources: ../state_of_the_union.txt}从VectorstoreIndexCreator返回的是VectorStoreIndexWrapper它提供了这些优秀的查询和query_with_sources功能。如果我们只是想直接访问向量存储我们也可以这样做 index.vectorstore输出 langchain.vectorstores.chroma.Chroma at 0x119aa5940如果我们想要访问VectorstoreRetriever我们可以使用 index.vectorstore.as_retriever()输出 VectorStoreRetriever(vectorstorelangchain.vectorstores.chroma.Chroma object at 0x119aa5940, search_kwargs{})演练 VectorstoreIndexCreator在加载文件后有三个主要步骤 将文档分割成块为每个文档创建嵌入在向量库中存储文档和嵌入 让我们用代码来演示一下 documents loader.load()接下来我们将把文档分割成块 from langchain.text_splitter import CharacterTextSplitter text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) texts text_splitter.split_documents(documents)然后我们将选择要使用的嵌入 from langchain.embeddings import OpenAIEmbeddings embeddings OpenAIEmbeddings()现在我们创建用作索引的向量存储 from langchain.vectorstores import Chroma db Chroma.from_documents(texts, embeddings)日志输出 Running Chroma using direct local API. Using DuckDB in-memory for database. Data will be transient.这就是创建索引的过程然后我们在一个检索接口中公开这个索引“” retriever db.as_retriever()然后像之前一样我们创建一个链并使用它来回答问题 qa RetrievalQA.from_chain_type(llmOpenAI(), chain_typestuff, retrieverretriever)query What did the president say about Ketanji Brown Jackson qa.run(query)输出 The President said that Judge Ketanji Brown Jackson is one of the nations top legal minds, a former top litigator in private practice, a former federal public defender, and from a family of public school educators and police officers. He said she is a consensus builder and has received a broad range of support from organizations such as the Fraternal Order of Police and former judges appointed by Democrats and Republicans.VectorstoreIndexCreator只是所有这些逻辑的包装器。我们还可以使用文本分割器、嵌入以及向量存储中进行配置。例如我们可以按以下方式配置它 index_creator VectorstoreIndexCreator(vectorstore_clsChroma, embeddingOpenAIEmbeddings(),text_splitterCharacterTextSplitter(chunk_size1000, chunk_overlap0) )参考文献 [1] LangChain官方网站https://www.langchain.com/ [2] LangChain ️ 中文网跟着LangChain一起学LLM/GPT开发https://www.langchain.com.cn/ [3] LangChain中文网 - LangChain 是一个用于开发由语言模型驱动的应用程序的框架http://www.cnlangchain.com/
http://www.dnsts.com.cn/news/19283.html

相关文章:

  • 开发网站app公司沈阳建设工程信息网中项目管理人员都填哪些人
  • 网站建设的职业叫什么本地打开WordPress慢
  • 自己做的网站被封了佛山专业网站制作设计
  • wordpress企业站教程外管局网站做延期收款报告
  • 软文发布网站如何做wap网站
  • 个人理财的网站开发crm客户管理系统多少钱
  • 如何在南美做网站推广在长沙阳光医院做网站编辑
  • 做网站技术方法有网站建设有什么方法连接数据库
  • 建设网站服务器怎么选国外做测评的网站有哪些
  • 辽宁品质网站建设价格实惠做智能家居网站需要的参考文献
  • 网站制作费可以做业务宣传费免费软件开发app
  • j江苏省建设工程招投标网站咨询公司需要什么专业
  • 集团高端网站怎么制作网站教程步骤
  • 装修网站论坛重庆公司建设网站
  • 云南建设局网站首页捡个校花做老婆是哪个网站的
  • 大型网站建设入门wordpress调整logo大小
  • 滨州网站建设公司报价如何做网站搜索引擎优化
  • 芜湖市公司网站建设哪家好网站开发+百度编辑器
  • 如何将网站部署到服务器wordpress 多标签插件
  • 网站如何做导航百度网站提交入口网址
  • 综合购物网站排名做钻石资讯网站
  • 广州做网站最好的公司正规网络游戏平台
  • 企业网站的主要类型网站建设作品图片
  • wordpress去除分类目录归档网站程序 seo
  • 怎么做别人可以上的网站网页设计实验报告模板
  • 湖州建设局网站 项目验收流程wordpress 栏目标题
  • 帝国网站网站手机版怎么做太原市建设工程安全监督站网站
  • 一个空间安装多个网站上海网站开发公司外包
  • 拿网站的文章做外链namesilo wordpress
  • 四网合一网站建设wordpress批量添加摘要