当前位置: 首页 > news >正文

phpcms仿行业网站建湖人才网今曰招

phpcms仿行业网站,建湖人才网今曰招,电子商务的网站建设的可用性,现在制作网页用什么软件分类目录#xff1a;《自然语言处理从入门到应用》总目录 当我们需要处理长文本时#xff0c;有必要将文本分割成块。虽然这听起来很简单#xff0c;但这里存在很多潜在的复杂性。理想情况下#xff0c;我们希望将语义相关的文本块保持在一起#xff0c;但什么是语义…分类目录《自然语言处理从入门到应用》总目录 当我们需要处理长文本时有必要将文本分割成块。虽然这听起来很简单但这里存在很多潜在的复杂性。理想情况下我们希望将语义相关的文本块保持在一起但什么是语义相关可能取决于文本的类型。本文就展示了几种实现这一目标的方法。 在高层次上文本分割器的工作原理如下 将文本分割成小的、语义有意义的块通常是句子。开始将这些小块组合成较大的块直到达到一定的大小由某个函数衡量。一旦达到该大小将该块作为自己的文本片段然后开始创建一个具有一定重叠的新文本块以保持块之间的上下文。 这意味着有两个不同的方向可以定制文本分割器 文本如何被分割块的大小如何衡量 默认推荐的文本分割器是RecursiveCharacterTextSplitter。该文本分割器接受一个字符列表作为参数。它尝试根据第一个字符进行分块但如果有任何分块过大它将继续尝试下一个字符依此类推。默认情况下它尝试进行分割的字符是\n\n、\n等。除了控制分割的字符之外我们还可以控制其他一些内容 length_function如何计算分块的长度。默认只计算字符数但通常在这里传递一个标记计数器。chunk_size分块的最大大小由长度函数测量。chunk_overlap分块之间的最大重叠量。保持一些重叠可以保持分块之间的连续性例如使用滑动窗口。add_start_index是否在元数据中包含每个分块在原始文档中的起始位置。 # This is a long document we can split up. with open(../../state_of_the_union.txt) as f:state_of_the_union f.read() from langchain.text_splitter import RecursiveCharacterTextSplitter text_splitter RecursiveCharacterTextSplitter(# Set a really small chunk size, just to show.chunk_size 100,chunk_overlap 20,length_function len,add_start_index True, ) texts text_splitter.create_documents([state_of_the_union]) print(texts[0]) print(texts[1])输出 page_contentMadam Speaker, Madam Vice President, our First Lady and Second Gentleman. Members of Congress and metadata{start_index: 0} page_contentof Congress and the Cabinet. Justices of the Supreme Court. My fellow Americans. metadata{start_index: 82}我们还可以使用文本分割器分割下列类型的文件 CharacterHTMLLatexMarkdownNLTKPythonRecursive CharacterspaCytiktokenOpenAI 参考文献 [1] LangChain官方网站https://www.langchain.com/ [2] LangChain ️ 中文网跟着LangChain一起学LLM/GPT开发https://www.langchain.com.cn/ [3] LangChain中文网 - LangChain 是一个用于开发由语言模型驱动的应用程序的框架http://www.cnlangchain.com/
http://www.dnsts.com.cn/news/69293.html

相关文章:

  • 做亚马逊网站费用甘肃建设厅网站首页
  • 代理东莞网站制作公司wordpress 进度插件
  • 网站通栏广告素材兰州网站设计厂家
  • 阿里巴巴网站推广怎么做游戏推广平台代理加盟
  • 南宁百度 - 网站正在建设中广东住房和城乡建设部网站
  • 属于自己的网站做网站开发需要学什么
  • 查网站怎么做的网站建设相关博客
  • dede 网站目录微网站和微信公共平台的区别
  • 厦门市建设协会网站首页安卓app怎么开发
  • 建设工程案例网站dnf交易网站建设
  • 网站弹出咨询这个怎么做做网站499
  • 网站更新怎么做长沙网页制作设计
  • 做英文兼职的网站怎样做国外网站推广
  • 做网站需要雇什么人忻州集团网站建设
  • 高明网站设计案例固原建站公司
  • 做外贸网站哪家公司好新出网页游戏
  • app推广代理平台seo排名优化推荐
  • 宝应县住房和城乡建设局网站台州市城乡建设局网站
  • 网站论坛建设需要什么资质钓鱼网站怎么搭建
  • wordpress免费教程视频淘宝的seo是什么意思
  • 做网站写的代号好跟不好的区别app推广策略
  • 清远企业网站建设公司wordpress菜单如何做
  • 网站编辑器判断WordPress数据库禁用插件
  • 做宠物网站东莞人才市场招聘官网
  • 怎样做像绿色和平组织类似的网站wordpress后台403
  • 网站建设 办公系统金华市建设银行网站
  • 软件开发和网站开发难度iis7 wordpress伪静态
  • 上海人才中心网站电子商务网站设计原则
  • 在本地做改版如何替换旧网站会影响百度收录吗wordpress 媒体库空白
  • 网站排名要怎么做xml wordpress