星河知识库怎么下载(星河知识库共享)干货满满
还在寻找基于文心一言搭建本地知识库问答的方案吗?AI Studio 星河社区带你实战演练(支持私有化部署)!相信对于大语言模型(LLM)有所涉猎
还在寻找基于文心一言搭建本地知识库问答的方案吗?AI Studio 星河社区带你实战演练(支持私有化部署)!相信对于大语言模型(LLM)有所涉猎的朋友,对于“老网红”知识库问答不会陌生自从大模型爆火后,开发者都希望尽快进行开发实战,企业都希望尽快在产品中集成 LLM 的能力,结合业务快速落地,那最直接的方式就是构建知识库问答。
本项目由 AI Studio 星河社区开发者「SWHL」创作并发布体验应用,应用中使用 AI Studio SDK(文末获取文档)提供的能力完成文心一言与向量检索增强的结合,与此同时,开发者「SWHL」提供的开源项目还支持本地私有化部署的版本,助力个人和企业完成知识问答系统搭建。
01项目亮点1、除大语言模型接口需要单独部署外,其他部分均可使用 CPU2、整个项目模块化,不依赖 lanchain 库,各个部分都可以轻松替换,代码简单易懂3、WebUI 向量检索 Log 可视化4、支持接入多个 LLM 模型
5、支持本地私有化部署02应用体验 Demo
▎应用参数解读:max_length:生成结果时的最大 token 数top_p:用于控制模型生成文本时,选择下一个单词的概率分布的范围具体来说,当使用 top_p 参数时,模型将考虑累积概率分布中概率之和最大的最小集合中的所有单词,并在其中选择下一个单词。
temperature:用于调整模型生成文本时的创造性程度,较高的 temperature 将使模型更有可能生成新颖、独特的文本,而较低的温度则更有可能生成常见或常规的文本Search Top_K:从文档向量数据库中召回的前 K 个相关内容,用于和问题拼接为完整内容送到大模型中,可选值有5,10, 15
03工作流程1、解析文档并存入数据库
2、检索并回答问题
04搭建知识库问答应用▎Fork 该项目
▎启动进入线上开发环境选择 CPU 环境即可
AI Studio 星河社区每周均可免费获得一定数量算力▎查看文件进行开发
05本地私有化部署创作者已将该项目进行开源,有私有化部署需求的可移步至该项目 Github,获取代码文件进行部署项目作者:SWHL,RapidAI 开源组织成员,日常研究方向为大模型落地和 CV 相关,包括 OCR 和目标检测等方向。
作者主页https://github.com/SWHLRapidAI 开源组织主页https://github.com/RapidAI该项目 Githubhttps://github.com/RapidAI/Knowledge-QA-LLM
AI Studio 星河社区已上线 SDK 开发工具,支持文心一言、Embedding 等能力的高效使用,点击阅读原文查看 SDK 开发工具使用文档。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186