本地知识库软件(longchain 本地知识库)真没想到

2023-11-29Aix XinLe

完成部署后。动动鼠标，类似于使用 Visio、Word 制作流程图一样，拖动几个图表，练连几根线，搭积木一样，就可以自动配置一个 AI 应用程序。

这是《ChatGPT ，从入门到精通》系列第 61 篇文章大家好，我是你们的老朋友清风徐来，我的公众号专注利用 ChatGPT 等 AI 工具为你的生活、工作增效赋能欢迎阅读和关注！上次分享了如何使用。

GPT-4 & LangChain 本地部署企业知识库(技术篇)有小伙伴跟着一步步操作，搭建了自己的第一个本地知识库！今天我要给大家介绍一个基于 LangChain ，更加神奇的 AI 工具——Flowise。

你只需要动动鼠标，类似于使用 Visio、Word 制作流程图一样，拖动几个图表，连接几根线，搭积木一样，就可以自动配置一个 AI 应用程序一、Flowise 是什么？Flowise 是一个零代码的 AI 应用和 LLM 可视化工作流构建神器。

Flowise 是免费的开源工具，商业和个人使用均可官网：https://flowiseai.com代码地址：https://github.com/FlowiseAI

它可以帮助我们使用 Langchain JS 构建自定义的 LLM 流程无论你是否有编程背景，Flowise 都可以让你快速地搭建基于 GPT 的应用你只需要在电脑上安装 Flowise，然后打开一个网页，就可以开始使用 Flowise 了。

你还可以把你创建的程序分享给别人，或者嵌入到其他网站上二、本地如何安装 Flowise？本机安装 Flowise 非常简单，步骤为：下载并安装软件运行环境 NodeJS >= 18.15.0安装 Flowise：npm install -g flowise

启动 Flowise：npx flowise start打开http://localhost:3000使用具体步骤如下：（一）安装 NodeJS 运行环境NodeJS 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境

安装后，你可以在本地电脑登录浏览器访问、使用 WEB 程序Flowise 要求 NodeJS 的版本需要大于或等于 18.15.0登录 https://nodejs.org/en/download选择一个适合自己版本下载：

点击安装，默认各个设置即可。

安装完成后，按 win+R 键盘，输入 "CMD"，进入 Dos 提示符界面输入node -v看到以下版本号提示，表示安装成功了

（二）安装 Flowisenpm 是 Node.js 的包管理器npm 支持从多个来源安装软件包，其中包括 npm 官方仓库、GitHub 仓库以及其他第三方仓库在 Dos 提示符界面，输入：npm install -g flowise。

系统开始自动安装 Flowise:

整个过程根据网络速度，大概 10-20 分钟自动完成安装注意，要退出 DOS 下的运行界面，按键盘上的 ctrl+c 键（三）启动 Flowise安装完成后，你可以在 DOS 下，使用以下命令启动 Flowise：。

1.不带密码启动npx flowise start2.初始化用户名和密码后启动user 就是你的用户名（可以自定义），1234 就是你的登录密码（可自定义）npx flowise start --FLOWISE_USERNAME=user --FLOWISE_PASSWORD=1234

出现以下提示，表示启动成功了

（四）登录 Flowise最后，打开浏览器，访问 http://localhost:3000，就可以看到 Flowise 的界面了。因为设置了用户名和密码，需要登陆一次

三、Flowise 的工作原理在使用前，我们介绍下 Flowise 的工作原理:如前所述，Flowise 是一个基于 LangChain 的图形界面的可视化工具，LangChain 是一个用于开发基于语言模型的应用程序的框架，它工作原理是将语言模型与其他组件结合起来，形成一个链式的流程，以实现特定的用例。

1、LangChain 主要支持 6 种组件：Models：模型，各种类型的模型和模型集成，比如 GPT-4Prompts：提示，包括提示管理、提示优化和提示序列化Memory：记忆，用来保存和模型交互时的上下文状态

Indexes：索引，用来结构化文档，以便和模型交互Chains：链，一系列对各种组件的调用Agents：代理，决定模型采取哪些行动，执行并且观察流程，直到完成为止你可以把 Agents 理解为执行这个任务的负责人，它负责驱动你配置的整个流程。

2、Flowise 有 12 个核心模块：Flowise 是一个强大的工具，它包含了许多组件，这些组件可以帮助用户构建和管理他们的工作流和知识库以下是这些组件的简单介绍：Agents：Agent 是 Flowise 中的一个重要组件，它负责执行工作流中的任务。

每个 Agent 都有一个特定的功能，比如读取数据、处理数据、生成报告等Chains：Chain 是一系列任务的集合，这些任务按照特定的顺序执行用户可以在 Chain 中添加、删除和重新排序任务，以创建自定义的工作流。

Agents：Agent 是 Flowise 中的一个重要组件，它负责执行工作流中的任务每个 Agent 都有一个特定的功能，比如读取数据、处理数据、生成报告等Chains：Chain 是一系列任务的集合，这些任务按照特定的顺序执行。

用户可以在 Chain 中添加、删除和重新排序任务，以创建自定义的工作流Chat Models：Chat Model 是 Flowise 的一个功能，它可以帮助用户创建和管理聊天机器人用户可以使用 Chat Model 来自动回答问题、提供信息，或者执行其他的聊天任务。

Document Loaders：Document Loader 是用于加载和处理文档的工具它可以处理各种类型的文档，包括文本文件、PDF 文件、网页等Embeddings：Embedding 是一种将文本转换为数值向量的方法，这种方法在自然语言处理中非常重要。

Flowise 提供了多种 Embedding 工具，可以帮助用户处理他们的文本数据LLMs：LLM 是 Flowise 的核心功能之一，它代表了“语言模型”用户可以使用 LLM 来生成文本、回答问题、翻译文本等。

Memory：Memory 是 Flowise 的一个组件，它用于存储和管理用户的数据用户可以在 Memory 中创建、修改和删除数据Prompts：Prompt 是用于生成文本的工具用户可以使用 Prompt 来创建自定义的文本生成任务。

Retrievers：Retriever 是用于检索数据的工具用户可以使用 Retriever 来从他们的数据中找到相关的信息Text Splitters：Text Splitter 是用于分割文本的工具。

用户可以使用 Text Splitter 来将他们的文本分割成更小的部分，以便于处理Tools：Tool 是 Flowise 提供的一系列实用工具这些工具包括数据处理工具、文本生成工具、数据可视化工具等。

Vector Stores：Vector Store 是用于存储和管理向量数据的工具用户可以使用 Vector Store 来存储他们的 Embedding 数据3、两者的对应关系Flowise 的模块和 LangChain 的组件是互相对应的。

我使用 ChatGPT4plus 的 show me 插件，绘制说明图如下：

ChatGPT 4 ，12秒生成流程图四、 Flowise 界面1. 界面如下先看左边

模版：系统集成了很多现成模版，可以直接使用。

工具：现成工具，用于事务性工作

API key：这个是 Flowise 的 key，方便分享已构建程序。再看右边

2.新建项目点击 add new 进入构造界面

按如下方式拖拽组件

五、案例：制作一个基于 PDF 的聊天机器人完整的分析流程如下:首先，要上传 PDF（文件加载器）；再将 PDF 进行文本分割（文本分割器）；为了让 AI 看懂，还需要进行向量化处理（向量化），存储到向量数据库中。

然后在“Agent”的驱动下，按照“链”的逻辑，根据“提示语”接受提问，由“语言模型”进行分析，根据“记忆”上下文，对比“语言模型”已有公开知识+“向量数据库”存储的本地知识，给出答案我们先用一个比较简单+经典的基于PDF的聊天机器人来进行讲解。

具体为：主界面点击右上角的“add new"，新建项目1. 第一步：选择语言模型 LLM我们选择 OPENAI，选择达芬奇 003

注意，要把你的 OEPN AI key 录入，如何获取详见ChatGPT 保姆级注册教程（上）原生版。如果你确实获取不了，也可以加群后找我。

这里动画演示下，后面的步骤就不放动画了，大同小异

2. 第二步：选择文档加载器 Document Loaders做一个基于 PDF 文件的聊天机器人，肯定就需要上传 PDF 文档上传 PDF 文档就需要一个 PDF 文档加载器

选择 “pdf file ”组件

3. 第三步：选择“文档分割器”选择了文档加载器后，还需要选择一个文本分割器 “TEXT splitters”，选择如下：

overlap 选择 200，这个大小适合在拆分后保证中文语句之间的语义

4. 第四步：选择数据向量化工具PDF 文件 AI 是看不懂的，必须向量化(Embeddings)一次所谓“向量化”，是一种将文本、图像或其他类型的数据转换为数学向量的过程，让计算机能高效理解各种数据Embeddings：我们选择 “OPENAI Embedding”

5.第五步选择“向量存储器”文档被分割、被向量化后，需要存储在向量存储器中、我们选择一个比较简单的存储器“In-emary Vectar Store”

6.第六步选择 Chains（工作流）Chain（工作流）组件，我们选择“ConversationalRetrieval QA Chain”，这是一个基于文档的问答链

7.第七步链接上述组件组件分为两种：一种是辅助用，加载到某个环节，比如“文件分割器”是加载到“文件处理器”上；一种是有输入+输出端。链接各个组件，如下图：

具体步骤为：① 使用“文档加载器“上传一个 PDF 文件② 使用“文档分割器”进行分割③ 将分割后文档输出到“向量数据库”④ 加载“向量化工具”，将分割后文档向量化后，存入“向量数据库”⑤ “链” 输入 1 对接“向量数据库”

⑥ “链” 输入 2，对接 “语言模型”⑦ “链” 输出为与人沟通的 CHat 界面对接记得点击右上角的“保存“这一步必须设置为访问外网，这样 GPT 的 key 才能链接到GPT的API接口的8.第八步对话

完成第七步后，点击右上角的“Chat”就可以基于 PDF 进行对话了点击右上角的“对话”图标

进入对话的小界面，如下：

可以选择“放大”、"清除聊天记录"举例比如，我选择一个 7 月 19 日发布的《促进民营经济 31 条》PDF 文件，初步沟通如下：

9.第九步分享点击右上角的出现以下分享方式，可以嵌入网页你也可以安装到服务器，方便外网访问。

六、总结Flowise 是一个强大的工具，它可以帮助我们构建工作流和知识库，而且无需编程知识安装和使用 Flowise 都相对简单，只需要按照上述步骤操作即可但 Flowise 还是有以下问题：对中文文档的支持还不是很好，对中文文件的分析不如英文；有一点鸡肋，比如我完全可以使用Claude或者GPT4的插件代替；。

集成GPT3 的 APIkey 明显不如集成 GPT4 APIkey，在 GPT4 的 API key 大规模开放后，应用效果要好一些；不同的组件，对话效果不同，需要反复测试；在本案例中各个环节我们使用了比较简单的组件，所以得到的效果一般。

需要使用人对 longchain 的原理比较熟悉，不然就算是 UI 界面，面对众多组件，还是有点懵逼；类似的软件还有langflow（基于python）功能和Flowise（基于langchain）大同小异；

Flowise更新很快，虽然目前不是很成熟，但是未来可期大家可以保持关注Flowise操作还是比较方便，如果你还没有试过 Flowise，我强烈建议你去试一试，我相信你会喜欢上它的好啦，今天的分享就到这里。

请大家关注、收藏、点赞、分享哦！以便第一时间收到更多更好玩儿的 AI 技巧分享哦「礼包 1」只需在本公众号内回复“AI”，即可免费获得我们为您精心准备的学习大礼包「礼包 2 」如果你想学习 AI 知识，欢迎加入我们的学习群。

请后台发送“入群”或扫描下方二维码进入学习群。

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186