通过上一篇我们完成了使用ollama软件部署本地DeepSeek的任务,接下来就需要继续我们构建知识库环境的任务了
有关DeepSeek本地安装的详细内容请戳--> https://linshu.site/deepseek本地部署一/
一、Docker的安装
在此不多于说明Docker的安装过程详情请看 https://linshu.site/docker的安装/
我们需要通过Docker来直接运行我们的知识库构建软件,即RAGflow
二、RAGflow
RAGflow 是一个基于检索增强生成(RAG)技术的智能文档处理平台,由深度求索(DeepSeek)公司开发。它结合了深度学习、自然语言处理(NLP)和光学字符识别(OCR)等技术,旨在帮助企业高效处理和分析大量文档数据。
主要功能
- 文档解析与提取:支持多种格式(PDF、Word、Excel等),提取文本、表格、图像等内容。
- 智能检索:通过语义理解,快速定位文档中的关键信息。
- 知识问答:基于RAG技术,提供精准的问答服务,帮助用户从文档中获取所需信息。
- 自动化处理:支持文档分类、去重、标准化等自动化操作,减少人工干预。
- 多语言支持:适用于多语言文档的处理和分析。
应用场景
- 金融:合同审查、财报分析等。
- 法律:法律文书检索、案例分析等。
- 医疗:病历管理、医学文献分析等。
- 企业:内部文档管理、知识库构建等。
优势
- 高效准确:结合RAG技术,提升信息检索和生成的准确性。
- 灵活扩展:支持定制化需求,适应不同行业场景。
- 安全可靠:提供数据加密和权限管理,确保数据安全。
总结
RAGflow 是一个强大的文档处理工具,适用于需要高效处理和分析大量文档的企业,能够显著提升工作效率和信息处理能力。
三、RAGflow的安装使用
1.RAGflow下载
这里我们通过访问RAGflow的GitHub地址https://github.com/infiniflow/ragflow 来了解和获取相关信息
这里需要涉及git软件的安装及使用,此处不多余介绍相关内容,但附上下载网址https://git-scm.com/downloads
当我们电脑上有git后,我们的右键就会有git的命令行选项
选择一个相对空闲的文件夹,右键选择第二个git选项(第一个也行,此处第一个为git的ui界面,但是个人不习惯使用,所以选择了第二个,第二个是git的命令行窗口),运行下图中的克隆命令,将RAGflow的全部内容拉取(下载)到本地
命令如图,即git clone https://github.com/infiniflow/ragflow.git
2.RAGflow设置
通过GitHub里的描述可以看到无slim后缀的版本是有嵌入推理模型的,即embedding模型,这也是管理和构建知识库的模型,但是拉取下来的软件默认是slim版本,需要我们手动去设置一下环境,将该版本切换为无后缀的版本
这里我的中文是网页翻译的,大家自己也可以进行设置
接下来我们正式进入设置
1.找到拉取(下载)的RAGflow文件下的docker目录,如
E:ragflowdocker
,这是我的文件目录路径,大家的路径是自己设置的,然后找到里面的.env
文件,如果没有,请检查自己的资源管理器里面查看设置,勾选文件扩展名,隐藏的项目等选项,就可以找到该文件
2.通过记事本或编程软件打开该文件,找到图示字段
3.将内容带slim后缀的语句前面加#
号进行注释掉,把无该后缀的位于稍后的形似语句前的#
删掉,然后进行保存
3.运行RAGflow
1)运行Docker:在运行RAGflow前一定保证Docker软件在运行状态
2)运行RAGflow:打开浏览器,在网址输入框输入localhost:80
,回车后如果弹出如下页面,则说明RAGflow部署完成并成功运行
3)注册登录:第一次进入需要注册,注册的该用户默认为管理员权限
四、知识库构建
接下来我们就可以进行知识库的构建以及为我们的RAGflow接入本地部署的DeepSeek大模型了