基于 Ollama 与 AnythingLLM 搭建本地 RAG 知识库实践

笔者在日常处理提数等需求时，常会遇到逻辑重复开发的问题。为提升开发效率，近期开始将各类需求处理的 SQL 在 GitLab 中创建项目进行存档维护。希望后续开发时便通过本地 IDEA 快速检索、直接复用，提升效率。

在此基础上，笔者有了进一步思考，为何不依托本地 LLM，结合已有 SQL 作为知识库，搭建一套本地 SQL 问答助手。基于此，进一步的实现开发的提效。

基于此，搭建了本地 Ollama + AnythingLLM 来进行一次实践探索。

RAG（Retrieval-Augmented Generation）是一种结合检索和生成的技术，通过先从外部知识库中检索相关信息，再由大语言模型生成回答，从而提升准确性和实用性。

Ollama

安装： https://ollama.com/download

可用模型清单： https://ollama.com/search

分类	操作	命令示例	说明
🟢 模型管理	启动 ollama 服务	`ollama serve`
	创建自定义模型	`ollama create my-model -f ./Modelfile`	通过 Modelfile 构建个性化模型
	查看模型信息	`ollama show qwen3:8b`	查看模型构建与配置详情
	启动模型并进入交互模式	`ollama run qwen3:8b`
	停止运行中的模型	`ollama stop qwen3:8b`
	下载指定模型	`ollama pull qwen3:8b`
	推送指定的模型到仓库	`ollama pull my-model`	推送到仓库的模型会在ollama官网个人仓库中出现
	显示已安装模型列表	`ollama list`
	列出正在运行的模型	`ollama ps`
	模型拷贝	`ollama cp qwen3:4b qwen3:888b`
	删除本地模型	`ollama rm qwen3:888b`
🌐 API 调用	文本生成接口调用	`curl http://localhost:11434/api/generate -d '{"model": "llama2", "prompt": "你好"}'`	使用本地 REST API 生成文本
📎 其他	查看版本	`ollama --version`	查看当前 Ollama 版本
	查看帮助	`ollama help`	获取全部命令帮助信息