大模型
大型语言模型(LLM)和生成式AI是当前人工智能领域最前沿的技术,正在改变我们与计算机交互的方式。本板块包含多篇实战指南,涵盖本地部署、应用开发、框架使用和OCR技术。
🚀 大模型实战指南
🏠 本地部署与使用
- [Ollama详解:本地大模型部署与开发](./Ollama详解,无网环境导入运行本地下载的大模型,无网环境pycharm插件大模型调用、Ollama Python api、coze-studio.md)
- Ollama本地部署指南
- 无网环境大模型导入
- PyCharm插件大模型调用
- Ollama Python API使用
- Coze-Studio集成
📄 OCR与文档解析
[MinerU PDF解析工具:从安装配置到本地部署与API调用的全流程指南](./MinerU PDF解析工具:从安装配置到本地部署与API调用的全流程指南.md)
- MinerU安装与配置
- Pipeline和VLM后端解析
- Docker部署MinerU
- API调用与Python集成
- 输出文件详解(layout、spans、middle.json等)
- flash-attn兼容性问题解决
PaddleOCR全版本完整指南:从入门到精通,全面解析安装部署与高级应用
- PaddleOCR基础入门
- 模型训练与推理
- 高级应用与调优
- 多语言支持
- 实战案例详解
[PaddleOCR-VL高性能部署:基于Blackwell架构GPU与vLLM](./Windows Docker部署PaddleOCR-VL:基于Blackwell架构GPU与vLLM的高性能VLM配置指南.md)
- vLLM架构与PagedAttention算法
- Windows Docker GPU部署
- PaddleOCR-VL 0.9B部署
- Docker Compose服务化部署
- 版面检测与VLM推理配置
- SFT有监督微调完整流程
- 性能调优与问题解决
🧮 框架与生态
- [Transformer与Hugging Face生态](./Transformer;Hugging Face之transformers库、datasets库详解;Modelscope.md)
- Transformer架构深入解析
- Hugging Face transformers库详解
- datasets库使用指南
- ModelScope平台介绍
🤖 智能体应用开发
- [大模型接入微信公众号与QQ频道](./大模型接入微信公众号、QQ频道_群_个人 自动回复(专业领域),智能体(扣子,腾讯元器_QQ开放平台).md)
- 微信公众号自动回复
- QQ频道/群/个人接入
- 专业领域智能体开发
- 腾讯元器智能体平台
📖 大模型核心技术
- 大模型技术全景与核心概念解析
- 大模型基础原理
- AI智能体架构
- 核心技术概念
- 应用场景分析
🧠 核心技术栈
🌟 基础架构
- Transformer:注意力机制与自回归模型
- 预训练:大规模语言模型训练方法
- 微调:LoRA、QLoRA等参数高效微调技术
- 多模态:图文音视频统一理解
🛠️ 开发工具
- Ollama:本地大模型运行框架
- Hugging Face:模型库与开发工具
- LangChain:LLM应用开发框架
- ModelScope:AI模型社区与平台
📄 OCR与文档处理
- MinerU:高质量PDF解析工具,支持表格、公式、图片识别
- PaddleOCR:飞桨OCR框架,支持多语言、多场景
- PaddleOCR-VL:视觉语言模型,支持版面分析与结构化理解
- vLLM:高性能LLM推理引擎
🎯 应用场景
- 智能助手:个性化对话与问答
- 内容生成:文章、代码、创意设计
- 知识管理:文档分析与知识图谱
- 文档处理:PDF解析、OCR识别、版面分析
- 行业应用:垂直领域专业智能体
大模型时代来临,重新定义人机交互的未来!