大模型

大型语言模型(LLM)和生成式AI是当前人工智能领域最前沿的技术，正在改变我们与计算机交互的方式。本板块包含多篇实战指南，涵盖本地部署、应用开发、框架使用和OCR技术。

🚀 大模型实战指南

🏠 本地部署与使用

[Ollama详解：本地大模型部署与开发](./Ollama详解，无网环境导入运行本地下载的大模型，无网环境pycharm插件大模型调用、Ollama Python api、coze-studio.md)
- Ollama本地部署指南
- 无网环境大模型导入
- PyCharm插件大模型调用
- Ollama Python API使用
- Coze-Studio集成

📄 OCR与文档解析

[MinerU PDF解析工具：从安装配置到本地部署与API调用的全流程指南](./MinerU PDF解析工具：从安装配置到本地部署与API调用的全流程指南.md)
- MinerU安装与配置
- Pipeline和VLM后端解析
- Docker部署MinerU
- API调用与Python集成
- 输出文件详解（layout、spans、middle.json等）
- flash-attn兼容性问题解决
PaddleOCR全版本完整指南：从入门到精通，全面解析安装部署与高级应用
- PaddleOCR基础入门
- 模型训练与推理
- 高级应用与调优
- 多语言支持
- 实战案例详解
[PaddleOCR-VL高性能部署：基于Blackwell架构GPU与vLLM](./Windows Docker部署PaddleOCR-VL：基于Blackwell架构GPU与vLLM的高性能VLM配置指南.md)
- vLLM架构与PagedAttention算法
- Windows Docker GPU部署
- PaddleOCR-VL 0.9B部署
- Docker Compose服务化部署
- 版面检测与VLM推理配置
- SFT有监督微调完整流程
- 性能调优与问题解决

🧮 框架与生态

[Transformer与Hugging Face生态](./Transformer；Hugging Face之transformers库、datasets库详解；Modelscope.md)
- Transformer架构深入解析
- Hugging Face transformers库详解
- datasets库使用指南
- ModelScope平台介绍

🤖 智能体应用开发

[大模型接入微信公众号与QQ频道](./大模型接入微信公众号、QQ频道_群_个人自动回复（专业领域），智能体（扣子，腾讯元器_QQ开放平台）.md)
- 微信公众号自动回复
- QQ频道/群/个人接入
- 专业领域智能体开发
- 腾讯元器智能体平台

📖 大模型核心技术

大模型技术全景与核心概念解析
- 大模型基础原理
- AI智能体架构
- 核心技术概念
- 应用场景分析

🧠 核心技术栈

🌟 基础架构

Transformer：注意力机制与自回归模型
预训练：大规模语言模型训练方法
微调：LoRA、QLoRA等参数高效微调技术
多模态：图文音视频统一理解

🛠️ 开发工具

Ollama：本地大模型运行框架
Hugging Face：模型库与开发工具
LangChain：LLM应用开发框架
ModelScope：AI模型社区与平台

📄 OCR与文档处理

MinerU：高质量PDF解析工具，支持表格、公式、图片识别
PaddleOCR：飞桨OCR框架，支持多语言、多场景
PaddleOCR-VL：视觉语言模型，支持版面分析与结构化理解
vLLM：高性能LLM推理引擎

🎯 应用场景

智能助手：个性化对话与问答
内容生成：文章、代码、创意设计
知识管理：文档分析与知识图谱
文档处理：PDF解析、OCR识别、版面分析
行业应用：垂直领域专业智能体

大模型时代来临，重新定义人机交互的未来！