Skip to content

大模型

大型语言模型(LLM)和生成式AI是当前人工智能领域最前沿的技术,正在改变我们与计算机交互的方式。本板块包含多篇实战指南,涵盖本地部署、应用开发、框架使用和OCR技术。

🚀 大模型实战指南

🏠 本地部署与使用

  • [Ollama详解:本地大模型部署与开发](./Ollama详解,无网环境导入运行本地下载的大模型,无网环境pycharm插件大模型调用、Ollama Python api、coze-studio.md)
    • Ollama本地部署指南
    • 无网环境大模型导入
    • PyCharm插件大模型调用
    • Ollama Python API使用
    • Coze-Studio集成

📄 OCR与文档解析

  • [MinerU PDF解析工具:从安装配置到本地部署与API调用的全流程指南](./MinerU PDF解析工具:从安装配置到本地部署与API调用的全流程指南.md)

    • MinerU安装与配置
    • Pipeline和VLM后端解析
    • Docker部署MinerU
    • API调用与Python集成
    • 输出文件详解(layout、spans、middle.json等)
    • flash-attn兼容性问题解决
  • PaddleOCR全版本完整指南:从入门到精通,全面解析安装部署与高级应用

    • PaddleOCR基础入门
    • 模型训练与推理
    • 高级应用与调优
    • 多语言支持
    • 实战案例详解
  • [PaddleOCR-VL高性能部署:基于Blackwell架构GPU与vLLM](./Windows Docker部署PaddleOCR-VL:基于Blackwell架构GPU与vLLM的高性能VLM配置指南.md)

    • vLLM架构与PagedAttention算法
    • Windows Docker GPU部署
    • PaddleOCR-VL 0.9B部署
    • Docker Compose服务化部署
    • 版面检测与VLM推理配置
    • SFT有监督微调完整流程
    • 性能调优与问题解决

🧮 框架与生态

  • [Transformer与Hugging Face生态](./Transformer;Hugging Face之transformers库、datasets库详解;Modelscope.md)
    • Transformer架构深入解析
    • Hugging Face transformers库详解
    • datasets库使用指南
    • ModelScope平台介绍

🤖 智能体应用开发

  • [大模型接入微信公众号与QQ频道](./大模型接入微信公众号、QQ频道_群_个人 自动回复(专业领域),智能体(扣子,腾讯元器_QQ开放平台).md)
    • 微信公众号自动回复
    • QQ频道/群/个人接入
    • 专业领域智能体开发
    • 腾讯元器智能体平台

📖 大模型核心技术

🧠 核心技术栈

🌟 基础架构

  • Transformer:注意力机制与自回归模型
  • 预训练:大规模语言模型训练方法
  • 微调:LoRA、QLoRA等参数高效微调技术
  • 多模态:图文音视频统一理解

🛠️ 开发工具

  • Ollama:本地大模型运行框架
  • Hugging Face:模型库与开发工具
  • LangChain:LLM应用开发框架
  • ModelScope:AI模型社区与平台

📄 OCR与文档处理

  • MinerU:高质量PDF解析工具,支持表格、公式、图片识别
  • PaddleOCR:飞桨OCR框架,支持多语言、多场景
  • PaddleOCR-VL:视觉语言模型,支持版面分析与结构化理解
  • vLLM:高性能LLM推理引擎

🎯 应用场景

  • 智能助手:个性化对话与问答
  • 内容生成:文章、代码、创意设计
  • 知识管理:文档分析与知识图谱
  • 文档处理:PDF解析、OCR识别、版面分析
  • 行业应用:垂直领域专业智能体

大模型时代来临,重新定义人机交互的未来!

Released under the MIT License.