AI编程工具实战心得:Cursor与Augment
作为一名一线运维开发,我在过去最近一直在深度使用了多款AI编程工具。今天想分享一下Cursor和Augment两款工具的实际使用体验,以及对AI编程在运维开发领域的一些思考。 工具对比:Cursor vs Augment 基本信息对比 对比维度CursorAugment工具类型AI编程IDE(基于VSCode)AI编程平台+VSCode插件基础架构…
告别OOM!这款开源神器,如何为你精准预测AI模型显存?
对于每一位在 AI 浪潮中驰骋的开发者而言,CUDA out of memory 这个错误信息无疑是最令人沮丧的“拦路虎”之一。在 Cloud Studio 这样高效的云端开发环境中,我们追求的是极致的开发效率和资源利用率。然而,一个配置不当的训练任务,不仅可能导致数小时的工作付诸东流,还会造成宝贵的 GPU 算力浪费。 “我的模型到底需要多大显存…
RAG高效召回策略:提升召回质量的关键方法
RAG(Retrieval-Augmented Generation,检索增强生成)系统的性能高度依赖于其召回阶段的质量。高效的召回能力能够确保大语言模型(LLM)获取到最相关、最准确的上下文信息,从而生成高质量的回答。本部分将深入探讨提升RAG召回质量的多种核心策略。 1. 合理设置TOP_K值 在向量检索中,TOP_K参数用于指定召回结果的数量…
RAFT 方法微调 RAG 模型
论文: RAFT: Adapting Language Model to Domain Specific RAG, 2024链接: https://arxiv.org/pdf/2403.10131 核心思想:如何最好地准备考试? 传统方法的局限性 基于微调的方法:通过"学习"来实现"记忆"输入文档或回答练习题而不参考文档 基于上下文检索的方法:未能…
RAG流程与优化
随着大语言模型技术的快速发展,检索增强生成(RAG)系统已成为企业智能化转型的重要技术路径。本文将详细阐述RAG系统从概念验证到生产环境部署的完整实施流程,为企业提供切实可行的落地方案。 1. 数据集准备与语料构建 RAG系统的基础在于高质量的数据集准备,这一阶段决定了整个系统的知识覆盖面和准确性。 文档结构化处理 采用现代智能文档处理技术,对各类…
n8n 汉化版部署
n8n 是一款强大的开源自动化工作流工具,支持通过可视化界面创建复杂的工作流,广泛用于数据处理、API 集成和任务自动化。本文介绍如何通过 Docker 或 Docker Compose 部署 n8n 汉化版(默认中文界面),并通过自定义参数实现数据持久化、解除访问限制等优化,适合开发测试和生产环境。 发布日期:2025年6月12日 | 作者:Ka…
GPU与CPU流程原理
一、CPU与GPU的区别 (一)设计目标 CPU设计用于通用计算任务,擅长处理复杂的逻辑运算和少量数据的快速处理。它的核心数量较少,但每个核心的性能非常强大。例如,在运行操作系统、处理文本、图形和执行各种应用程序时,CPU能够凭借其强大的单核性能和通用性,高效地完成任务。而GPU设计用于并行计算任务,擅长处理大量简单任务的并发执行。它的核心数量非常…
5090 用vLLM部署 deepseek-r1-0528-qwen-8b
由于 NVIDIA RTX 5090 是基于 Blackwell 架构的新一代显卡,其驱动和 PyTorch 版本要求与 vLLM 的官方 Docker 镜像不完全兼容,直接拉取 vLLM 代码手动编译耗时长且易因资源不足导致 OOM(内存溢出)。本文介绍如何使用 NVIDIA 官方提供的 vLLM 镜像(nvcr.io/nvidia/triton…
Hami 部署指南(基于 Rocky Linux)
本指南详细说明在 Rocky Linux 上部署 Hami 的步骤,包括 Kubernetes 环境准备、NVIDIA 驱动安装、Hami 部署、Kuboard-Prometheus 配置以及 Hami Web UI 部署和问题排查。 1. 准备 Kubernetes 和 Kuboard 安装并配置 Kubernetes 集群。 部署 Kuboar…
部署 NVIDIA 5090 驱动和环境准备
1. 确认基础条件 确保 CPU 和主板支持虚拟化和 IOMMU: Intel:VT-d AMD:AMD-Vi BIOS 设置 在 BIOS 中启用以下选项: Intel:VT-d AMD:SVM 和 IOMMU 2. 启用 IOMMU 编辑 GRUB 配置文件: nano /etc/default/grub 找到以下行: GRUB_CMDLINE…