Posts

如何将 Claude Code 成本降低 3 倍（Karpathy 的上下文工程原则）

一个开源工具如何将 Claude Code 会话成本降低 3 倍——无需修改 CLAUDE.md、提示词或模型（附设置指南及原理分析）。 MCPMark V2 基准测试揭示了一个违反直觉的现象。 ...

为什么需要智能AI开发工作流程

核心价值主张：本方案通过整合 OpenSpec（规范驱动框架）、Superpowers（AI工程工作流系统）和 Claude Code（AI编程助手），构建了一套完整的智能AI开发工作流程。该流程将传统以天/周为单位的开发周期缩短至分钟/小时级别，实现52倍的效率提升，同时通过强制工程纪律和自动化质量门禁，将代码测试覆盖率提升至95%以上，Bug数量减少85%。方案基于2026年最新技术发展和实践案例，为一线程序员、技术管理者和架构师提供从理论到实践的完整实施路径。 ...

Awesome Machine Learning and AI Courses

A curated list of awesome, free machine learning and artificial intelligence courses with video lectures. All courses are available as high-quality video lectures by some of the best AI researchers and teachers on this planet. Besides the video lectures, I linked course websites with lecture notes, additional readings and assignments. Introductory Lectures These are great courses to get started in machine learning and AI. No prior experience in ML and AI is needed. You should have some knowledge of linear algebra, introductory calculus and probability. Some programming experience is also recommended. ...

2026 年顶尖 AI 实验室如何构建 RL 智能体（Karpathy 的系统提示学习思想）

Anthropic、OpenAI 和 DeepSeek 正在围绕同一个核心思想趋同：用系统提示作为奖励函数。本文完整解析从 RLHF 到 RULER 的强化学习进化之路，附带代码。强化学习的核心非常直接：系统采取行动，环境给予奖励，智能体随时间更新行为以最大化该奖励。 ...

YouMind 创业路上的非共识选择

YouMind 创业路上的非共识选择上周末，我在「产品力领航者大会」上做了一场分享，没有包装过的宏伟叙事，也没有精心设计的金句轰炸。只用大白话，讲了自己从大厂出来两年间的真实思考。以下是整理稿。 ...

Agent

Agent+WorkFlow Agent模块构建了涵盖25+个前沿框架的智能体技术生态，专注于自主决策、工具调用和任务执行的AI智能体系统。该模块系统性地整理了AutoGPT自主AI智能体、LangGraph状态机智能体、CrewAI协作智能体框架、Microsoft AutoGen多智能体对话、MetaGPT多智能体软件公司等核心技术栈，以及AgentGPT浏览器智能体、BabyAGI任务驱动智能体、SuperAGI开源智能体平台等创新解决方案。 ...

DeepSearch深度搜索

DeepSearch模块构建了涵盖前沿平台的深度搜索技术生态，致力于超越传统关键词匹配的智能信息检索革命。该模块整合了阿里ZeroSearch无搜索LLM能力增强、字节DeerFlow智能搜索引擎、书生浦源MindSearch多智能体搜索框架等核心技术，以及腾讯IMA.copilot智能工作台等企业级解决方案。技术栈包含了JinaAI node-DeepResearch持续推理搜索、SurfSense开源知识管理助手、Firesearch多模态爬虫、Morphik-Core多模态RAG等专业组件，覆盖了从基础检索到复杂推理的全链路需求。 ...

RLHF人类反馈强化学习技术栈

RLHF模块构建了完整的人类反馈强化学习技术栈，集成前沿的偏好优化和人类对齐框架。核心框架包括：Huggingface TRL（Transformer强化学习标准库，PPO训练详解）、OpenRLHF（易用可扩展RLHF框架，支持70B+ PPO全量微调、迭代DPO、LoRA和RingAttention）、字节veRL（火山引擎强化学习框架，工业级部署）、EasyR1（基于veRL的高效多模态RL训练框架）。 ...

llm-模型评估

LLM评估框架模块建立了多维度、全覆盖的大模型评估生态系统，涵盖通用能力测评、RAG系统评估和隐私安全检测。权威评测平台：CLiB中文大模型榜单（128个模型全覆盖，包含ChatGPT、GPT-4o、Gemini、文心一言、通义千问等商用模型，以及Qwen2.5、Llama3.1、GLM4、InternLM2.5等开源模型）、OpenCompass司南（全方位能力评估）、魔塔EvalScope（流水线式评测框架）。 ...

LLM训练推理加速框架+部署

LLM推理框架+部署模块打造了全方位的大模型推理加速与部署生态，整合21+高性能推理引擎和部署平台。顶级加速框架：vLLM伯克利（业界标杆）、SGLang（超越TensorRT-LLM性能）、LMDeploy书生（工业级部署）、DeepSpeed-MII（微软推理优化）等。便捷部署工具：Ollama（本地模型管理）、LM Studio（图形化界面）、FastChat+vLLM（分布式服务）、Xinference（多模型统一接口）、OpenLLM（云端部署）等。API网关服务：LiteLLM（100+ LLM APIs统一格式）、One-API（接口管理分发）、Xi-API等。托管平台包括Together AI、Replicate、SiliconFlow硅基流动等。配套Huggingface Accelerate、llama-cpp-python等底层加速库，以及Jan.ai、LocalAI、text-generation-webui等用户友好界面，实现从本地部署到云端服务的全场景覆盖。 ...