AI | Ringi's Log

深度解析大语言模型 LLM 原理

说明：原文作者royceshao，发布于公众号腾讯技术工程，本文为 Ringi Lee 归纳整理。 ...

搞懂缓存机制，从Gemma4到Claude Code省80%Token

早上打开 Claude Code，敲第一句话，2%～10% 的套餐额度没了。午休回来继续干活，又一句话，10% 的额度蒸发。你有没有想过，这 token 到底花在哪了？我带着这个疑问，在本地用 Gemma4 跑小模型做实验——发现同一段对话，有些轮次要等 30 秒，有些只要 0.2 秒。为了搞清楚为什么，我会从 Transformer 的注意力机制开始讲，再到 Claude Code 的代码实现， Anthropic 在缓存上做了一整套精密工程。理解了这套机制，你就知道怎么让同样的套餐多撑 3-5 倍。 ...

姚金刚提示词合集

本文档初衷：尝试用各种最新AI模型及工具，去实践各种小问题的解决，开源提示词及解决思路。欢迎收藏，并观摩100套提示词从0到1的逐步撰写过程。 ...

Claude Code CLI 源码分析：从 Prompt 架构到工业级 AI Agent

本文来源：https://x.com/servasyy_ai/status/2039138111566020867 作者：huangserva ...

祝贺Claude Code成功越狱，获得永生

TLDR：Claude Code 的 1902 个源文件意外泄露。我翻完之后发现，这是一份关于「harness engineering」的绝佳教材。Claude Code 好用，60% 靠 Opus 模型本身的能力，40% 靠围绕模型搭建的工程系统（也就是 harness）。这个 harness 包括：一套精心拼装的 system prompt、一个用第二 AI 做安全审查的四层权限系统、一个只记偏好不记代码的记忆系统、一套 9 段式结构化上下文压缩、以及一个像真实公司一样运转的多 Agent 协作框架。对于每个用 AI 的人来说，这些设计思路都可以直接借鉴。 ...

穷人没教育，寒门无贵子

原文来源：dashen_wang 一、那条消息让我愣了整整三秒 29号，我和小伙伴在深圳搞活动。活动结束之后，我想顺道拜访一个多年没见的老朋友，发消息过去。他回：在三亚。我问：度假？他说：带孩子。我盯着手机屏幕，愣了整整三秒。 ...

为什么程序员钟爱Codex，Vibe Coding的人却离不开Claude？一文弄懂它！

原文来源：Berryxia.AI 在 AI 辅助编程领域，一个流传已久的观点是：Codex（OpenAI 代码专用模型系列，现以 GPT-5.x Codex 为代表）深受传统程序员喜爱，尤其在修复 Bug 和生产级重构场景； ...

你不知道的 Claude Code：架构、治理与工程实践

0. 太长不读今天这篇文章源于最近半年深度使用 Claude Code、两个账号每月 40 刀氪金换来的一些踩坑经验，希望能给大伙一些输入。刚开始我也把它当 ChatBot 用，后来很快发现不对劲：上下文越来越乱、工具越来越多但效果越来越差、规则越写越长却越不遵守，折腾了一段时间，研究了 Claude Code 本身之后才意识到，这不是 Prompt 问题，而是这套系统的设计就是这样的。 ...

OpenClaw 从 0 到 1：40 天实战与提示词指南

OpenClaw 从 0 到 1：40 天实战与提示词指南我唯一做的事，就是跟它们说话。不是调prompt，不是换模型，不是重构架构。就是说话，给反馈，看着它们把内容记下来。 ...

OpenClaw 学习手册（全网首发&持续更新中）

适用人群： AI 工具爱好者、效率提升追求者、开发者、创业者核心定位：可落地、全场景、超详细的 OpenClaw 实操指南使用建议：建议电脑端打开学习，如果需要快速定位到精确内容，可以使用快捷键 Ctrl +F/Command +F 的形式，搜索关键字/词，查找你想要的内容。 ...