深度解析大语言模型 LLM 原理
说明:原文作者royceshao,发布于公众号腾讯技术工程,本文为 Ringi Lee 归纳整理。 ...
说明:原文作者royceshao,发布于公众号腾讯技术工程,本文为 Ringi Lee 归纳整理。 ...
早上打开 Claude Code,敲第一句话,2%~10% 的套餐额度没了。午休回来继续干活,又一句话,10% 的额度蒸发。你有没有想过,这 token 到底花在哪了?我带着这个疑问,在本地用 Gemma4 跑小模型做实验——发现同一段对话,有些轮次要等 30 秒,有些只要 0.2 秒。为了搞清楚为什么,我会从 Transformer 的注意力机制开始讲,再到 Claude Code 的代码实现, Anthropic 在缓存上做了一整套精密工程。理解了这套机制,你就知道怎么让同样的套餐多撑 3-5 倍。 ...
本文档初衷:尝试用各种最新AI模型及工具,去实践各种小问题的解决,开源提示词及解决思路。欢迎收藏,并观摩100套提示词从0到1的逐步撰写过程。 ...
本文来源:https://x.com/servasyy_ai/status/2039138111566020867 作者:huangserva ...
TLDR:Claude Code 的 1902 个源文件意外泄露。我翻完之后发现,这是一份关于「harness engineering」的绝佳教材。Claude Code 好用,60% 靠 Opus 模型本身的能力,40% 靠围绕模型搭建的工程系统(也就是 harness)。这个 harness 包括:一套精心拼装的 system prompt、一个用第二 AI 做安全审查的四层权限系统、一个只记偏好不记代码的记忆系统、一套 9 段式结构化上下文压缩、以及一个像真实公司一样运转的多 Agent 协作框架。对于每个用 AI 的人来说,这些设计思路都可以直接借鉴。 ...
原文来源:dashen_wang 一、那条消息让我愣了整整三秒 29号,我和小伙伴在深圳搞活动。 活动结束之后,我想顺道拜访一个多年没见的老朋友,发消息过去。 他回:在三亚。 我问:度假? 他说:带孩子。 我盯着手机屏幕,愣了整整三秒。 ...
原文来源:Berryxia.AI 在 AI 辅助编程领域,一个流传已久的观点是:Codex(OpenAI 代码专用模型系列,现以 GPT-5.x Codex 为代表)深受传统程序员喜爱,尤其在修复 Bug 和生产级重构场景; ...
0. 太长不读 今天这篇文章源于最近半年深度使用 Claude Code、两个账号每月 40 刀氪金换来的一些踩坑经验,希望能给大伙一些输入。 刚开始我也把它当 ChatBot 用,后来很快发现不对劲:上下文越来越乱、工具越来越多但效果越来越差、规则越写越长却越不遵守,折腾了一段时间,研究了 Claude Code 本身之后才意识到,这不是 Prompt 问题,而是这套系统的设计就是这样的。 ...
OpenClaw 从 0 到 1:40 天实战与提示词指南 我唯一做的事,就是跟它们说话。 不是调prompt,不是换模型,不是重构架构。就是说话,给反馈,看着它们把内容记下来。 ...
适用人群: AI 工具爱好者、效率提升追求者、开发者、创业者 核心定位:可落地、全场景、超详细的 OpenClaw 实操指南 使用建议:建议电脑端打开学习,如果需要快速定位到精确内容,可以使用快捷键 Ctrl +F/Command +F 的形式,搜索关键字/词,查找你想要的内容。 ...