使用 Claude Code:会话管理与 100 万 上下文【译】
使用 Claude Code:会话管理与 100 万 上下文【译】 今天,我们为 /usage 命令推出了一项全新更新,旨在帮助你更清晰地了解自己在 Claude Code 中的使用情况。这个决定的背后,是我们近期与用户进行的多次深入交流。 ...
使用 Claude Code:会话管理与 100 万 上下文【译】 今天,我们为 /usage 命令推出了一项全新更新,旨在帮助你更清晰地了解自己在 Claude Code 中的使用情况。这个决定的背后,是我们近期与用户进行的多次深入交流。 ...
一、阿西莫夫的学科 阿西莫夫在《基地》里虚构了一门学科叫心理史学。哈里·谢顿用数学方法预测银河帝国的未来。个体不可预测,但把足够多的个体放在一起,行为的统计规律就浮现了。他把「理解心灵」从哲学变成了方程式。 ...
Anthropic上周发了一篇博文,标题不长,信息量极大。 核心观点只有一句话:别上来就选最复杂的架构。从最简单的能跑通的模式开始,看它在哪里卡住,再升级。 ...
99% of our production code is written by AI. Last Tuesday, we shipped a new feature at 10 AM, A/B tested it by noon, and killed it by 3 PM because the data said no. We shipped a better version at 5 PM. Three months ago, a cycle like that would have taken six weeks.我们 99%的生产代码都是由 AI 编写的。上周二,我们上午 10 点上线了一个新功能,中午进行了 A/B 测试,下午 3 点因为数据显示效果不佳而下线,下午 5 点上线了更好的版本。三个月前,这样的周期需要六周时间。 ...
女娲.skill发布一周,GitHub star破了9000+ 前两天接受新京报记者采访的时候,她问我这个skill花了多长时间制作完成的,我有点不好意思的说实际完成初步设计的过程只有2-3小时,但其实在这个过程中经过了无比多轮的迭代,而这个迭代单纯靠我自己完全没能力做到。 ...
99% of our production code is written by AI. Last Tuesday, we shipped a new feature at 10 AM, A/B tested it by noon, and killed it by 3 PM because the data said no. We shipped a better version at 5 PM. Three months ago, a cycle like that would have taken six weeks. We didn’t get here by adding Copilot to our IDE. We dismantled our engineering process and rebuilt it around AI. We changed how we plan, build, test, deploy, and organize the team. We changed the role of everyone in the company. ...
你的第二大脑死过几次了? 我死过三次 第一次搭的时候特认真。标签打好,结构理清,交叉链接也做了 两个月后标签过时了没人改,断链了没人修。新笔记往里一扔就不管了 ...
原文来源:@linyishan 一天时间,Google 的开源大模型 Gemma-4-31B 就被彻底破解,被完全移除安全限制。 没错,大模型也可以破解,也叫作越狱。 对开源大语言模型进行越狱,在技术社区中通常被称为 Abliteration(消融法)或权重对齐抹除。 ...
太长也要读 在写完《你不知道的 Claude Code:架构、治理与工程实践》、《你不知道的 Agent:原理、架构与工程实践》后,我想着继续来写第三篇,这次打算挑战下自己来梳理一下大模型训练到底怎么回事,这篇文章争取让非专业背景的人也能读得懂。 ...
RAG 消失之路 总结 新结构 M-FLOW 倒锥图路由 免嵌入 Embedding Free 文件检索 树状推理 PageIndex 无检索 【2026-2-27】阿里 Sirchmunk 结束 rag 终会消失 RAG 每个环节都藏着工程”暗伤”: 切片策略是玄学:按段落切?按 Token 数切?重叠多少?切片粒度直接影响检索质量,却没有银弹。 Embedding 是黑盒:换个 Embedding 模型,检索效果可能天差地别。而且向量只是原文的一个”有损压缩”,信息必然丢失。 索引更新是噩梦:文档改一行,可能需要重新切片、重新 Embedding、重新写入。实时性?基本别想。 基础设施是成本:Milvus、Qdrant、Pinecone……光是向量数据库的选型、部署、运维就能消耗大量精力。 详见站内专题: 大模型应用技术之RAG,检索增强生成 ...