Posts

大模型训练框架

LLM训练框架模块构建了覆盖全栈的大模型训练生态系统，集成20+专业训练框架和工具。核心框架包括：魔塔ms-swift（支持500+ LLMs和200+ MLLMs的全参数/PEFT训练）、Unsloth（2-5倍加速，80%内存节省）、英伟达Megatron-LM（超大规模transformer训练）、微软DeepSpeed（ZeRO优化器）、ColossalAI（高性能分布式训练）、Meta FairScale、LLaMA-Factory（WebUI界面，支持100+模型）、书生XTuner等。 ...

LLM合集-多模态

LLM合集-多模态 LLM合集-多模态模块构建了涵盖30+个前沿多模态大模型的完整技术生态，专注于视觉-语言、音频-语言等跨模态AI技术的创新应用。该模块系统性地整理了OpenAI GPT-4V、Google Gemini Vision、Anthropic Claude 3、Meta LLaVA系列等国际领先的视觉语言模型，以及阿里通义千问VL、百度文心一言4.0、腾讯混元多模态、字节豆包视觉版、智谱GLM-4V、月之暗面Kimi视觉等国产优秀多模态模型。技术特色涵盖了图像理解、视频分析、音频处理、3D感知等多维度感知能力，详细解析了Vision Transformer、CLIP、DALL-E、Stable Diffusion等核心技术架构，以及视觉编码器、跨模态注意力、多模态融合等关键技术机制。 ...

35 个大多数用户不知道的 Claude Code 命令、技巧与工作流 —— 完整清单

35 个大多数用户不知道的 Claude Code 命令、技巧与工作流 —— 完整清单我已经每天使用 Claude Code 好几个月了。这 35 个技巧让它感觉像作弊码一样。收藏这篇文章 :) 大多数开发者安装了 Claude Code，只用来做基础的代码生成，就以为自己已经见识了它的全部能力。 ...

使用 Claude Code：会话管理与 100 万上下文【译】

使用 Claude Code：会话管理与 100 万上下文【译】今天，我们为 /usage 命令推出了一项全新更新，旨在帮助你更清晰地了解自己在 Claude Code 中的使用情况。这个决定的背后，是我们近期与用户进行的多次深入交流。 ...

从阿西莫夫到Anthropic，万字长文解析AI心理学

一、阿西莫夫的学科阿西莫夫在《基地》里虚构了一门学科叫心理史学。哈里·谢顿用数学方法预测银河帝国的未来。个体不可预测，但把足够多的个体放在一起，行为的统计规律就浮现了。他把「理解心灵」从哲学变成了方程式。 ...

轻松掌握Anthropic官方给的五种"多Agent协作"模式

Anthropic上周发了一篇博文，标题不长，信息量极大。核心观点只有一句话：别上来就选最复杂的架构。从最简单的能跑通的模式开始，看它在哪里卡住，再升级。 ...

Why Your “AI-First” Strategy Is Probably Wrong 为什么你的“AI 优先”策略很可能错了

99% of our production code is written by AI. Last Tuesday, we shipped a new feature at 10 AM, A/B tested it by noon, and killed it by 3 PM because the data said no. We shipped a better version at 5 PM. Three months ago, a cycle like that would have taken six weeks.我们 99%的生产代码都是由 AI 编写的。上周二，我们上午 10 点上线了一个新功能，中午进行了 A/B 测试，下午 3 点因为数据显示效果不佳而下线，下午 5 点上线了更好的版本。三个月前，这样的周期需要六周时间。 ...

达尔文.skill正式发布，一个无限进化的skill系统！

女娲.skill发布一周，GitHub star破了9000+ 前两天接受新京报记者采访的时候，她问我这个skill花了多长时间制作完成的，我有点不好意思的说实际完成初步设计的过程只有2-3小时，但其实在这个过程中经过了无比多轮的迭代，而这个迭代单纯靠我自己完全没能力做到。 ...

达尔文.skill正式发布，一个无限进化的skill系统！

女娲.skill发布一周，GitHub star破了9000+ 前两天接受新京报记者采访的时候，她问我这个skill花了多长时间制作完成的，我有点不好意思的说实际完成初步设计的过程只有2-3小时，但其实在这个过程中经过了无比多轮的迭代，而这个迭代单纯靠我自己完全没能力做到。 ...

为什么你的“AI 优先”策略很可能错了

99% of our production code is written by AI. Last Tuesday, we shipped a new feature at 10 AM, A/B tested it by noon, and killed it by 3 PM because the data said no. We shipped a better version at 5 PM. Three months ago, a cycle like that would have taken six weeks. We didn’t get here by adding Copilot to our IDE. We dismantled our engineering process and rebuilt it around AI. We changed how we plan, build, test, deploy, and organize the team. We changed the role of everyone in the company. ...