AI分布式训

AI分布式训训练库 常见框架 常见分布式训练框架: 第一类:深度学习框架自带分布式训练功能。如:TensorFlow、PyTorch、MindSpore、Oneflow、PaddlePaddle等。 第二类:基于现有深度学习框架(如:PyTorch、Flax)进行扩展和优化,从而进行分布式训练。 如:Megatron-LM(张量并行)、DeepSpeed(Zero-DP)、Colossal-AI(高维模型并行,如2D、2.5D、3D)、Alpa(自动并行)等 LLM 训练/微调工具 ...

December 05, 2025 · 60 min · 29560 words · Ringi Lee

Let's Code material

Let’s Code material Introduction Welcome to your ultimate collection of free placement preparation materials for cracking technical interviews and succeeding in both on-campus and off-campus placements. These resources are carefully curated and regularly updated to help you prepare efficiently. Complete Resource Collection 1. Data Structures and Algorithms (C, C++, Java, Python) Comprehensive collection of DSA notes, coding problems, and frequently asked interview questions. 📁 Access DSA Resources Java programming course ...

December 04, 2025 · 2 min · 304 words · Ringi Lee

文档问答RAG长文本

文档问答RAG长文本 问题 长文本创作的本质是多轮对话 传统AI写作模型,如基于Transformer的GPT系列,虽然在短文本生成方面表现出色,但在处理长文本时,往往会遇到“上下文遗忘”的问题,导致文章前后逻辑不一致,主题偏移。 ...

December 04, 2025 · 20 min · 10005 words · Ringi Lee

Agent智能体应用

Agent智能体应用 GUI Agent 【2024-1-25】这几天agent操控设备成为热点: 智谱昨天推出 glm-pc 1.1,注重长程推理,与年前的autoglm互补,分别占据pc和mobile设备 智谱agent手机端 AutoGLM GLM-PC openai 的 operator 也涉足pc操控 GUI Agent 介绍 Huawei London 邵坤主题演讲,介绍面向通用型 GUI Agent 的模型和优化。 ...

December 04, 2025 · 50 min · 24965 words · Ringi Lee

人工智能学习资料

人工智能学习资料 人工智能书籍 Github/编辑 名词解释 解释(代码引用示例之一) select * from table where a=3 limit 10; 备注信息: Git简易指南,图说Git,git文件状态和工作区域 【2018-7-24】Git交互式在线学习,最好的实战教程,图例: github官方markdown指南 github readme语法简介,【2018-6-10】github page jeklly主题,【2019-04-29】Jeklly主题大全 MarkDown语法笔记(完整版) 马克飞象markdown语法在线测试 Latex在线调试 Markdown如何插入目录 【2019-03-17】富文本转markdown在线编辑器,Markdown在线编辑器 流程图: (代码引用示例之二) ...

December 04, 2025 · 54 min · 26660 words · Ringi Lee

智能体应用GUI

智能体应用GUI GUI Agent 【2024-1-25】这几天agent操控设备成为热点: 智谱昨天推出 glm-pc 1.1,注重长程推理,与年前的autoglm互补,分别占据pc和mobile设备 智谱agent手机端 AutoGLM GLM-PC openai 的 operator 也涉足pc操控 GUI Agent 介绍 Huawei London 邵坤主题演讲,介绍面向通用型 GUI Agent 的模型和优化。 ...

December 01, 2025 · 50 min · 24963 words · Ringi Lee

Prompt上下文工程

Prompt上下文工程 发展 2022年, 大家谈论“提示词工程”(Prompt Engineering),解决单次交互。 2024年, 谈 “上下文工程”(Context Engineering),解决Agent(智能体)的长序列、多轮工具调用。 ...

November 25, 2025 · 24 min · 11546 words · Ringi Lee

大模型自动评估

大模型自动评估 LLM-as-a-Judge 思考 LLM-as-a-Judge 真的管用吗? 【2025-8-6】说话人难以识别 大模型从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 ...

November 11, 2025 · 21 min · 10484 words · Ringi Lee

LLM 发展方向

LLM 发展方向 【2023-6-16】知乎专题:大模型LLM领域,有哪些可以作为学术研究方向? 模型层: GPT系列,多模态系列,视觉类SAM:原生的工具调用能力; 安全性:加密,可信任,联邦学习; 新模型,新范式:长文本建模,不需要RLHF等; 涌现问题的研究、黑盒的研究; 并行、运算、显存的优化。EL-Attention,ZeRo,剪枝部署,蒸馏压缩。 接口层: 私有化部署; Adapter,prefix,Lora; Fusing。 应用层: Visual ChatGPT,HuggingGPT,AutoGPT,LangChain; Prompt工程,向量库,dense retrieval; 自我纠错,自我迭代,chain of thought 加强; 评测数据集、新时代下的新任务,generatice agents等 假设已经有 GPT-3.5 基础模型,一千张卡,思考能做什么?然后用小模型,比如LLaMa 7B去验证,如果成功,再慢慢加大到13B,30B,画出一条上升的曲线;不一定要scale到最大的模型,只要自己的结论能划出一条上升的曲线,那么这条曲线就可外推到更大。 ...

November 05, 2025 · 48 min · 24019 words · Ringi Lee

AI大模型应用搜索

AI大模型应用搜索 大模型搜索 【2025-5-10】图灵奖得主、Meta首席AI科学家杨立昆近日在Flatiron Institute 演讲中表示 AI系统今后将基本上通过推理进行搜索,而不是让多层神经网络来预测tokens 2025年5月27日,蚂蚁开源在第⼗届技术⽇上,重磅发布了《2025 ⼤模型开源开发⽣态全景与趋势》报告 ...

November 05, 2025 · 30 min · 14975 words · Ringi Lee