AI | Ringi's Log

AI分布式训

AI分布式训训练库常见框架常见分布式训练框架：第一类：深度学习框架自带分布式训练功能。如：TensorFlow、PyTorch、MindSpore、Oneflow、PaddlePaddle等。第二类：基于现有深度学习框架（如：PyTorch、Flax）进行扩展和优化，从而进行分布式训练。如：Megatron-LM（张量并行）、DeepSpeed（Zero-DP）、Colossal-AI（高维模型并行，如2D、2.5D、3D）、Alpa（自动并行）等 LLM 训练/微调工具 ...

Let's Code material

Let’s Code material Introduction Welcome to your ultimate collection of free placement preparation materials for cracking technical interviews and succeeding in both on-campus and off-campus placements. These resources are carefully curated and regularly updated to help you prepare efficiently. Complete Resource Collection 1. Data Structures and Algorithms (C, C++, Java, Python) Comprehensive collection of DSA notes, coding problems, and frequently asked interview questions. 📁 Access DSA Resources Java programming course ...

文档问答RAG长文本

文档问答RAG长文本问题长文本创作的本质是多轮对话传统AI写作模型，如基于Transformer的GPT系列，虽然在短文本生成方面表现出色，但在处理长文本时，往往会遇到“上下文遗忘”的问题，导致文章前后逻辑不一致，主题偏移。 ...

Agent智能体应用

Agent智能体应用 GUI Agent 【2024-1-25】这几天agent操控设备成为热点：智谱昨天推出 glm-pc 1.1，注重长程推理，与年前的autoglm互补，分别占据pc和mobile设备智谱agent手机端 AutoGLM GLM-PC openai 的 operator 也涉足pc操控 GUI Agent 介绍 Huawei London 邵坤主题演讲，介绍面向通用型 GUI Agent 的模型和优化。 ...

人工智能学习资料

人工智能学习资料人工智能书籍 Github/编辑名词解释解释(代码引用示例之一) select * from table where a=3 limit 10; 备注信息： Git简易指南,图说Git,git文件状态和工作区域【2018-7-24】Git交互式在线学习，最好的实战教程，图例： github官方markdown指南 github readme语法简介，【2018-6-10】github page jeklly主题，【2019-04-29】Jeklly主题大全 MarkDown语法笔记（完整版）马克飞象markdown语法在线测试 Latex在线调试 Markdown如何插入目录【2019-03-17】富文本转markdown在线编辑器，Markdown在线编辑器流程图： (代码引用示例之二) ...

智能体应用GUI

智能体应用GUI GUI Agent 【2024-1-25】这几天agent操控设备成为热点：智谱昨天推出 glm-pc 1.1，注重长程推理，与年前的autoglm互补，分别占据pc和mobile设备智谱agent手机端 AutoGLM GLM-PC openai 的 operator 也涉足pc操控 GUI Agent 介绍 Huawei London 邵坤主题演讲，介绍面向通用型 GUI Agent 的模型和优化。 ...

Prompt上下文工程

Prompt上下文工程发展 2022年, 大家谈论“提示词工程”（Prompt Engineering），解决单次交互。 2024年, 谈 “上下文工程”（Context Engineering），解决Agent（智能体）的长序列、多轮工具调用。 ...

大模型自动评估

大模型自动评估 LLM-as-a-Judge 思考 LLM-as-a-Judge 真的管用吗？【2025-8-6】说话人难以识别大模型从工具进化为“裁判”（LLM-as-a-judge），开始大规模地评判由AI自己生成的内容。这种高效的评估范式，其可靠性与人类判断的一致性，却很少被深入验证。 ...

LLM 发展方向

LLM 发展方向【2023-6-16】知乎专题：大模型LLM领域，有哪些可以作为学术研究方向？模型层： GPT系列，多模态系列，视觉类SAM：原生的工具调用能力；安全性：加密，可信任，联邦学习；新模型，新范式：长文本建模，不需要RLHF等；涌现问题的研究、黑盒的研究；并行、运算、显存的优化。EL-Attention，ZeRo，剪枝部署，蒸馏压缩。接口层：私有化部署； Adapter，prefix，Lora； Fusing。应用层： Visual ChatGPT，HuggingGPT，AutoGPT，LangChain； Prompt工程，向量库，dense retrieval；自我纠错，自我迭代，chain of thought 加强；评测数据集、新时代下的新任务，generatice agents等假设已经有 GPT-3.5 基础模型，一千张卡，思考能做什么？然后用小模型，比如LLaMa 7B去验证，如果成功，再慢慢加大到13B，30B，画出一条上升的曲线；不一定要scale到最大的模型，只要自己的结论能划出一条上升的曲线，那么这条曲线就可外推到更大。 ...

AI大模型应用搜索

AI大模型应用搜索大模型搜索【2025-5-10】图灵奖得主、Meta首席AI科学家杨立昆近日在Flatiron Institute 演讲中表示 AI系统今后将基本上通过推理进行搜索，而不是让多层神经网络来预测tokens 2025年5月27日，蚂蚁开源在第⼗届技术⽇上，重磅发布了《2025 ⼤模型开源开发⽣态全景与趋势》报告 ...