基于Qwen3打造语音-文字-图像一体化平台的深度研究

基于Qwen3打造语音-文字-图像一体化平台的深度研究 前言 随着大语言模型的快速发展,多模态能力成为新一代AI平台的核心竞争力。本文将深入探讨如何基于Qwen3构建一个集成语音识别(ASR)、语音合成(TTS)和图像生成于一体的综合AI平台。 ...

January 31, 2026 · 44 min · 21648 words · Ringi Lee

Agent智能体应用

Agent智能体应用 GUI Agent 【2024-1-25】这几天agent操控设备成为热点: 智谱昨天推出 glm-pc 1.1,注重长程推理,与年前的autoglm互补,分别占据pc和mobile设备 智谱agent手机端 AutoGLM GLM-PC openai 的 operator 也涉足pc操控 GUI Agent 介绍 Huawei London 邵坤主题演讲,介绍面向通用型 GUI Agent 的模型和优化。 ...

December 04, 2025 · 50 min · 24965 words · Ringi Lee