奥特曼罕见直播反思：GPT-5曾走弯路，写代码将不再重要

在一场开放的AI行业对谈中，与会者就大模型开发的得失与未来方向展开深入交流。OpenAI首席执行官山姆·奥特曼（Sam Altman）近日在一次直播讨论中罕见地自我反思，承认公司在ChatGPT-5系列模型的开发上走了一段“能力侧重偏移”的弯路。他直言：“我们确实搞砸了”，指出由于过度专注于编程和推理能力，GPT-5系列模型出现了明显的能力失衡。这一反思经由2026年1月27日新浪财经的报道，以及X平台科技博主@宝玉的总结评论，在业内引发热议。奥特曼的表态不仅道出了OpenAI内部路线调整的决心，更折射出生成式AI在技术演进和应用落地中面临的一系列关键课题：工程智能与通用语言能力的冲突、AI对软件工程岗位的冲击与角色重塑、模型商业逻辑从算力成本到响应速度的演变，以及AI安全治理理念从严防死堵走向增强韧性的转变。此外，他还谈及AI在教育、儿童成长等领域的边界问题，引发人们对技术应用尺度的思考。本文将对此次访谈要点进行梳理和分析，在回顾事件经过的同时，从产业趋势和技术解读的角度探讨其深远影响。最后，笔者也将基于上述探讨给出自己的观察视角，包括技术发展如何与社会协同、算力基础设施的演进，以及新一轮AI治理面临的制度挑战。

引言：GPT-5偏科问题与OpenAI的路线反思

反思与均衡

面对这一问题，奥特曼明确表示OpenAI将回归“真正高质量的通用型模型”路线。这意味着在未来的模型迭代中，不再只追求某一两项技能的极致提升，而是以均衡发展为目标，让模型在编程、推理、语言表达、创意等各方面都保持领先。他强调，从长远来看，AI的主流形态一定是具备多元智能且平衡发展的通用模型。毕竟，当用户希望让模型生成一个完整的应用程序时，他们需要的绝不仅是正确无误的代码，还包括模型在交互过程中体现出清晰、有条理且善于表达的人格特质。奥特曼的这一番话点明了开发通用AI的初心：真正实用的AI助理，既要当得了工程师，也要说得了人话，做到“既会算又会聊”。OpenAI内部据称已在测试一个特殊版本的GPT-5.2模型，研究人员反馈这个模型在科学分析等方面带来的进展“已经不再是可有可无的水平”。这暗示着通过调整研发路线，兼顾工程智能与通用能力的新模型有望取得突破。总的来看，奥特曼直面问题、公开反思的态度在业界并不多见。这既是在为此前的偏差买单，也是在为OpenAI下一步的发展定调——重拾通用模型的方向，以避免陷入能力偏科的陷阱。

工程智能与通用语言能力的冲突

平衡与融合

OpenAI的经验教训说明，工程智能与语言能力并不是二者择一的零和关系。相反，真正强大的通用人工智能应当是这两方面的融合统一。奥特曼强调，未来的模型必须在保持卓越编程能力的同时，把失去的表达沟通“软实力”补回来。用户需要的不仅是一个代码助手，还希望AI具备类似一个清晰、有逻辑、擅长表达的人类伙伴那样的互动体验。然而，实现这一点对工程提出了极高要求：如何在训练过程中平衡不同能力的权重，避免顾此失彼？这涉及到模型架构、训练数据多样性、指标体系等系统性工程难题。例如，优化代码能力往往需要大量高质量编程数据和严格的逻辑反馈，而提升对话质量则仰赖丰富的语言素材和对人类偏好的把握。如果训练或调优时侧重了前者，模型可能趋向于严谨保守、缺乏“温度”；反之过度强调对话亲和，又可能削弱其专业严谨度。这种张力需要通过更精细的多任务学习策略来化解。

从OpenAI当前透露的信息看，他们有信心让单一模型实现“多能强大”。内部测试的GPT-5.2特殊版本据称在科研等领域表现出不俗的综合能力提升。这表明通过调整训练策略、引入更全面的训练数据以及可能的架构创新，模型有望同时拥抱工程理性和语言聪慧。可以预见，未来GPT-5系列乃至GPT-6，将致力于打通“会算”与“会说”这两大能力脉络，构建一个既能精准解决问题又能自然沟通解释的全能型AI。这种探索对于整个行业也是一堂课：通往强人工智能之路，不能走偏科的捷径，而须回归综合智能的正轨。

软件工程范式转变：岗位需求、角色演化与人机协作

角色演化

奥特曼描绘的未来场景是：工程师的角色将发生巨变。一方面，繁琐的体力活式的编码、调试将被AI大幅接管，人类工程师从“写代码的人”转变为“让系统去把事情办成的人”。另一方面，软件需求不降反升，因为当定制软件变得廉价易得，各行各业、乃至个人都有动力创造更多软件来满足细分需求。因此软件工程从业者的总体规模会比今天大得多，且他们创造的价值在GDP中占比提高。这并非天方夜谭：我们已经看到一些迹象。例如，有AI研究人员几乎不会编程，却借助AI助手在45秒内完成了原本需要6小时的数据处理脚本编写。AI工具的辅助使得非程序员也能充当“开发者”，从而拓宽了软件创作的参与群体。这种人机协作的新范式下，传统初级码农的工作内容会减少，但具备领域知识的人能够借助AI快速实现想法，反而创造出更多新职业和岗位。

值得注意的是，“更多工程师”并不意味着以往同样的工程师。正如科技博主宝玉所言：“AI让代码生成变得几乎零成本，但构建有价值的软件依然昂贵。”也就是说，代码本身将日趋廉价，而软件架构设计、需求洞察、产品思维这些更高层次的能力会变得相对更重要。工程师的价值正从“怎么写代码”转向“为何写、写什么”。判断力、创造力、审美和架构设计能力将成为人类工程师不可替代的核心竞争力。在未来，两类“工程师”可能并存：一类精通AI协作，善于将想法转化为AI可执行的指令；另一类深谙复杂系统原理，负责制定框架、规则和标准，让庞大的AI代码产出汇聚成可靠的产品。无论是哪种角色，人机协作都将是关键：人类提出愿景与判断，AI负责执行与实现，两者相辅相成，共同推动软件开发进入一个高效繁荣的新纪元。

模型商业逻辑的演变：从算力成本到响应速度

速度与成本

这一现象反映出AI应用经济性的评价标准正在发生重构。过去，“划算”意味着用更低的算力和金钱获得可接受的答案；而现在，“划算”可能意味着用更多资源换取瞬时的响应。对于时间敏感型的应用，例如交易、医疗急诊决策、实时交互产品等，响应延迟本身就有极高成本，因此毫秒级提速都具有商业价值。可以预见，AI服务提供商将推出分层的速度定价：基础服务成本低但响应较慢，高级服务则部署更强大的算力以换取极速回答，价位相应提高。在这个新的逻辑下，OpenAI需要解决的不仅是如何继续降低成本，还要在成本与速度这两个目标间找到合理的平衡点。为了既满足追求极致速度的高端需求，又不至于因过度堆砌算力导致普惠成本上升，OpenAI可能会采取更智能的资源调度和模型优化策略。例如，根据查询复杂度动态分配算力，或开发轻量级模型用于简单请求、重量级模型用于复杂请求，从而在整体上兼顾效率和成本。

另一方面，算力作为稀缺资源的商业逻辑也在深化。奥特曼曾强调，当前阶段算力并非单纯的成本，而是决定潜在需求能否转化为实际收入的关键约束。换言之，谁掌握了更充裕的算力，谁就有能力服务更多用户、更快响应，并从中获取更高收益。如果拥有双倍算力，收入几乎也能随之翻倍。因此我们看到OpenAI不惜投入巨资扩建算力基础设施，以求在未来的竞争中占据优势地位。据其披露，过去一年OpenAI的计算能力提升了约3倍，公司收入增速也与之基本同步，几乎不存在算力闲置或浪费。展望未来，当整个社会和企业对AI的结构性适应完成后，决胜的关键不再是哪家模型能力更强，而是谁提前铺好了足够宽的算力管道和平台。模型商业逻辑因此发生转变：模型本身的优化仍重要，但基础设施和服务质量（如响应速度、稳定性）成为新的竞争焦点。这将促使AI公司在芯片研发布局、数据中心建设、网络传输优化等方面加大投入。总之，从成本到速度的逻辑演变背后，是用户期望的提高和应用场景的拓展。AI服务正迈入比拼体验的新阶段，谁能更快、更好地满足用户，谁才能在激烈的商业竞争中胜出。

生物安全隐忧：AI风险治理从“封堵”到“韧性”

韧性治理

基于此，奥特曼主张AI安全治理需要从“阻止一切发生”转向“提高整体抗风险能力”，即构建韧性式安全。他用人类对待火的历史作比：起初人们试图完全禁止用火以策安全，但发现不切实际；随后转向制定防火规范、发明耐火材料和建设城市消防基础设施，最终才真正让火既可控又可用。同样道理，与其妄想靠禁止和规制让AI永不出事，不如承认风险将会存在，并着手提升整套社会技术系统应对风险的弹性和恢复力。“韧性治理”要求我们假设最坏的情况终将发生，然后提前部署缓解机制，保证即使出现事故也能将损害降到最低、快速恢复正常。具体措施可能包括：发展AI自主检测和纠偏技术，一旦模型输出有害方案可自动识别并阻止；建立跨国合作的AI安全情报共享和应急响应机制，一旦发现生物威胁苗头能迅速联动处置；对关键生物实验和资源加强管控，防止AI给出的危险构想被轻易付诸实施等等。奥特曼还指出，AI在安全领域是“既是问题也是解决方案”。正因为AI可能带来风险，我们更应利用AI去识别风险、对抗风险。例如，用AI去研发新型防御疫苗、监测异常的生物实验活动等，以AI制衡AI。

奥特曼的这番论述契合了当前全球AI治理思路从单纯限制向综合治理演进的大趋势。各国监管者和研究机构也日益认识到，无法通过一纸禁令杜绝AI风险，更现实的是提高整个体系对风险的适应力。近年来，“韧性”一词频繁出现在AI治理和网络安全政策中，强调系统的弹性和自我修复能力。对于生物安全这样高危高影响的领域，更需要提前垫好安全的“缓冲垫”。奥特曼警示，如果2026年AI领域真要发生一次显著且严重的事故，最有可能出事的就是生物安全领域。这无疑是敲响的警钟。它提醒业界和监管者，必须未雨绸缪，从现在开始就建设AI时代的生物安全防火墙与应急体系。AI公司在追求技术突破的同时，也需要积极参与制定行业安全标准和预案，为最坏的情况做好准备。总体而言，从“封堵”到“韧性”的治理理念转变，体现出AI产业日渐成熟后的理性务实。正视风险的存在，建立容错和抗压机制，让社会有能力承受冲击、迅速恢复，这将成为AI治理的新范式。

教育与儿童应用中的AI边界

教育边界

奥特曼的担忧反映出AI在软性应用场景中的边界问题。当AI逐渐渗透教育、医疗、心理咨询等领域，我们必须慎思：AI应当扮演多大的角色？在何种情况下应该设限？以教育为例，适龄地引入AI辅助教学或许有益，比如利用AI进行个性化辅导、回答问题，能拓宽学生视野、提高学习效率。但若过度依赖AI替代老师或同伴的作用，学生可能缺乏与真人互动的机会，进而影响社交技能的发展。此外，AI的知识和价值观也并非完美无偏——儿童很容易受到潜移默化的影响，如果AI的回答存在偏见或不当引导，孩子难以分辨纠正，这对三观塑造是不小的隐患。因此，在教育场景中应用AI需要把握一个“度”。目前更安全的做法是：低龄段尽量避免AI介入，小学高年级到中学阶段可在监督下有限使用，确保AI扮演的是辅助者而非主导者的角色。并且，无论何时，都应鼓励孩子与真人老师、同学交流，在现实互动中锻炼综合能力。

除了教育，AI在儿童陪护、娱乐方面的应用也需设限。例如，一些智能玩具、故事机声称可以充当儿童的对话伙伴，甚至情感抚慰者。这类应用表面看便利，但长远影响难料：孩子或会对机器产生依赖，进而疏远与真实亲友的关系；机器难以提供真正的人类情感共鸣，长期来看可能阻碍儿童情商发展。奥特曼的观点给行业提了醒：技术的部署要符合儿童身心发展的客观规律，不能为了追求早期市场就一股脑把AI塞给孩子。教育学家和儿童心理专家的介入显得非常必要，他们可以帮助制定分龄指南、使用规范，明确哪些年龄段可以用AI做什么、不可以做什么。这实际上是在为AI应用划定伦理边界，也是AI负责任发展的应有之义。

我的视角：技术社会协同、算力基础设施与AI治理新挑战

奥特曼的这次反思与展望，既是对OpenAI自身历程的总结，也映射出整个AI产业的发展脉络。在笔者看来，要确保AI技术健康前行，离不开技术演进与社会协同的双轮驱动，以及对基础设施和治理体系的新思考。

首先，技术发展与社会协同日趋重要。ChatGPT-5系列的偏科问题告诉我们，AI研发不能只关起门来追求指标突破，而应更多聆听用户和社会反馈。奥特曼之所以意识到模型人格和表达的重要性，正是因为广大用户对GPT-5“冷冰冰”的吐槽之声不绝于耳。这说明社会参与是塑造AI方向的关键因素之一。未来AI模型的训练，不妨引入更多元的价值观和人文关怀因素，使其输出符合不同文化和群体的期望。同样，在AI冲击软件岗位、进入教育领域等议题上，也需要产业界与社会各界协商共议。学校、企业、政府应提前布局培训和转型机制，帮助现有从业者适应AI工具，培养下一代在AI时代所需的新技能。从历史上看，每次技术革命都会引发社会阵痛，但最终通过协同应对，实现“涅槃重生”。这一次，我们必须更加 proactive （积极主动），才能将AI对就业和教育的影响转化为正面机遇，而非被动承受冲击。

其次，算力基础设施的演进将在很大程度上决定AI产业未来竞争格局。奥特曼多次提到算力瓶颈和数据中心建设，可见顶尖AI公司已经把“拼算力”提升到战略高度。可以预见，新一轮的“算力军备竞赛”正在展开：云服务巨头加码投资GPU/TPU集群，新型AI芯片研发方兴未艾，各国政府也开始将算力视作国家战略资源。算力不仅意味着模型的速度和规模，更意味着一家AI企业的服务辐射能力。当AI应用大规模落地时，那些拥有雄厚算力储备和高效分布式架构的玩家，才能以更低延迟和更高并发来满足海量需求，从而抢占市场先机。因此我们会看到，AI产业正从“拼模型参数”转向“拼基础设施宽度”。这对行业提出了新的挑战：投入巨资扩建算力必须谨慎规划，以避免资源浪费和环境代价；同时，应探索算力共享和调度的新模式，让中小企业和研究者也能公平获取计算资源，防止算力垄断扼杀创新活力。

最后，新一轮AI治理的制度挑战日益凸显。奥特曼倡导的“韧性安全”理念，实际上需要在治理层面予以制度化支撑。例如，如何在法律法规中引入更灵活的风险管理机制？如何鼓励企业和机构报告AI风险、共享事故教训，而不是出事后一味追责？传统监管往往倾向于预先禁止和事后惩罚，而AI领域可能需要持续监测和动态校正的机制。监管者可以考虑建立“AI安全沙盒”或强制性的红队测试制度，在新模型推出前进行充分的对抗性试验，把潜在问题暴露在可控范围内。另一方面，治理还需应对AI带来的伦理和法律新难题：如AI生成内容的版权归属、AI决策的责任认定、深度伪造的防范等等。这些都需要制度创新去破解。可以预料，各国将不断更新各自的AI治理策略，从欧盟的AI法案到美国的AI准则，以及中国正在探索的分级监管体系，都是为了在鼓励创新和保障安全之间找到平衡。一套行之有效的AI治理框架应当具有前瞻性和弹性——既能适应技术演进的快速步伐，又在原则上坚守安全与人本价值。具体而言，可能包括：强化AI透明度要求，让模型决策过程可解释、可追溯；建立AI认证和审计制度，对高风险AI系统定期体检；推动国际合作，制定AI全球治理准则以避免标准碎片化等等。总之，AI治理的难度在于未知风险和跨领域影响，这需要监管部门、技术社群和公众共同摸索出一条动态调整、逐步完善的道路。

结语

回顾奥特曼此次关于ChatGPT-5系列的反思，我们看到一家领先AI企业在高速前进中主动校准方向的努力。从“搞砸了”的坦诚认错，到重申通用模型的初心；从预测工程师角色的激增，到强调AI安全的韧性治理，透射出的是整个AI行业日趋成熟的心态。经历了早期的狂飙突进和偶像崇拜，现在的从业者开始冷静审视AI的短板与风险，思考如何让技术更稳健、更有益地融入社会。

对于OpenAI而言，ChatGPT-5的教训将成为宝贵财富，促使其在GPT-6乃至后续产品上更加均衡用力，谨防重蹈偏科覆辙。对于产业界，软件开发范式的转变正在开启新篇章，人机协作的新模式将释放前所未有的创新潜能。对于监管者，AI治理考验着智慧和魄力，唯有与时俱进、兼收并蓄，方能既确保安全又不扼杀技术进步。可以预见，未来几年AI领域注定风起云涌：技术飞跃与制度演进交织，机遇与风险并存。唯有坚持理性分析、协同创新，我们才能在这场变革中掌握主动权，让AI更好地服务人类的福祉。

引言：GPT-5偏科问题与OpenAI的路线反思#

工程智能与通用语言能力的冲突#

软件工程范式转变：岗位需求、角色演化与人机协作#

模型商业逻辑的演变：从算力成本到响应速度#

生物安全隐忧：AI风险治理从“封堵”到“韧性”#

教育与儿童应用中的AI边界#

我的视角：技术社会协同、算力基础设施与AI治理新挑战#

结语#