全球AI领域迎来巨变!OpenAI发布会掀桌子,国内巨头走上不同道路

发表时间:2025-10-13 11:54

前言:

AI行业,现如今可以说是一天一个样子,就算是现在有人说,明天路上就会有智能机器人闲逛,放在现在看也不会过于令人做震惊。

而伴随着AI领域的突飞猛进,各大主流企业也开始越来越大的发力,OpenAI这次的进步就是这样,直接给全世界敲响了警钟。

中国方面面对这种情况,也是几大科技巨头联合开始发力。


发布会开启!

2025年10月的OpenAIDevDay,看完直播我半天没缓过神。这哪是一场技术更新发布会啊,分明是OpenAI在给整个软件行业“重新定规矩”。

他们想把ChatGPT变成一个“AI操作系统”,以后我们用软件的方式,可能都要彻底变了。以前我们用手机电脑,想做不同的事得打开不同的APP:做海报要开Canva,找房子要开Zillow,写代码要开编程软件,切换来切换去特别麻烦。

但这次发布会上,OpenAI直接演示了一套完全不同的操作:在ChatGPT里聊创业项目,说一句“我要做符合品牌风格的海报”,ChatGPT当场就唤起Canva,几秒钟就生成了海报。

接着说“想把业务扩展到匹兹堡,看看当地房源”,它又直接调出Zillow的交互地图,能筛选房源、预约带看,全程不用跳出ChatGPT的聊天窗口。

更关键的是,前面聊的创业方向、预算、目标城市,后面调用的APP都能“记住”,还能互相传递信息。

这背后靠的是OpenAI新出的AppsSDK和MCP协议,开发者不用再给iOS、Android做APP,而是把APP直接“装进”ChatGPT的对话里。

这意味着,以前我们熟悉的“找图标、点图标、开APP”的逻辑,可能要被“聊两句、直接用”的对话逻辑取代了,以后打开ChatGPT,可能就相当于打开了整个互联网的服务入口。

解决了“外部APP怎么进来”的问题,OpenAI又解决了“内部AI怎么造”的难题,这就是他们推出的AgentKit。

以前做一个能干活的AI智能体,得写代码、反复调试提示词,门槛特别高。但AgentKit把这个过程变成了“搭积木”。

发布会上有个8分钟的演示,工作人员没写一行代码,就在可视化界面里拖拖拽拽:先加个“判断问题类型”的节点,再连个“调用数据库”的节点,又设置了“需要用户确认再执行”的分支,很快就做出了两个AI智能体。

一个管活动日程咨询,一个管通用信息查询,还加了个“中控节点”,让系统能自动把用户的问题分给对应的AI处理。

更厉害的是,这个“AI生产线”还自带质检和优化功能:Evals评测系统能自动测试AI的工作效果,记录每一步操作。


未来改变巨大

RFT强化微调功能能让企业根据自己的需求,训练AI在合适的时机用合适的方式干活。

这相当于给企业提供了一套“造AI员工”的工具,以后公司里可能会出现专门管这些AI的部门,比如叫AgentOps,负责配置、监控这些“AI员工”的工作。

有了外部的APP入口和内部的AI员工,还得有“连接现实”的能力,这就是Codex的作用。

Codex是个专门为写代码而生的模型,但它现在已经不只是“帮程序员写代码”了,而是能直接“操作现实设备”。

发布会上有个特别震撼的演示:工作人员指着舞台上的SonyFR7摄像机,让Codex做一个控制面板。

几秒钟后,屏幕上就出现了带实时画面和控制按钮的界面,Codex不仅自己搭好了Node.js的逻辑,还自动识别出摄像机用的Visca协议,生成了通信接口。

甚至还根据现场的视觉风格,用Figma的橙蓝配色“装修”了界面。

后来工作人员又说“改成滚动的开发者名单”,Codex用React框架很快就实现了,全场都沸腾了。

现在OpenAI内部几乎所有新代码都是Codex写的,用它的工程师提交代码的效率比以前高70%,连代码审查都能让Codex先过一遍,效率直接翻倍。

更重要的是,Codex能通过自然语言控制设备、API、机器人,以后可能真的能实现“说句话就能操控世界”。

比如用语言控制工厂的机器,或者让AI自动调试云端系统,每个行业的操作方式都可能被改写。

这三大模块能跑起来,全靠底层的模型支撑。这次OpenAI更新了三个关键模型:GPT-5Pro、Sora2和GPTReal-TimeMini。

GPT-5Pro相当于整个系统的“通用大脑”,不管是调用APP、指挥AI智能体,还是生成内容,背后都靠它支撑。

现在OpenAI不再只强调“模型多厉害”,而是让应用层收集的数据反过来喂给模型,让模型越用越懂世界。

比如用户用ChatGPT订酒店、查路线的过程,都会变成模型学习的素材,让它下次能更精准地理解需求。

Sora2则是系统的“眼睛”,这次正式开放了视频生成接口,开发者能直接把它接到自己的产品里。比如美泰玩具的设计师,现在从草图就能生成3D的玩具概念视频,连光影、质感、动作都能一键生成。


国内企业走上另一条赛道

更突破的是,Sora2生成的视频里,虚拟角色能和真人一起出现、互动,真正打通了“虚拟生成”和“现实场景”的缝隙。

GPTReal-TimeMini是系统的“嘴巴和耳朵”,这是个又小又便宜的实时语音模型,延迟低、音质高,成本比以前降了70%。

它能捕捉到说话人的情绪,连语气、节奏甚至叹息都能还原得很真实,不管是ChatGPT的语音对话,还是第三方APP的语音功能,都能用它。

把这几部分串起来看,你会发现OpenAI在做一件特别大的事:他们想把整个软件世界,从“靠操作逻辑组织”变成“靠智能逻辑组织”。

以前我们用软件,是“人找功能”;以后用ChatGPT这个“AI操作系统”,是“功能找人”,你只要说出需求,系统会自动调用APP、指挥AI、写代码、操控设备,帮你把事办成。

这对我们普通人的影响特别直接:以后可能再也不用记那么多APP的用法,也不用在不同APP之间切换,打开ChatGPT聊两句,就能完成从工作到生活的各种事。

对企业来说,以后造AI、管AI的门槛会越来越低,小公司也能用上定制化的“AI员工”,效率会大幅提升。

当然,这对国内的厂商也是个信号:现在不是比“谁的模型更厉害”,而是比“谁能把生态搭起来”。

国内的百度、腾讯、阿里其实也有编程系统、模型和AI智能体,但大多是零散的功能,没有像OpenAI这样,围绕“AI操作系统”讲一个逻辑自洽的故事,把所有功能串起来。

而且国内有自己的优势:产业密度高、场景复杂、C端生态成熟。

比如在电商、本地生活这些领域,我们有很多独特的场景,完全可以基于这些场景,探索属于中国的“AI操作系统”路径。

但关键是要想清楚,怎么让自己的产品融入“对话逻辑”,以后用户可能不会再“打开APP”,而是“说句话调用服务”,谁能先做到这一点,谁就能抓住下一代的流量入口。

OpenAI这场发布会,表面是技术更新,实际是“权力转移”。

从开发者控制应用,变成模型驱动开发;从人教AI做事,变成AI教人做事;从APP间切换,变成在ChatGPT里一站式完成。


结语:

也许以后软件的世界里,对话就是操作系统,AI智能体就是界面,模型就是底层语言。这可能真的是一种新的计算范式,而我们正在见证它的开端。

分享到:

    |     关于我们     |     投资案例    |     团队    |     资讯    |     产业互联网达摩院     |   联系我们

地址:广州市天河区天河北路239号广州环贸中心3502C1室          电话:020 8759 3172        
BP邮箱:bp@esenciafund.com             媒体邮箱:pr@esenciafund.com                     

粤ICP  粤公网安备