奥特曼没有其他选择
创始人
2024-12-10 09:13:57
0

出品 | 虎嗅科技组

作者 | 王欣

编辑 | 苗正卿

头图 | 《教父》

果然是o1(正式版)和ChatGPT Pro。

12月5日,OpenAI仅花了15分钟就结束了圣诞季发布会的首秀。前一天他们发推表示要连续12天的集中新品发布,看似“大的来了”。

但在15分钟首秀过后,有人调侃奥特曼将短剧模式玩明白了,把两小时发布会切成了12段。

这次发布的o1正式版但并没有超出行业预期——此前接近OpenAI人员就向The Verge透露,发布会新品包括文生视频期货Sora和新的推理模型。

然而,o1对行业的意义也已经逐渐凸显——成为在传统Scaling Law遇到瓶颈后一种新的scale技术路径,国内玩家也在这条路径上积极投入。

而从售价翻倍、高达200 美元一月的ChatGPT Pro,不难看出OpenAI的商业化野心——OpenAI首席商务官Lionetti表示,OpenAI今年的目标是实现近 40 亿美元的收入,其中绝大部分销售额来自为 ChatGPT 的高级功能付费的个人消费者。

或许可以说,奥特曼也没有太多其他选择。据此前未披露的内部财务数据估算和相关人士的分析,OpenAI今年可能亏损高达50亿美元。

新的里程碑?

Lionetti表示,OpenAI 将o1视为一个“里程碑”,它已经打开了新的市场。

o1使用强化学习技术训练模型自行解决问题,该技术通过奖励和惩罚来教导系统。然后,它使用“思路链”来处理查询,类似于人类通过逐步思考来处理问题的方式。

相较于之前的o1-preview(预览版),新模型在速度、性能和准确性上均有显著提升。据奥特曼介绍,o1模型在编码、数学和科学写作等方面表现更为出色,特别是在处理复杂问题时,其响应速度提高了约50%,错误率减少了34%。

值得一提的是,o1模型还支持图片形式的多模态推理。除此之外,OpenAI还计划在未来几个月内增加网页浏览和文件上传等功能的支持,进一步拓展ChatGPT的应用场景。

OpenAI 推出 o1-preview 后,谷歌也加大了推理力度。谷歌已将其推理模型团队规模从 o1-preview 发布前的几十人扩大到 200 人左右。据一位知情人士透露,谷歌还为该团队提供了更多计算资源。

在国内,Kimi、昆仑万维、deepseek也上线了o1路线的推理模型。

11 月 16 日,月之暗面发布了数学模型K0-math,根据其公布的基准测试:K0-math可对标OpenAI o1中可公开使用的两个模型:o1-mini和o1-preview。

11 月 20 日,Deepseek的DeepSeek-R1-Lite正式上线。与OpenAI的o1模型相比,R1-Lite模型将完全公开其复杂的思考路径。根据Deepseek官方的说法,R1-Lite能够处理的思维链长度可达到数万字之多。

11月27日,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版(Skywork o1)。

“o1路线所代表的深度推理模型,其实之前国内各家AI公司都有尝试,但并没有做得很深,”某互联网大厂产品经理表示:“而OpenAI的o1发布后,大家才坚信这个事情是值得做的,投入会比前期要更坚决一些。”

大家押注o1另一重要原因也在于,此前Scaling Law的路线已经走到了瓶颈,GPT5也迟迟未发。

智谱CEO张鹏认为,虽然“Scaling Law确实不再涨了”,但仍在Agent、多模态、强化学习、扩散模型等不同方向上存在新场景、算法的scale可能。

o1所代表的强化学习路线,就是这些可能性中的一条重要路线。

如何落地?

但o1落地场景仍然还需要更多探索尝试,并且局限依然存在。比如,模型也会因为过度思考,而在简单问题上花费多余的步骤。

然而,在数学、生物、物理等科研领域,o1的潜力正在逐步显现。相较于陪聊、普通问答等场景,让AI去攻克哥德巴赫猜想等人类难题,或许才是不断提升AI上限的正确打开方式。

据The Information报道,劳伦斯利弗莫尔国家实验室的研究人员,已经使用o1模型来解决博士级的问题。

该实验室位于加利福尼亚州利弗莫尔,其研究重点是使用高功率激光照射小型燃料胶囊,以在核聚变反应中产生能量。据参与实验的一位人士称,在一个案例中,研究人员使用 OpenAI 的o1-preview,来计算在一定强度的激光作用下胶囊的温度和压力,并询问需要多强的激光才能达到一定的温度和压力。

OpenAI 推理模型通常需要 10 到 60 秒来回答这些问题。该人士表示,这可以为研究人员节省 30 分钟到几个小时或几天的时间。

而在这次的发布会上,Jason Wei也演示了o1在生物科学领域的应用,让o1找出符合标准的蛋白质。对于这个o1-preview无法回答的问题,o1正式版在53秒后便给出了正确答案。

OpenAI首席商务官Lionetti也强调了o1模型在法律、编程、医疗保健和制造业的应用场景。例如,在法律领域,它有助于对条款清单、文档分析、多步骤审批流程进行法律或数学计算。他表示,该公司还向医疗保健公司出售 o1,这些公司使用它来为医疗索赔定价、分析临床指南和分析复杂数据集。它关注的另一个市场是制造业,OpenAI 表示,o1 可以分析和加速工业流程。

这些场景也让OpenAI看到了商业化的更多可能性。

因此,OpenAI推出了价格更高的ChatGPT Pro订阅服务,这是一个每月收费200美元的新套餐,用户可以无限制地使用OpenAI的o1、GPT-4o以及高级语音模式。此外,Pro订阅还特别提供了一个仅供Pro用户使用的o1版本,这个版本被称为o1 Pro模式,它通过增加计算资源来优化对复杂问题的处理,以提供更优质的答案。

虽然相较此前每月 20 美元的 Plus 套餐,Pro定价更为高昂,但这对于刚刚宣布周活用户高达3亿的OpenAI,仍然存在很大的付费转化空间。

更为重要的是,ChatGPT目前付费版本的可能增长速度,不足以弥补运营该服务的高昂成本——据此前未披露的内部财务数据和参与该业务的人士的分析,OpenAI今年可能亏损高达50亿美元。

这种情况下,要达到40亿美元年收入的小目标,OpenAI似乎没有太多选择。

相关内容

非标定制游乐设备崛起:从同...
随着亲子消费升级、文旅融合深化与儿童友好城市建设的持续推进,我国游...
2026-04-25 08:21:38
宁波前湾新区文旅提质升级 ...
来源:中国新闻网 中新网宁波4月19日电 (汪俐辰)近年来,宁波前...
2026-04-25 08:21:21
花开四月・点亮都市休闲新风...
春风送暖,芳菲满城。2026年4月18日,“花开四月 童悦春光”北...
2026-04-25 08:21:07
寄宿还是走读?成都K12学...
寄宿还是走读?成都K12学校全解析帮您做出选择 "每天早出晚归接送...
2026-04-25 08:21:00
重庆丰都:桑果飘香长江岸
近日,位于重庆丰都县长江岸边的三峡紫果桑采摘园迎来丰收季,桑葚挂满...
2026-04-25 08:20:37
晋风陕韵·丝路同行|洪洞大...
近日,晋陕文旅交流推介活动顺利举办,山西文旅精彩亮相展会现场,以厚...
2026-04-25 08:19:51
原创 ...
大S离开已经整整一年多了,而小S这一次在镜头前,第一次坦言自己对不...
2026-04-25 08:19:45
【春季赏花 畅游南阳】一块...
一块钱吃烩面、住帐篷看星星, 五朵山五一太会了! 山巅一碗面,只卖...
2026-04-25 08:19:33

热门资讯

张小泉控制权或再添变数,MCN... 图片来源:视觉中国 蓝鲸新闻4月21日讯(记者 徐晓春)张小泉控制权或再添变数,MCN机构白兔集团刚...
一季度冠军基金重仓曝光:黄金、... 每经记者:任飞 每经编辑:赵云 截至4月22日,2026年第一季度主动权益基金(统计普通股票型、偏股...
沪指重返4100点 2920只... 扬子晚报网4月22日讯(记者 范晓林)截至收盘,沪指重返4100点,创业板指、深成指均涨超1%。创业...
超837亿元!2025年中国演... 央视网消息:4月21日,中国演出行业协会发布多项2025年全国演出市场相关数据。2025年,全国演出...
原创 库... 苹果重大人事调整!苹果正式官宣库克将于2026年9月1日正式卸任CEO职务,转任董事会执行董事长,接...
回购潮下价值凸显,美的集团、泡... 文丨谢长艳 编辑丨张桔 年内上市公司回购潮再涌,尤其A股和港股的龙头公司成为标兵,美的集团、腾讯控股...
珀莱雅上市后年度营收净利首次双... 国产美妆巨头业绩迎来阶段性承压,上市后业绩首次下滑。 4月21日晚间,珀莱雅(603605.SH)发...
中国走得太及时!8500亿美债... 编辑丨子渝 文丨子渝 本文陈述所有内容皆有可靠信息来源,赘述在文章结尾 4月,美国财政部陷入...
大势已逆转!国产新能源或早已证... 打开2026年最新车市终端数据,一场堪称惨烈的行业洗牌,正在清晰上演。 曾经手握二三十万预算、中产群...
阿里等巨头,洽谈投资DeepS... 来源:财熵 阿里等巨头,洽谈投资DeepSeek 据媒体援引四位知情人士透露,中国科技巨头腾讯控股...