Datawhale分享
访谈:印奇,阶跃星辰董事长
内容来源:2026年1月,语言即世界工作室,张小珺商业访谈录对话印奇分享。
今天,旷视科技联合创始人、千里科技董事长印奇迎来新身份——出任大模型公司阶跃星辰董事长。
这位 AI 创业老兵,在经历 15 年 AI 征程后,如何看待从 1.0 到 2.0 的转轨?在“有史以来最激烈的科技竞争”中,他又做出了怎样的战略选择?
本文为印奇出任阶跃星辰董事长后的首次深度访谈,根据原播客整理,有删节和结构化调整。
播客地址:https://www.xiaoyuzhoufm.com/episode/6976bdf0ef1cf272a76fa9f3
一、新身份:从旷视到阶跃星辰1. 双重身份的战略逻辑
张小珺:听说你的身份马上会有一些新的变化,要不你先自己来做一个自我介绍,也聊聊接下来可能有的一些调整。
印奇:我现在的身份是千里科技的董事长,千里科技是一家 A 股上市公司,主要专注在 AI 与车以及未来可能与机器人的结合上。
接下来可能会有一个新的身份,就是阶跃星辰的董事长。阶跃星辰是一家专注在基础大模型的公司,所以这可能也是对我来说一个比较大的一个变化。
张小珺:现在给人感觉身份比较多,除了是阶跃的董事长,你在去年 10 月 25 日也出任了千里科技的董事长。能不能梳理一下你这些多重的身份,以及这些身份之间的关联?
印奇:现在我其实已经不在旷视任职了。所以现在核心的两个身份就是千里的董事长和阶跃的董事长,这两个角色我觉得也是相辅相成的。
因为千里本质上是关注 AI 跟车的结合,而所有车其实是 AI 里面最大的一个终端和一个赛道。
而在千里的相关领域里,不管是智驾、智舱以及未来的 robot 等,其实都需要有一个很强大的大脑和模型来支撑,这样一个大脑其实就是阶跃。
所以我想可能千里所构建的是一个更加核心的赛道,以车为核心的 AI 智能化应用场景和赛道。而阶跃可能更像是支撑它的基础模型——大脑和 AI 的底层能力,大概是这样一个关系。
2. 为什么在这个时间点?
张小珺:为什么是在这个时间点有这个变化?这个时间有考虑吗?
印奇:对我自己来说,其实算是一个 AI 创业的老兵,今年可能接近 15 年的 AI 行业历程,总体上我觉得一直是沿着技术和模型这条线。
大家现在可能讲有 AI 1.0,有 2.0,阶跃也是我一直深度参与的一家企业。到今天正式出任它的董事长,可能也是在一个新的阶段,希望能够投入更大的精力,支持企业的发展。
同时我觉得所有 AI 的产业都是以模型为中心的,所以也希望阶跃和现有的,包括千里在内的相关产业都能有一些更好的结合,所以对我来说也是一个新的挑战。
因为大模型这个战场还是很残酷的,所以可能自己也需要加倍努力。
张小珺:是谁邀请你参与阶跃工作的?这个事情是怎么开始的?
印奇:从最早的筹划阶段,我觉得就有参与进来。
张小珺:早期其实应该还是 23 年 7 月?
印奇:是 23 年 4 月份成立的,所以从最早期就深度参与。因为从当时升学角度来看,大模型首先是符合我自己对 AI 的一个很终极的追求,对所谓这个技术的终极 AGI 使命的想法。
同时这个技术的变革也需要一个好的平台来承接,所以最早我就深度参与到这个平台里,现在正式加入的话,对我来说也是一个很高兴的节点。
3. ChatGPT 带来的认知转变
张小珺:你们当时的故事能不能给我们讲讲?
印奇:最早期我觉得可能当时其实还是 OpenAI 的 ChatGPT 引爆了大家对于大语言模型技术变革的关注。
22 年底其实我们在这个行业内也一直很关注。其实从 GPT-1 开始,从 OpenAI 创立开始,我们就一直很关注。
其实旷视科技本质上是大家所说的计算机视觉领域,所以我们当时做的模型从第一天就是深度学习,因此技术上是非常延续的。但那个时候可能从模型的尺寸和参数量都比较小。
语言模型其实在我们传统意义上来讲是另外一个赛道,因为当我学习 AI 的时候,当时 AI 分得非常细。CV 即 computer vision 是一个领域,比如 data mining 是一个领域,自然语言处理是一个领域,每个领域都有各自的赛道。
我自己其实是对于与物理世界结合最感兴趣的,所以选择了 CV 这个赛道,所以在 OpenAI 真正推出 ChatGPT 之后,我觉得一开始我对这个技术的判断认为可能还是一个局部的变革,认为它可能更多是与语言相关。
张小珺:多长时间发现这个事情?
印奇:只用了半年时间吧。因为坦率讲,当我们在看那个机会的时候,我觉得我们都会从两个角度来评估。
第一是技术上是不是最本质的技术变革。第二个其实是从商业上是不是我们自己的赛道。
如果第一个判断是非常确定的,可能第二个坦诚讲我们在看大语言模型的时候,因为大语言模型它的比如它的数据、它的模型参数量和它所需要的算力,其实原则上讲可能更适合已有的,比如像互联网公司这些科技巨头来做。
但是后来会发现它其实是对于各个领域,包括语言、包括现在我们已经很熟悉的多模态,甚至包含从现在比较热的物理世界,这些可能都是最底层的技术。
那我们可能就不得不参与到这样一场大的变革当中。
张小珺:当时有想过在旷视的体系里做吗?
印奇:第一个我自己感觉就是旷视自身的路径是非常清晰的。当时我们其实是认为用 AI 与 IoT 的硬件做结合。
所以那个时候我们的不管是技术路线、整个组织的构建,其实构建的是一个偏软硬结合的组织形态。我们的商业模式是面向 B 端的。
所以这些我觉得经过十多年的时间,已经非常清晰,甚至说固化。所以这样一套组织并不适合去做一个可能还是非常早期、非常大投入的全新创业。
张小珺:所以就是这种 research 驱动的一个创业。
印奇:对,research 驱动我们很熟悉。其实旷视早期的时候我们当时人才密度是非常高,然后也非常 research 驱动。
后来当一个组织成长,相当于从一个婴儿到一个少年,当它其实已经选定了自己的专业和方向的时候,我觉得可能本质上大模型会是一个新的诞生的组织和平台。
所以最早期我们的想法是希望旷视能与它有非常好的合作。后来可能一步一步发展到今天,我觉得也很高兴能够正式加入到阶跃,推动它下一步的发展。
4. 阶跃星辰名字的由来
印奇:阶跃本身这个名字的由来,其实它的英文叫 StepFun,就是 step function,其实是一个阶跃函数。
阶跃函数其实是代表着从量变到质变,同时其实阶跃也代表着非线性。
其实在深度学习的 这样一张网络里面,一个很重要的技术特性就是非线性,就是很多非线性的叠加,所以某种程度上非线性的叠加,也是一种智能的本质。所以我觉得阶跃这个词非常好。
星辰可能也代表做 AI 的人其实都得还是有点星辰大海的追求,所以这个星辰我觉得我们也是很喜欢这个名字。
5. 对阶跃星辰的预期
张小珺:从筹划做阶跃的时候,你们对于这家公司的预期是什么样的?
印奇:我觉得可能两个预期,到今天我觉得也比较一致。
第一个我觉得还是要成为中国的基础模型领域最优秀的公司之一。就是 foundation model 做基模这件事情是阶跃从第一天 day one 的使命,也一直没有变。
所以为了这个使命,其实它也需要从人才、从它的商业模型、包括从它的资本角度都要能匹配。所以基模我觉得探索整个智能的上限是它最重要的使命。
其次我觉得也是希望它是一个商业上闭环的公司。
所以从阶跃最早期来看,它所选择的商业化模式其实可能也都比较清晰,一直是 AI 或者是大模型与终端的结合。所以不管是 to B 还是 to C 都是在围绕着这种终端这样一个大的应用场景来看。
二、残酷真相:“有史以来最激烈的科技竞争”
1. 三个维度的极致竞争
张小珺:从筹划做阶跃的时候,你们对于这家公司的预期是什么样的?接下来我们聊聊你接下来要做的事情。你觉得新的征程最困难的是什么?
印奇:最困难的是我觉得这其实是一个链条很长的创业和创新。
就是它确实竞争是我觉得可能是有史以来最激烈的一次科技竞争。
张小珺:有史以来最激烈的。
印奇:对,这里面其实从不同的维度。
第一从它的人才密度,基本上全球最聪明的人都在这样一个科技的比拼当中。
第二,它所需要的资源,这个资源其实包含资金,它其实是在整个的研发里面投入的资金的规模强度可能都是历史上最高的。
以及包含它的商业化,可能你可以说在 AI 的商业化的路径中,每个行业每个场景都会被变革。但是哪些会先哪些会后,这个节奏其实也是有高度不确定性的。
所以它其实是一个高度竞争、极大的资源、同时在商业化极度不确定的这样一个竞争。
所以我觉得不管是对我们还是对所有的公司,不管是多大的科技巨头,这场战斗都是非常挑战的。
张小珺:链条有多长?
印奇:链条我觉得首先它其实首先是一个所谓的原节点的技术创新。所以它技术本身在快速演进,就像建一个房子一样,它底层其实一直在变革。
所以其实你在上面搭建它的产品,甚至说商业化,但发现技术往往一变化,可能上面很多都要被推倒重来。
首先它的链条长是 源于它的原始技术,再到技术的产品化,再到商业化,再到整个的商业模式闭环,而且它还在快速的变化当中。 所以这是第一个就是链条长。第二个我觉得就是速度非常快。
2. 比想象更残酷的现实
张小珺:你觉得大模型竞赛发展到今天,它的残酷比你想象的多还是少,程度比当年可能 23 年刚刚开始准备做阶跃的时候。
印奇:我觉得还是更残酷的。
第一点我觉得确实比想的更快。
然后第二,大家因为快,不管是因为对这件事的相信,还是因为对这件事的焦虑,大家在这里面其实所做的竞争强度其实都更大,甚至这个竞争强度更大也会带来很多的泡沫。所以这个泡沫比例比想象的要高一些。
然后第三点,我自己感觉整体大模型其实它对资源的消耗其实还是比想象的要更大。
总体我觉得都是更大,就是更快更大,速度也更快。
张小珺:在你看来泡沫的体现是什么?
印奇:在我看来泡沫体现可能在很多方面,但核心 一个是可能是一些公司的估值,还有 一个其实是一些核心研发人员的薪酬,就这两个市场是两个指标。
张小珺:因为你经历过 AI 的 1.0,到现在他们的薪酬翻了多少倍。
印奇:AI 这块其实当时我们看,比如我们就从应届毕业生角度,当时可能最贵的薪酬要么是在我们这儿,一个是 AI 行业。要不然可能就是去类似像当时的金融和量化这些行业。
所以本质上其实就是最热的两个大的方向。现在我总体感觉可能大概也是这两类方向,一个还是 AI 大模型这些方向,还有一类其实就是可能与量化、甚至与一些金融创新相关的一些领域。
所以具体薪资我就不说了,大家在网上其实也看了很多。美国那边总体我大概感觉就是人才上,基本上中国如果一个优秀的华人同学在中国,在美国基本就是人民币换美金这样的一个同等 package 的水平。
然后我觉得可能很多薪资,其实总体我觉得涨了 5 到 10 倍是有的。
3. 淘汰赛进程:赛程过半
张小珺:所以你觉得阶跃跟其他人不一样,是想了一条非常独特的商业化的路。我觉得这种大模型公司都说自己要做大模型对吧?那现在看起来不同,是商业化的路径是终端。
印奇:我觉得这有点像是一个淘汰赛。最早其实大家讲什么大模型六小虎,对吧?那现在可能就没有几家留下了。
慢慢地大家都可能最早都抱着通往 AGI 的这样一个很美好的想象。后来发现这个路径很残酷,然后需要很多钱,也需要你的人才足够能支撑。
所以我觉得这是一个逐渐进入决赛圈的过程。
张小珺:现在到哪个圈了?
印奇:我感觉现在可能赛程过半。
三、商业模式的排除法:什么不能做
1. 抓住两个核心点
张小珺:在链条这么长的一个竞争中,你觉得如果要抓原点的话,抓最重要的那个事情应该抓什么?
印奇:我觉得抓两个点。
第一个点就是在一个很长链条以及很快变化里面,要抓本质的技术竞争力。
因为这个技术是这波变革的唯一的变量,所以在这个变量里,如果你不能找到自己的核心领先的身位,这个领先身位既可以是说是一个全面的领先,也可以是一个局部领先。
但在技术上如果没有这个,用英文叫 edge,就是没有真正的你的长板,没有你的差异化,那我觉得后面的所有构建东西都是没有基础的。
第二个,我觉得要抓的是商业模式,这个商业模式其实我自己感觉其实不用特别复杂化,其实本质上是做排除法。
就是你的商业模式不应该做那些可能投入产出肯定不成立的。
2. 第一个不成立:基模+To B
张小珺:肯定不成立是什么呢?
印奇:比如说如果做基模公司的,然后同时做 to B 我觉得就肯定不成立。
为什么?因为基模的投入非常大,而 to B 的整个商业化变现的周期长,同时它真正能够达到的收入和利润上限都比较有限——做一家创新公司、一家新公司能够达到的上限都比较有限。
张小珺:算不过账来。
印奇:对,是啊,投入产出会比较难。
张小珺:这是一个不能选的商业模式。还有别的吗?
印奇:还有一个模式,就是如果做基模——我前提刚才都是说做基模。
基模代表着你一年至少我觉得可能需要 30 亿人民币以上的投入,这还已经是一个非常高效的投入。而且这个投入至少会在未来维持 3 到 5 年时间。
所以基本上至少是一个基础研发中的 100 亿人民币,这还是高效的结果。
你看各大大厂其实的投入是远高于这个,这是个天文数字。
3. 第二个不成立:基模+纯 C 端软件
印奇:以这个为投入的情况下,我认为同时做 C 端的纯软件的应用也是不成立。
因为这里确实是已有的互联网这些大厂非常擅长的领域。他们有用户有数据,同时已经构建出这样一个好的数据飞轮。
就因为有场景,其实最终很多模型性能的最终决胜因素还是数据。数据是由用户场景来决定的。所以这样的一些飞轮,创业公司不是完全没有机会。
张小珺:但也非常难。而且今天基础模型做的应用似乎都找不到数据飞轮,也找不到网络效应。
所以你排除了一家基础模型公司去做 to C 的软件产品和他做 to B 的两种商业模式。那他可以有的是什么呢?
印奇:我刚才讲的其实有几个大的前提条件。第一个是一家创新公司,就已有的这些已经有自己非常扎实的应用场景领域的这些大厂,它可能会在自己上面做非常好的 AI 升级。
新公司的话,刚才讲到,如果做基模,无论做 to B 是不成立的,或者是单纯做 to B 是不成立。然后如果做基模单纯做 C 端的软件型应用也是不成立的。
所以我自己认为,可能也是我们阶跃选择的路径,我觉得还是 围绕着偏软硬结合的场景,面向 C 端来做我们的商业化。
但在这过程中,可能中间也会做比较好的 to B 的一些服务,但最终的产品场景应该都是 AI 加终端这个场景。
4. 编程赛道:新公司没机会
张小珺:你觉得这个方向和现在的大模型公司或者大厂做模型的不同是什么?现在大家是不是都趋同了?
印奇:对于模型,现在大家没什么差别。中国的大模型公司基本上,大厂各自有一些判断,比如字节是有一些自己的判断,其他公司基本都在卷编程这件事情。
编程我觉得从两个角度看,首先从提升它的智能上限是有价值的。因为我们现在刚讲的学习范式角度,我们现在是从模仿学习到强化学习。
而编程这个环境是一个最好的强化学习环境。 因为你想编程是一个有结果的,它能够判断对错,而且有很复杂的这样一个场景。
所以如果把编程当成最好的强化学习的这样一个垂类,我觉得是很好的。
但编程本身我自己感觉在商业化角度价值非常有限。有意思的是说它本身价值非常高,但跟这些新公司没什么关系。
张小珺:你觉得谁能收钱?
印奇:我觉得中国可能都收不了钱,因为大厂在这块做的也不错,然后从开源角度有 DeepSeek,这个相当于它是一个水位很高的一个开源体系。
大厂本身就会把中国的大厂的竞争变得非常激进,所以他也会把价格压得很低。同时编程这件事情,其实也会跟它的上下游环境很相关。
所以编程这个赛道就跟 chatbot 这个赛道一样,新公司碰都没有任何意义。
四、破局之道:AI+终端的软硬一体
1. 为什么一定要软硬结合?
张小珺:就是一定要软硬一体。为什么软硬一体是更好的商业模式?
印奇:软硬一体可能本质上算是个交叉学科。
第一我自己认为在大模型时代,硬件的角色会变得越来越重要。
大家一直在讲 agent,其实我觉得未来很多 agent 它都会有一些硬件的本身具象化的载体。
所以未来的硬件更像是一个 agent 实体化的存在,它未来会是一个 AI 服务的闭环。
硬件、模型、软件,这三件事情其实会形成一个完整的服务体系。
第二,硬件市场其实是一个比较分散的市场。 你看手机也不是一家,汽车也不是一家,所以它有很多品类。所以我觉得做 C 端硬件,是因为它是一个比较分散的市场,它不能够垄断。
第三,AI 本质上重新定义了交互。
原来如果比如说你真的需要有块屏,那你大概逃不过小一点的是要手机,中等的就要 pad,再大一点的 PC,这可能大家就是以屏的尺寸来定义你整个硬件的体系。
而未来如果 AI 这样更自然的交互方式,通过语音,通过多模态交互能够把屏幕这件事相对释放掉之后,那很多创新的硬件都可能会有机会。
所以我觉得还是会有很多 AI 硬件,大家现在可能还没有想到,这里我觉得会有很多新的机会。
张小珺:硬件我能理解,一个是车千里做的事情,然后一个是机器人。那你觉得可以规划的硬件还有哪些?
印奇:其实我自己感觉硬件未来的一些创新品类会挺多的。听行业内的一位前辈讲,我觉得也比较认可。未来可能比如在千万级这个量级上的创新硬件可能会挺多的。
原来我们可能认为比如说手机或者像 PC 这些可能是一年 10 亿这个级别,甚至过亿级别的这样的一些新的硬件,其他一些硬件可能更多就是在百万级。
未来 AI 这件事是因为 AI 本质上重新定义了交互。所以原来如果比如说你真的需要有块屏,那你大概逃不过小一点的是要手机,中等的就要 pad,再大一点的 PC。
而未来如果 AI 这样更自然的交互方式,通过语音,通过多模态交互能够把屏这件事相对释放掉之后,那很多创新的硬件都可能会有机会。
张小珺:会是一个 AI 手机吗?
印奇:我觉得上来可能不完全会是 AI 手机,我觉得还是得新的东西。
2. 硬件选择:从车开始
张小珺:如果是硬件开始要牵引模型,那硬件这个 range 就很广了。你们会第一款硬件选什么呢?前几款硬件选什么呢?
印奇:我们第一个场景现在肯定还是在用车来牵引。
所以就是我们不管是在智驾里面,其实刚刚讲的用真正的智驾领域的,不管是 VLA 的模型,多模态的模型还是世界模型,这些的基模都源于其实千里与阶跃的合作。所以这个其实是我们第一个场景。
而车的第二个场景是座舱,座舱其实是一个非常好的空间人机交互场景。
其实大家可能也看到像特斯拉里面,像 Grok 也上了车。所以这些大模型在车里面,作为一个超级助手,其实甚至我觉得比手机更顺。这两个长期的场景我觉得现在已经在落地。
张小珺:那不可落地的比较近的。
印奇:后面我们其实还是希望能够在一些偏手持和穿戴式的设备上来做这个创新,这个品类一定不会是直接是个手机,还是一些创新品类。
3. 模型的三个关键词
张小珺:那你觉得阶跃在训模型的时候是以什么为目标呢?它是会以你们要定的产品为目标,还是以做更大的模型为目标?就是什么是牵引阶跃做模型?
印奇:我们之前在讲大模型这件事,其实之前 Sam Altman 其实也访谈过。就是说什么叫基础模型?
比如说 3.5 比 3 好在哪,或者 4 比 3.5 好在哪儿。其实你会发现基础模型是会在可能 100 个领域,每个领域都会好 10%,这是基模的这样的推进。
所以我觉得在模型侧,我觉得是有两股力量,一个叫推,一个叫拉。
推的角度是从技术的 inside 的角度,就是每一代技术从模仿学习到强化学习,会有技术的变革。这些我觉得可能在未来三年还是主因,还是因为技术还在快速的变化,底层还有很多很多创新。
但是我觉得可能另外一个因素,就是我们所谓的拉这个力量其实会变得越来越重要,就一定是需要有场景牵引的。
因为这种场景定义了你的,举个例子,你的模型的尺寸不是越大越好的。最后的模型比如说 Gemini Flash 其实也证明参数量肯定不是越大越好。
但是其实从应用角度,其实它的效率、成本、性能和你真正对于某些核心领域的这种专项优化都很重要,所以本质上是一个平衡体。
张小珺:所以现在大模型公司都在讲分化,每个公司就是有不一样的 bet,那阶跃的 bet 是终端。
印奇:我觉得应该这么讲,首先这个 bet 是基模,首先我觉得最大的分化是 做基模和不做基模。
然后这首先是一个大的 bet,这个 bet 我觉得在未来三年还要能坚持下来其实很难。
张小珺:所以未来三年你们一定会做基模,会做更大的基模,会探索技术边界,这个是一定的对吧?
印奇:而且我们很有信心,我们在未来三年一定还是能够保持在世界最一流的基模的这样一个行列当中。
所以这首先是第一个 bet。第二个就是我们的商业化。我们认为 如果我们的基模往上做场景牵引,我们就用终端来牵引。
所以这两个是我们清晰的战略路径。
张小珺:你 2026 年核心要攻坚的专项是什么?
印奇:第一点就是我们的,接下来大家会看到我们一系列的模型,从 3.5 到 4,我觉得首先我们还是把基模——因为原来我们做多模态也比较多,我们其实是希望从语言模型角度,我觉得大家还是能看到我们的语言模型要做到世界一流水平。
张小珺:为什么现在要提语言模型的水平?
印奇:因为我们其实认为几个判断,就我们自己的模型侧,我觉得我们有三个关键词。
第一个我觉得从基模角度,基模基本上 means everything。
基本上你不管是什么样的模态的模型,其实都需要基模的核心智力的水平。所以基模我觉得还是最重要的。所以展示基模也是我们展示技术能力的一个点。
第二个叫全模态,就是我们认为多模态一直是我们差异化。
我们全模态是包含文字、语音、图像这三个模态。其实我们认为基本上未来所有的模型一定是全模态的。因为你要做人机交互,要做很综合的感知,不管是数字空间还是物理空间都需要全模态。
第三个关键词我们叫 VLA。
其实你刚才也讲到,我们其实想把车的、机器人的,甚至未来手机的很多这些终端的数据。在终端里面就会有很多运动部件,或者有很多执行器件,那就是所谓的 action 那部分。
所以 VLA 我们也会成为我们基础模型的一个很重要的差异化。所以这三个我觉得可能是我们认为我们的模型未来的一个核心定位。
4. 物理数据的重要性
张小珺:我听说你们有一个联合项目,就是会把很多不同的数据都训到大脑里去,就包括智驾的数据,机器人的数据和互联网这种软件上的数据一起训到一个大脑。这是你们最后的大脑的构想吗?你对这个大脑是怎么想的?
印奇:我觉得我们认为一定是数字空间的数据和物理空间数据都融合在一个模型里。
其实这里面,其实 Google 的相关的像 Demis 这些人也都有讲过其实 Google 的相关的像 Demis 这些人也都有讲过,这点我们也是有共同的一些 believe。
就是你会发现一个语言模型看似还能解非常复杂的数学题。但你会发现它的一些基础的物理逻辑上都会出错。
所以代表就是在真正对物理世界感知和逻辑认知角度这件事缺很大的内容。所以这是为什么物理数据很重要。
但是物理数据坦白讲是缺乏的,不像互联网发展 30 年。
我自己的一个大的感觉就是说如果我们把物理空间的数据——因为人眼的数据其实你可以理解为是一个连续的视频流。
比如说像其实智驾这个大的场景,其实已经解决了很多偏大尺度的,就是室外空间的这样一个物理数据。
那现在其实可能很缺的其实是与室内的更精细化人机交互这些数据。
原则上讲,这个数据可能会来自两个部分。要么是来自于未来真正能够规模化上量的一些机器人平台收集的数据,还有一种是可能来自于人的穿戴式,比如说你的眼镜和你的穿戴式。
这里面如果能够感知你周围的数据,这些数据也是连续的,多传感器网络的这样的数据,这些数据最终它会与这个产品本身形成一个迭代,就是你的产品的体验越来越好,量越来越大,它收集的数据会越来越多。
所以整个物理空间的数据的收集和注入,还是需要有一个比较中长周期。我觉得 5 到 7 年的时间。
但是物理数据坦白讲是缺乏的,不像互联网发展 30 年。
张小珺:5 到 7 年这里面最难的应该就是机器人数据。
印奇:对 ,最难的点是机器人本质上,从它的构型的定义、传感器定义这些都还非常开放,包括它的模型都没有到这个阶段。
我们如果按 GPT-3.5 作为一个临界点,现在可能是在 GPT-1、GPT-2 的水平。 所以我觉得机器人还是有点 early heat,即过早地热起来,但是我觉得当然它也会推动更快速的发展。
5. 模型一定是 Winner Takes All
张小珺:有没有可能硬件产品不需要那么大的模型呢?
印奇:不会的。就是 当你跟一个聪明人打交道多的话,你是不想跟一个笨的模型打交道的。
所以我觉得模型一定是 winner takes all,就是你一定会选最好的模型。
但是硬件不是 winner takes all,硬件其实是可以有很多品类的。所以这也是为什么我们会选择软硬结合这条路。
五、组织战斗力:如何打赢这场仗
1. 研发组织的三个变革
张小珺:你觉得你来了以后会主导哪些新的不一样的地方?刚刚我们可能说终端。
印奇:我觉得第一个可能还是在研发本身。研发本身我觉得其实还是需要有更强更快的组织战斗力,这还是蛮重要的。
张小珺:怎么提高?
印奇:我觉得可能跟组织形式还是比较相关。
① 算法工程一体化
就比如说我讲一个算法工程的单点。算法工程这里面其实原来我们既有一些平台化的工程体系,同时我们的每个小组其实有一些小的算法工程体系。
因为在每个研究小组里面,那个工程体系其实会发现可能只能做一些辅助性工作,主要是实现算法需要的一些小的工程点。
而那些大工程平台,因为要把有些软件产品对外 to B 等等这些功能都放在一起,其实也比较难去非常好地支撑。
所以我们比如设立了整合成了一个算法工程组,这里面其实还是要更贴近算法的体系,但是要把系统工程和算法这些同学要融合在一起,这是工程角度。
② 数据直接汇报算法
第二个其实比如讲数据的话,原来我们的数据是一个独立的体系。那现在这个数据直接汇报给了算法的相关负责人。
就是因为数据其实是决定这个模型的最本质的,可能占到 70% 到 80%。
那要什么样的数据,怎么样去收集这些数据,怎么去清洗这些数据,其实是一定是算法的同学要能够非常深度去参与的。
③ One Model 多场景协同
第三点,比如说如果我们最终相信是一个 one model,就是一个模型去覆盖所有的场景和领域。
那其实他会要去拆解成可能很多很多的应用场景。比如说这可能是偏文本创作类的,这个可能是偏动图生成的,这个是偏比如说陪伴类的这些体系。
到底这些 1+N 的这些 N 跟这个 1 之间怎么能够有个好的协同关系等等,这些我觉得都需要有好的组织来去协同。
但最最关键我觉得需要有更多优秀的人才,所以我觉得也希望阶跃能够吸纳更多更好的人才进来。
大家因为我觉得其实不管是对 AGI 的坚定程度,还是对于商业化的,我觉得至少这个想得清楚的程度,我们都在大模型公司,我觉得还是很出众的。所以我觉得也相信他能够吸引到更多最顶级的人才。
2. 千里科技的后发策略
张小珺:对,这个说的是阶跃这条线,然后你还有千里的这条线。我第一次看到你入主千里的新闻的时候,我在想为什么,这场战争好像打了很久了,可能都快结束了,你怎么才来?
印奇:我自己其实千里这场仗是可能我们第一次打后发。原来我们真的都是先发。
张小珺:先发都做的很快。
印奇:以前对,都是从先发的理念。其实是从一个技术出发,然后技术上去其实是一个推的模式。从技术的原始技术创新再去找场景,就是拿着锤子找钉子这个场景。
这个我之前觉得可能还是要持续去做一些技术,技术上还是要持续做引领的。
但是其实像智驾这个场景,其实经历了可能十多年快 20 年的时间。
后来我觉得,反而是从商业模式到技术路径都不明晰。
① 技术路径已清晰
其实还是以模型驱动这条路径,就大家所谓的特斯拉路径。 在上面当然会叠加一些新的传感器,叠加一些产品的设计,那这条路径已经我觉得比较清晰了。
但其实之前其实有很多不同的赛道,包括原来就导致 Waymo 跟特斯拉这两条路线。
当然这里面其实已经基本比较融合了,就是很多底层还是以模型为驱动,而且这个模型其实跟整个大模型的语言模型也做了融合。
所以 AI 最后的大脑部分其实在走向统一的。
所以技术上其实我觉得做了很多轮迭代。所以原来的技术的很多东西不能说完全没有积累,但是很多会被颠覆掉。就因为它的原来的技术栈,包括数据,其实很多都是不可用。
② 商业模式已明朗
然后第二点其实涉及到商业模式。因为整个智驾、智舱、robot 等本质还是在整个新能源车这个行业里。
新能源车本身它在 OEM 主机厂和他的商业模式其实做了很多很多演进,所以我自己感觉这个时候下场其实是我们看到还是是一个很好的机会,也可能是一个最后的窗口期。
张小珺:最后的窗口期,这场战争还会持续多久?
印奇:我觉得三年。
张小珺:三年。第一次打后发感觉怎么样?
印奇:感觉挺好的。为什么?因为后发其实打,先发其实很多时候是更多在一些更宏观和战略层面。
其实你很多时候很难细化。因为你的很多边界条件不明朗,所以更多就是摸着石头过河。
可能基于技术的判断力相对好一点,或者在一些商业上的一些取舍适当,或者运气再好一点,可能能够有一些好的结果,但是可控性没有那么强。
张小珺:先发需要快。
印奇:先发其实我觉得需要快和对,我觉得可能也还需要大方向正确,否则沿着错误的方向快也没用。
但后发我觉得可能更比拼很综合的一些能力,包括组织力,这也很重要。
张小珺:入主千里对你来说是一个困难的选择吗?它是一个就是你思考多长时间的一个选择。
印奇:我觉得本质上我原来会觉得旷视会是我一生的事业。所以这个可能是一个重要的选择。
但是我觉得整个的想法,包括很多的目标,包括团队,其实大家还是一个大生态,是有很多延续性的。
那到千里我觉得对我来讲并不是个很难的选择,因为我们其实在 1.0 时代一直在找场景,就是相当于刚才说拿着锤子找钉子。那发现有一个最好的场景,而且又有最好的合作伙伴,我觉得这不是一个很难的选择。
但是坦白讲就是进到这个领域我们也有很大的压力。因为打后发比的是执行力,因为给你的时间窗口期很短。
后发怎么来说服你的客户?原来可能已经有很多玩家,为什么你作为最后一个入场的你可以赢?
所以这个我觉得是需要有很强的组织能力,并且要很快拿出结果,但是 so far 我觉得还是进展的不错的。
3. 智驾行业格局判断
张小珺:你怎么看现在智驾的行业格局,包括地平线、Momenta,你觉得最后会有多少家存在?
印奇:我觉得肯定会高度头部化。
因为第一个这个行业其实存在新能源车的过度竞争。就是你在真正在供应商这个角度,零部件商角度的话,它的利润率也不会很高。
如果利润率不高的情况下,而整个的智驾,包括未来座舱,都是一个非常大模型驱动的一套体系的话,它的研发成本是很高的。
如果你单台车能够收益的空间没有那么大的话,你就一定要有规模。
所以其实最终一定会形成我觉得三家左右的核心供应商,这三家供应商我觉得总体上还是有可能不说有肉吃,至少有汤喝。
张小珺:这三家都会长期存在吗?当车企开始更多的自己把智驾掌握在自己手里,你觉得……
印奇:我觉得我的判断智驾智舱不一样。
座舱可能最后车企会自研的比例会很高,因为座舱其实是高度个性化的,他也跟人机交互体验很重要,而且他未来会有很多增值服务的空间。
智驾是个安全件,所以我反而觉得智驾就像博世当年这些安全件一样,我就反而会到 Tier 1 的这个手里。
然后这 3 家为什么觉得有三家呢?首先华为肯定是一家,那已经是老大哥了。
那这里面其实我觉得这其实跟整个车企未来的 OEM 的格局相关。所以未来一定会有几家头部的车企,这些头部车企其实需要有非常综合的供应商。
这里面我觉得这样的供应商应该有两家,然后同时可能还会有中型或者中小型车企,也需要有供应商。
所以可能是一个 2+1 和 2+2 的组合,所以我觉得 3 到 4 家供应商。
张小珺:除了华为还有会有谁?
印奇:你说在大的这里面是吗?我觉得我们是有机会的。
张小珺:那地平线和 Momenta 少了谁啊?
印奇:那可以 2+2。
六、竞争格局:如何与巨头共舞
1. 中国商业的两座大山
张小珺:我感觉就是中国商业两座大山,一座是字节,一座是华为。你们好像都会碰到,准备怎么打,怎么竞争。
印奇:我觉得所有的科技公司都会碰到。字节跟华为都非常优秀。
字节我觉得是从互联网移动互联网应用往下去延伸,而华为是从底层的通讯和半导体往上去长。所以我觉得这两家公司都很伟大。
然后我觉得本质上所有的创业公司面临都是要找到你自己的长板和一个你的切口。
核心之前都讲你所竞争的不是整个公司,不是跟整个字节和华为,而是跟他那个局部的哪支部队去竞争。
所以我觉得其实创业公司,首先第一 总体还是要专注。然后第二点还是要 有你自己的核心竞争力。
比如说我就觉得我们很有信心的点在于,不管是千里还是阶跃,本质还是这帮人是非常 AI 原生的一帮人。
他们在 AI 技术的判断和研发能力还是很强的。他们需要找到一个非常好的,他们能够有一定壁垒的商业化的赛道。
把这些赛道耕耘好,把这类客户服务好,我觉得就可以活下来。
2. 不同文化的组织应该独立
张小珺:这两个公司的文化直觉感觉应该非常不一样。
印奇:对,那做大脑和做躯干的公司是应该不一样。
张小珺:你怎么同时管理这两家公司呢?
印奇:第一点,我坦诚讲,我认为不同文化的组织应该相对独立。否则你会发现会把不同的文化系在一起,会变成可能从任何一个角度都不够优秀的一个组织。
第二点,我自己感觉因为有这样的链接,大家其实有很多联系,所以我觉得互相间的配合一定能比两家不同的非生态的公司能合作,我觉得要顺畅很多。
所以我自己其实比较喜欢这个两元这件事情,就是 1、2、3 我比较喜欢 2,因为我总体觉得就像太极和阴阳一样,很多事本身就是正反两面的,这两种体系,如果能非常好的去构建,我觉得反而是能形成一些不一样的竞争力。
七、深层思考:AI 的本质与未来
1. ChatGPT 不是终极形态
张小珺:卷了也很绝望是吗?在你看来最后是豆包元宝之类的。
印奇:但坦诚讲我觉得 ChatGPT 可能不是一个特别本质的长期的 AI 的这个产品形态。
张小珺:为什么?
印奇:我觉得他的交互很不自然,他是一个对话框,是一个阶段性的成果。
甚至我都觉得他可能不是搜索那样级别的东西,它只是模型的一个 demo。
如果你要问 OpenAI 的人,他当年做 ChatGPT 可能更多的觉得它是一个很好的 demo。
所以其实 如何用 AI 的大模型去取代搜索,这是一个确定性的事情。但是它的产品形态是什么样子,我觉得现在还并不是很明朗。
张小珺:你觉得不是 ChatGPT。
印奇:我觉得不是。我们说是不是是说他往后看,比如看五年,他是不是还是那最主线的形态,我觉得不是。
是什么我也不知道,只是我觉得其实不是一个最自然的产品体系。
ChatGPT 本质上是一个 C 端的超级应用,它是你看它的从不管从日活到月活都非常大。
张小珺:它是一个阶段性的产品,还是一个长期的产品?
印奇:我觉得在境外可能是,但是并不稳固。最近看 Grok 的整个的日活起的非常非常快,所以我觉得都还在过程中,现在没有谁有特别大壁垒。
张小珺:但你觉得 ChatGPT 不是一个终极的产品形态,还是一个过渡性的。
印奇:对,所以这里面是两类,从人机交互的方式,更自然的可能是语音。
或者说你在一个对话框里,当你打开一个应用上来就是对话框。举个例子,我们曾尝试放了很多 AIGC 到这个聊天的对话框里,从数据看都不是很成功。
是因为你觉得你在一个对话框里去把 AIGC 的这些能力放进去,你会觉得交互上很不自然。所以我觉得可能产品还在演进。
2. 为什么语言模型如此重要?
张小珺:你当时会想大语言模型来了,把上一代 AI 也就是 CV 给颠覆了吗?
印奇:我倒觉得没有。因为我们其实在 1.0 这家公司,大家知道我们是一个非常 deep learning native 的,所以我们第一天就是在做 deep learning。
最早的一些大语言,国内的大语言模型的一些项目,我们都有深度参与。
所以我觉得我们其实一直是这个推动者。我一直相信的一个观点是连续性,没有什么颠覆性的东西。
如果颠覆只是说你可能缺少一些前续的信息,所以没有什么说这种颠覆感,但是它确实会 量变到质变。
所以就像阶跃函数一样,就是你在这个领域持续的累积之后,可能很多时候确实跟原来的认知是不一样。
3. 为什么选择 AI?
张小珺:AI 吸引你的到底是什么?
印奇:我觉得应该还是能够得到。第一我自己很幸运,如果 AI 没有这十几年的变化和发展,你会发现做 AI 其实也是一个很绝望的一件事情。因为技术没有变革。
AI 会解决人类很多很本质的思考,就是关于自身的很多本质思考。对于生命是什么?智能是什么?人类的来源和去处这些问题,我觉得都跟 AI 很相关。
张小珺:你自己困惑吗?
印奇:我觉得不困惑,就是我觉得应该说是有极大的动力去了解更多。
可能这是可以成为你自己生命的一个意义,因为这个问题足够重要。
八、个人成长:从理想主义到现实主义
1. 十年前后的变化
张小珺:我跟你聊天,我会觉得现在的印奇好稳重也很现实。你觉得十年前的你是这样吗?
印奇:十年前的我们还没有经过这个现实社会的拷打,我觉得本质没有太大变化。
坦诚讲可能表达方式更……因为我觉得坦诚讲,如果你有些东西没有经历过,其实你还是会对很多事情的难度是会有错误的判断的。
那当你可能经历过一些之后,其实对这个事情全貌更有一些感觉,所以你会更加审慎一些。
因为很多事情不到真正把这件事闭环之前,其实都不会下太多判断,所以更多还是更加谨慎乐观。
2. 为什么创业?
张小珺:所以你 11 年是抱着一个什么样的心态开始创业的?
印奇:第一我自己感觉首先对我来讲可能是先选的赛道,再选的方式,赛道是 AI。
就是我这辈子就是想做 AI 相关的事情。