睿思智联发布Rise Router: 企业Token的统一调度和运营中心
创始人
2026-05-06 14:50:02
0

进入 2026 年,企业 AI 投入的关注点已经从"能不能跑起来"转向"怎么管起来"。

License 时代企业按软件许可证收费,进入 Token 时代后,一切按 token 结算——而企业的 token 来源不再是单一渠道。一个典型的客户使用场景:内部信创集群跑着核心业务的本地推理;业务部门的非敏感场景在调用外部国产大模型;某些前沿能力诉求的业务团队还接入了模型聚合平台或公有云 MaaS。每一类通道都是独立的 API、独立的 Key、独立的计量、独立的合规口径。

"多通道并存"本身合理——按场景选模型是对的,问题在于这些 token 流量缺乏一个统一入口。各部门重复对接、Key 散落各处、内外计量分两套账、合规审计断在边界——这些都是 Token 时代真实存在的治理缺口。

睿思智联最新推出的 Rise Router,定位为企业大模型 Token 流量的统一入口与治理面。业务侧通过一个端点调用所有 LLM 能力,Router 内部按策略将请求分流到本地推理或外部受管渠道;财务、合规、运维在同一治理面上看到全部 LLM 消费。

所有 LLM 流量都从 Rise Router 进出

睿思智联Rise Router 在客户私有化环境中位于 Rise ModelX 之上:业务应用对接 Router,Router 根据策略把请求分流到底层各类推理通道。Rise ModelX(以及背后的 Rise VAST、Rise CAMP 信创算力底座)是 Router 可路由的本地通道之一,与外部受管控渠道并列。

Router 当前可路由的通道覆盖六类:

本地推理(Rise ModelX 上的 vLLM / SGLang / MindIE);

国产大模型(DeepSeek / Qwen / 智谱 / 讯飞 / Kimi / MiniMax 等);

公有云 MaaS(百炼 / 千帆 / TI / MA);

模型聚合平台(硅基流动 / 火山方舟);

国外模型(部分业务确有需要时按需接入);

企业自选 BYOC(将客户已有的第三方 API Key 托管进 Router 统一治理)。

六大核心能力

统一 OpenAI 兼容入口

业务侧统一端点,屏蔽本地推理(vLLM / SGLang / MindIE)和外部渠道之间的协议差异。自动注册端点,HTTP/HTTPS 双端口同时服务,MCP / Function Call / JSON Mode / 流式 SSE 全部兼容。

内外分流智能路由

按数据敏感度、成本、模型能力、上下文长度、请求内容自动选路径,并按任务类型(对话 / 代码 / 长文本 / 多模态)匹配最合适的模型;可与企业既有的数据分级、大模型围栏类治理组件协同对接,相关分类与拦截策略统一在治理面落地执行。虚拟 ModelName 让路径切换业务无感;故障自动降级到备用通道,多 Key / 多账号 / 多地域负载均衡分担高并发。

Key 与凭证集中托管

上游厂商 Key、Rise ModelX 内部凭证、租户/项目/用户多维授权、Key 轮转与吊销、访问策略(时间计划、IP 白名单、限频限次)统一在 Router 治理面。业务应用不持有任何外部 Key。

双轨 Token 计量(GPU + API)

本地 Rise ModelX 的 GPU 时长计费与外部 API 的 Token 计费并轨归因,按租户/项目/业务线/API Key 多维度展示在同一套 FinOps 看板。

预算控制与防失控

租户和业务线级预算硬上限,触发后自动降级、告警或硬阻断;成本异常告警、闲时/夜间调度、限频限次多层防护,防止 Agent 失控消耗或人为误用。

出站合规审计

完整请求链路日志覆盖内外全流量,包括 PII 拦截、敏感词过滤、多模态出站审计;配合企业数据分级与大模型围栏策略对出站行为做受控管理,满足金融、央企的合规审计要求。

适用客户与典型场景

Rise Router 客户的共性是:本地有信创算力基座(如 Rise CAMP 管理下的昇腾、昆仑芯、寒武纪等国产算力),同时业务增长产生外部 token 补充需求 + 非敏感业务降本诉求 + 合规对外出网审计需求等等。

三个典型场景:

按敏感度与场景一体化路由:Router 与企业既有数据分级、大模型围栏类组件协同,依据其判定结果将敏感请求路由到本地 Rise ModelX 推理,其他流量按成本或能力受控外放;本地满负荷自动溢出,上游故障自动降级到备用通道。出站请求全程留痕,满足金融/证券等高合规场景的监管审计要求。Agent 统一调用大模型能力:Agent / Copilot / RAG 通过 Rise Router 调用本地与外部模型,MCP / Function Call / JSON Mode / 流式 SSE 全部兼容;限频限次和预算硬上限防止 Agent 失控消耗;多模态(文本 / 图像 / 音视频)全覆盖。多渠道灰度与模型择优:同一业务挂多家上游渠道(本地 Rise ModelX、国产大模型、公有云 MaaS、聚合平台),按流量比例灰度,效果指标和 Token 成本同台回收。既支撑国产化迁移过渡期的新老双写对比,也让业务团队基于真实线上数据做模型选型,而不是凭厂商跑分。

结语

外部大模型能力很丰富,本地信创集群也是必备底座。两者能否在企业内部协同顺畅,取决于中间是否有一个统一的治理层。Rise Router 把这个层做成了一个产品:所有 LLM 流量从它进出,业务侧、财务、合规在同一治理面上看到全貌。

相关内容

巴萨小姐姐:刚嘲笑完皇马 ...
巴萨小姐姐:刚嘲笑完皇马 自家就被两球带走
2026-05-06 11:02:07
北京大兴机场“五一”假期预...
来源:滚动播报 (来源:北京商报) 北京商报讯(记者 吴其芸)4月...
2026-05-06 11:01:32
群星集结百步穿杨,射箭世界...
百步穿杨耀浦江,群英逐鹿射锋芒!5月5日至10日,2026现代汽车...
2026-05-06 11:01:17
国家下达1000万元!支持...
为促进云南优秀传统文化和宝贵自然遗产整体保护和活态传承,省发展改革...
2026-05-06 11:00:56
黄山屯溪打造徽州文化盛宴
(来源:新安晚报) 转自:新安晚报 本报讯 “五一”假期,黄山市...
2026-05-06 11:00:40
五一假期海南三大机场预计保...
记者从海南机场集团获悉,2026年“五一”假期(5月1日至5月5日...
2026-05-06 11:00:40
原创 ...
据4月29日报道,在美国冰球界,一场关于包容与禁令的拉锯战正在上演...
2026-05-06 11:00:29
祝贺!世界青年举重锦标赛,...
北京时间5月6日凌晨,在2026世界青年举重锦标赛第4个比赛日中,...
2026-05-06 11:00:07

热门资讯

AI产业链方向集体走强,关注科... 5月6日早盘,AI产业链方向集体走强,截至午间收盘,上证科创板人工智能指数上涨7.4%,中证科创创业...
原创 普... 但在这场狂欢的背后,有一个群体却在深夜里瑟瑟发抖,那就是无数做AI应用层的创业者和开发者。 巨头们的...
原创 普... 最近刷到一个让人意想不到的新闻——日本,这个之前在西方阵营里最积极喊着制裁俄罗斯的国家,居然从普京手...
睿思智联发布Rise Rout... 进入 2026 年,企业 AI 投入的关注点已经从"能不能跑起来"转向"怎么管起来"。 Licens...
原创 五... 去年8月份,沈阳精酿交易中心近日在中街大悦城步行街开业,号称“东北首个啤酒交易所”。 显示实时价格和...
马斯克同意支付超1000万元罚... 美国证券交易委员会(SEC)与马斯克就收购推特期间的违规诉讼达成和解,相关法庭文件正式提交。 根据协...
美伊局势重要信号!美媒分析:特... 美东时间周二(5月5日)傍晚,美国总统特朗普(Donald Trump)意外宣布,“疏导”霍尔木兹海...
赋能中医药文化传承!罗浮山国药... 近日,广东罗浮山国药股份有限公司与刘小宝团队战略合作签约仪式在惠州罗浮山国药总部举行。双方将携手打造...
避开霍尔木兹海峡!全球最大航运... 全球最大航运公司地中海航运公司2日发布公告称,公司推出一项从欧洲经红海至中东的新快运服务,以响应日益...
原创 特... 5月5日,美国财政部公布了2026财年第一季度的借款数据,总额高达5770亿美元。同时,财政部还同步...