放弃训练万亿大模型后,零一万物在国内接入 DeepSeek 专做企业 To B

内容摘要作者 | 洪雨欣编辑 | 陈彩娴3 月 17日,零一万物正式对外发布了万智企业大模型一站式平台,并宣布可提供企业级 DeepSeek 部署定制解决方案,打响了大模型“六小虎”全面拥抱 DeepSeek 基座模型的第一枪。DeepSeek 专

作者 | 洪雨欣

编辑 | 陈彩娴

3 月 17日,零一万物正式对外发布了万智企业大模型一站式平台,并宣布可提供企业级 DeepSeek 部署定制解决方案,打响了大模型“六小虎”全面拥抱 DeepSeek 基座模型的第一枪。

DeepSeek 专注 AGI,主要资源投放在基础模型的训练与能力升级上,只对外提供 API 服务、没有深入接触行业客户,这给了第三方厂商如云厂商、AI Infra 厂商结合自身计算资源提供一体机等服务的机会。

如今,零一万物也接入 DeepSeek、与自家模型一起捆绑对外提供企业级模型服务,意味着大模型创业公司的竞争出现了新的形式:拥抱 DeepSeek 或不拥抱 DeepSeek,成为新形势下的选择,而放弃预训练万亿级规模以上大模型、专注轻量化模型训练部署的零一万物选择了前者。

DeepSeek 的出圈有一块“法外之地”,就是企业级模型的私有定制化部署。此外,DeepSeek 当前只有语言模型,多模态能力还未提升,也给了模型厂商机会。

万智企业大模型一站式平台

在将 DeepSeek 落地产业过程中,现有的“DeepSeek Inside”的企业解决方案普遍存在着部署难、应用难、定制难三大核心痛点。

自2024年底宣布针对 2B 智能化转型市场的战略聚焦一系列动作后,零一万物针对 DeepSeek 模型私有化专业部署的市场痛点,将全链条技术管线复用到 B 端的模型私有化部署场景,推出了万智企业大模型一站式平台。

基于这一平台,零一万物首发面向企业客户提供企业级 DeepSeek 部署定制解决方案,涵盖了 DeepSeek 模型部署、应用实践以及模型微调工具。在确保数据安全的前提下,将 DeepSeek 嵌入企业业务体系,快速支持行业模型定制和应用创建,让原本的开源 AI 模型真正成为完整、合规且安全的一站式解决方案。

除 DeepSeek 全系列模型外,万智企业大模型一站式平台还适配了阿里巴巴通义千问(Qwen)、零一万物 Yi-Lightning 等国产最新主流模型。

基于目前行业内所面临的部署难、应用难、定制难等三大难题,零一万物万智企业大模型一站式平台为企业规划了DeepSeek 落地“三步走”步骤,并提供了针对性的解决方案:

安全部署:开箱即用的企业AI底座

对于算力储备薄弱的企业,零一万物将联合头部硬件厂商推出软硬集成式一体机方案,预装高性能 GPU,内置 DeepSeek 全系列模型,部署周期缩短至小时级,助力企业快速上手 671B 参数的满血增强版的 DeepSeek-R1 模型。

应用实践:一键生成企业专家Agent

DeepSeek + 知识库 RAG:构建企业专属知

DeepSeek + 知识库 RAG:构建企业专属知识大脑。

DeepSeek + 智能体 Agent:智能体驱动业务自动化。

DeepSeek + DeepResearch:生产深度专业级报告

行业定制:专业微调让DeepSeek进化更懂行

零一万物给出基于 DeepSeek-R1 的成熟微调方案,企业能够在万智企业大模型一站式平台上,基于自身企业数据库对 DeepSeek-R1 进行模型微调,使之符合垂直领域的业务需求。

对话零一万物

在万智企业大模型发布之际,零一万物的CEO李开复博士、零一万物COO黄蕙雯等人也针对各类相关问题进行了回复。

AI 科技评论筛选了部分有行业启示性的问题发布如下

Q:目前大模型赛道 ToB 商业化团队不少被调整,原因是什么?零一万物重注商业化 ToB 的商业化天花板有多高?最看好什么赛道?

李开复:过去整个大模型行业 ToB 碰到挑战的原因,一方面是因为中国还没有经历所谓的ChatGPT时刻,模型赋能后企业能得到的价值也不够大。另一方面,过去是模型厂商大幅砍价去争招标,最后厂商都赚不到很多钱。

今天很多企业客户都觉醒了,有了DeepSeek Moment之后,很多企业对大模型赋能自身业务抱着很大的希望,也愿意在自己的公司去尝试接入,并且用在更核心的业务场景,所以我认为,未来会有更多的企业下决心拥抱大模型。

零一万物的管理层有些来自于创新工场,有些是成熟的创业者,也有大厂商业化团队的高管。我们能够看到,在不同行业,大模型将带来不同的价值,我们会最认可下面几种业务:一类是能快速利用大模型带来收入;一类是愿意下决心用大模型改造自身核心业务的。

Q:基座模型用的都是 DeepSeek 开源模型,内部应用界面是用的 Dify 开源方案,是不是有点依赖于开源方案?

黄蕙雯:对于企业来说,重要的是能够把模型快速用上,开源且相对好用、标准化的工具可以加速效率。关于DeepResearch、联网搜索等功能都来自于零一万物过去 ToC 的产品的积淀,我们在某些垂类技术的技术组件上积累了大量相关的开发经验。

Q:零一现在还做预训练和 Infra 吗?现有的技术团队怎么样赋能包含万智在内的产品线?

黄蕙雯:关于预训练和Infra,我们的模型还是每天在运维。在策略上,我们不再投入做万亿参数以上超大规模的模型,主要是做中规模尺寸、性价比高的模型。

目前MoE的路线上还在做V2,下一个阶段会关注多模态跟其他能力的整合,满足企业日益增长的大模型需求。

我们现阶段的预训练跟Infra,基本上每一个组都聚焦企业服务和落地的解决方案,整体做更高性价比的选择,所以在团队搭配上相对比以前组织更精炼,也更敏捷。

Q:零一要开始做定制化开发了吗?这种模式会不会很重?

零一万物企业解决方案技术负责人王猛:定制化开发在过去确实是一个长周期重交付的事情,但现在AI coding的能力越来越强,可以帮助我们完成很多交付,这也是对行业根本性的颠覆。除此之外,我们整个产品的中台有强大的扩展性,比如Dify是workflow的引擎,它是可插拔的,所以面对各类定制化的需求我们都比较能够从容应对。

问:零一万物的万智这么迅速推出,在哪个行业和应用场景得到验证?

零一万物全球解决方案与交付总经理宁宁:万智集成了 RAG(检索增强生成)、联网搜索、多模态文档解析、高精度 OCR,以及 AI PPT 生成等功能,覆盖了从数据处理到内容生产的多个环节。这些组件不仅在我们的 ToC 产品中得到了验证,也在零售、金融、制造、能源等 ToB 行业成功应用。比如,零一万物与某上市游戏公司合作游戏大模型,与中细软合作知识产权大模型,与倍漾量化合作金融大模型,还与中国移动、物美等企业在不同垂直行业场景持续探索。

问:零一万物国内做ToB、海外做ToC的战略是否会一直持续下去呢?

黄蕙雯:在海外,ToC某些品类的用户体量不大,但用户付费意识和意愿非常高。我们在海外一直有收入,有稳健增长ToC的产品。国内目前ToB需求非常旺盛,但是ToB真正落地还做不到即插即用。AI需要市场,市场也需要AI,这中间还是需要多方非常紧密合作。现在国内经济需要各种增长引擎,AI肯定是企业主非常重视的一块。

问:跟地方政府的合作接下来还有什么新的规划可以分享吗?

黄蕙雯:零一万物在苏州落地了产业大模型基地,会针对苏州重点发展的产业,如制造、金融、政务等进行深度探索,同时我们也会开放跟其他地方政府与地方垂直行业的龙头企业合作。

问:在DeepSeek带来冲击之后,零一万物自己做了哪些调整?

黄蕙雯:最大的调整是,我们不再执着于只推 Yi 模型,会聆听市场的变化和需求,采取“开放模型”的策略。过往我们的研发只专注于自研Yi模型,现在我们研发工作必须要兼容适配国内优秀的 Top3 国产模型。未来有更好的模型和侧重不同能力的模型,都会纳入到零一万物技术解决方案里,把通用模型能力转化为ToB的落地解决方案。

问:零一还会继续投入做底模的迭代吗?

黄蕙雯:我们明确不会再做万亿以上超大参数的巨模型,现阶段的重点是能把AI推到市场上,让市场不只歌颂AI,而是真正能用上AI。

问:零一万物的Infra、数字人业务还是否提供服务?

黄蕙雯:都会提供,数字人在万智企业大模型一站式平台上也是一个应用选项。我们会把过往尝试和积累的不同产品线凝练成为功能模块,一同纳入到新的一站式平台上提供给客户做产品。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1