京东产业大模型:一场“价值务实”与“技术长期主义”的化学反应
导语:一方面是围绕“价值创造”的务实主义,一方面是基于更长远未来的“技术追求”,这共同奠定了京东在产业大模型领域的理念领先与成果领先。
路言| 作者 砺石商业评论 | 出品
1
大模型时代“新共识”
随着ChatGPT的横空出世,大模型便一直是2023年上半年中国科技产业的最热门词汇。不过,在进入下半年后,大模型领域却发生了一个新的变化,即“产业大模型”正代替通用大模型成为新的方向共识。
在此背后是,随着公众对大模型的研究越来越多,人们便越来越意识到通用大模型所采用的通用信息存在一些错误、谣言与偏见,且专业知识与行业数据积累不足,导致该类模型的数据“噪音”过大,行业针对性与精准度不足,无法创造出深层次的价值。
在产业场景中,专业服务要求高、容错性低,需要能够在实际场景中真正解决具体的问题。因此,企业使用的大模型必须可信、可用、可控,而且最好是经过反复与充分测试。
这一行业变化让笔者不得不佩服京东在大模型领域的前瞻判断。近半年,笔者一直对大模型领域各个企业的进展保持着密切的关注,在大模型刚开始在中国兴起时,类似百度文心一言、阿里通义千问等大多数企业都是对标OpenAI推出的ChatGPT,意在打造一个类似的无所不能的通用大模型。
而当时只有京东认为产业才是大模型的最终归宿,并在国内旗帜鲜明地提出了要做“产业大模型”的战略路径,这让笔者印象颇为深刻。京东CEO许冉后来将京东此次从产业端切入大模型,比喻为“从北坡攀爬技术珠峰”,道路虽然更加艰难,却有更波澜壮阔的风景。
时至今日,京东对产业大模型的探索逐渐成为大多数深度思考者的共识。不过,在其他企业陆续选择跟进这一战略时,京东又率先拿出了实际成果。7月13日,京东在北京召开了“2023京东全球科技探索者大会暨京东云峰会”(下称:JDD),会上京东推出了被业界广泛关注的京东言犀大模型和言犀大模型开放计算平台。
那么,京东的大模型有什么与众不同呢?
从官方表述来看,京东言犀大模型是从京东优质的产业场景与数据中锤炼而来,具备更强的产业属性。在训练时便使用了70%通用域数据与30%京东数智供应链原生数据。
2
“价值务实”下的京东大模型
除了官方表述,笔者认为要想更深入了解京东大模型的差异化,首先需要了解京东在大模型底层理念上的思考,这才是产品差异化的根源。
今年早期,一些在大模型领域有所积累的企业,在产品尚不成熟时便急于推出自己的大模型产品;另外一些缺乏技术积累的企业,则因为缺乏专业判断力,只能简单粗暴地直接模仿ChatGPT。归纳这两类企业的本质,都只是将做出大模型作为目的本身,并借此来抢占舆论关注与制造资本故事,而没有从“价值创造”的角度去思考大模型的真实应用场景。
而京东得益于其长期深耕实体经济的务实思维,其一直坚持“创造明确的价值应当是技术的目标”,所以天然便不会将单纯的做出“大模型”作为目的,而只是将其视为不断优化“成本、效率、体验”的一种工具。京东集团技术委员会主席,京东云事业群总裁曹鹏在接受采访时表示,“技术本身是没有办法直接产生价值的,技术只有放到场景里才能够产生实际的价值”。
“写写诗,聊聊天”并不能满足产业需求。JDD上,京东正式公布了对大模型价值的理解,并凝练成一个公式:“大模型的价值=算法×算力×数据×产业厚度的平方”。算法、算力与数据作为人工智能的三要素,大家都颇为熟悉,产业厚度则是指能在多少产业场景中切实应用,为社会真正创造价值。
理念的落地,还需要借助资源与能力的优势。而京东在数字供应链领域的长期深耕,为京东产业大模型的落地提供了差异化的数据优势与能力优势。
在数据方面,京东采用30%的数智供应链原生数据,涵盖了旗下零售、物流、科技、金融、产发、工业、保险与国际等核心业务。数据本身是驱动人工智能的重要力量,例如ChatGPT自发布以来,通过大量人类反馈的交互数据,效果越来越好。这种数据只有在交互中才会产生,需要动态而非静态的数据,很难在互联网上获取,这是京东的独特优势。在能力方面,京东大模型则充分融合京东在数字基础设施、产业协同与城市智能化管理领域的优势积累。
这些源于产业和内部业务场景的“人无我有”的数据与能力,最终带来了京东大模型的差异化。目前,这种差异化成果已经在京东的内部业务场景得到充分检验。
例如,在零售领域,京东商城的消费者可以从过去通过关键词搜索的交互方式,转向类似现场导购的问答式交互。当用户提问“我想去露营需要什么装备”时,系统就会自动推荐帐篷、烧烤架与登山鞋等商品。
在健康领域,京东健康利用大模型可以对用户病史信息了解地更透彻和全面,保证辅助诊疗结果能够切合用户自身特点,从而提高诊疗效果。目前,健康助手及辅助诊疗已涵盖超千种疾病专业性服务,20种评价标准保障医疗安全。
在物流领域,京东物流超脑目前基于多模态大模型很好地实现了实时交互、根因分析和智能决策,未来有望具备实时自动生成全局最优的供应链解决方案的能力。一个典型的应用场景,在对仓库布局进行分析时,只要输入“请分析在今年双11大促的布局堵点”,融入大模型技术的系统便会给出回答,“效率堵点为地狼货架数目不够,建议增加一排货架”,这大大减少了传统方法花在调研、分析上的成本。
在当前较为流行的数字人方面,融合大模型技术的京东云言犀多模态数字人,可以通过提供极少量样本素材,以对话交互模式实现从形象、音色、背景视觉、知识库到短视频等全链路内容的自动生成,支持5分钟简易拍摄,支持生成大姿态(如侧脸/走动/手势),支持动态局部高清与语义驱动的肢体动作编排,进一步降低操作门槛与操作难度,让更多中小商家与个人能够用得起、用得上数字人服务。今年618期间,言犀虚拟主播开播商家较去年11.11增幅超5倍,带动商家GMV较去年11.11增幅超246%,大幅为品牌直播间降本提效。
虽然京东大模型已经是行业内具有成熟应用实践的大模型产品,但京东依然秉持着一贯的务实主义,没有急于大规模对外开放,而是制定了京东言犀大模型的“三步走”战略。
第一步,推出京东言犀大模型的基座模型与“言犀AI开发计算平台”;第二步,让大模型在京东内部高复杂场景进行大规模锤炼;最后,大模型在内部应用中能够明确创造价值后,才针对严肃商业场景将融合行业解决方案对外输出。
而在对外输出上,京东也有着清晰的思考,即优先在数字化领先的场景落地。例如,制造产业的数智化供应链、城市智慧管理、电商数字人、金融机构数智营销与大型央企的集团化管理,数字化基础都较为扎实,会更利于大模型能力的释放。这种务实的战略,也将让京东的大模型团队卸掉短期的业绩包袱,真正做出好的、有价值的产品与服务。
目前,针对大模型融合解决方案的对外输出,京东也发布了支持企业客户专用模型研发的三大基础设施、两大平台与五大行业应用。
三大基础设施分别是言犀大模型开放计算平台、向量数据库与高性能的算力基础设施。两大平台分别是针对数据与智能交互两个核心能力的优加DaaS3.0与言犀智能服务3.0。五大行业应用分别是面向零售、金融、城市、健康与物流领域的专属方案。
其中,最值得一提的是言犀大模型开放计算平台,其沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,集成了京东技术团队研发的超100种场景的AI算法和工具,打造了低代码AI平台,可以为用户提供从数据模型到应用服务的全周期管理,实现真正的MaaS(模型即服务)。
过去,企业需要10余人的科学家团队工作,现在只需要1-2个算法人员,即可通过京东言犀AI开发计算平台完成从数据准备、模型训练到模型部署的全流程,训练效率提升2倍,推理提效6.2倍,成本节约近90%。
而对于大多数企业来说,自建大模型不仅周期长,效率低,成本高。经过内部复杂场景充分检验的京东大模型融合解决方案,则无疑是构建企业专用大模型的一种“最优解”,其势必会受到那些对大模型“望眼欲穿”的企业客户的信任与期待,我们也对京东大模型在未来的大规模开放拭目以待。
3
技术追求下的复利效应
除了注重“价值创造”的务实思维,京东对“成本、效率、体验、可信、普惠、突破”的技术追求是其在产业大模型领域拔得头筹的另外一个重要原因。
不同于很多企业的跟风,京东在ChatGPT走红之前,其实就已经在大模型领域完成了最核心的技术积累。例如在算力方面,京东于2021年在重庆落地了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,算力总规模达到135TFLOPS(每秒浮点运算次数),推理提速6.2倍,推理成本节省90%,是当时国内最大的超算集群。
在算力基础设施构建完成的同时,京东云言犀团队在算法上也取得了重大突破,尤其是具有自主产权的“知识注入的预训练语言模型”K-PLUG的提出,增强了京东大模型输出内容的可信。
目前,K-PLUG生成的商品文案已覆盖京东超3000个品类,累计生成30亿字,人工审过率超过95%,带来超过3亿元GMV,助力品牌降本增效。
在解决泛化问题上,2022年推出百亿级模型Vega,并于2023年在通用语言理解基础模型方面对织女大模型进行再升级,提出规模更大、性能更强、迁移性更好的Vega v2模型。该模型支持3D并行训练,能实现高效推理与云边协同,能够广泛应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。在国际权威的复杂语言理解任务评测SuperGLUE榜单上,Vega v2模型以平均分91.3的成绩登顶全球榜首。
Vega系列模型的夺冠证明了京东的多语言自然语言处理技术能力在超级深度学习领域的领先性。
在上述模型训练的过程中,京东在任务型对话、语义理解、语言生成等领域的能力都不断成熟,这些能力最终带来2023年更加成熟的言犀千亿大模型。所以,京东在产业大模型领域的脱颖而出,绝非是因为对GPT热潮的跟风与效仿,而是源于京东的技术追求所带来的复利效应。
4
结语
《砺石商业评论》在长期的商业研究过程中发现,商业界不是比拼谁走得更早,更快,而是比拼谁能走得更久,更远。
京东集团CEO许冉在发布会演讲中也表示,京东坚持做“难而正确的事”,坚持做实事、有价值的事和长期的事,“我们眼中的人工智能,是一场非常严肃的技术革命,需要具备长期主义的心态。京东不会把没有实现‘色香味俱全’的菜肴端上餐桌,在内部的关键场景完成了历练和实践的大模型,京东才会开放给合作伙伴,带动整个行业降本增效”。
很明显,这一轮角逐大模型落地的难点并不在于技术追赶,而在于产业突破。
京东集团技术委员主席、京东云总裁曹鹏在采访中也表示,“大模型的角逐是一场长跑,一个技术在产业里产生价值需要长周期的积累”。
一方面是围绕“价值创造”的务实主义,一方面是基于更长远未来的“技术追求”。在这样的底层思维模式下,笔者相信京东大模型也将复制京东生态内其他成功业务的进化与蝶变过程。
在自身进化与蝶变的过程中,其也将帮助千行百业的企业家们,尽快破除对大模型的陌生感与距离感,加速在研发、生产、销售与服务等具体业务场景的落地应用,切实享受到大模型为企业降本增效带来的价值。
就像之前互联网时代已经证实的那样,谁能率先利用好互联网技术完成企业业务模式的升级与重塑,谁就在过去20年间获得了最大的红利,而在人工智能技术时代亦是如此,谁能率先在企业业务场景中应用好大模型为核心的人工智能技术,谁也将有望获得未来的最大红利。