今年以来,DeepSeek掀起国内人工智能大模型应用高潮,许多国企、医院、区县政务系统纷纷接入DeepSeek,并展开相关应用。
而早在2023年8月,马上消费金融股份有限公司(以下简称马上消费)就上线了国内首个金融大模型——天镜,并有了近两年应用经验。大模型有哪些门道?如何提升应用效率?记者采访了马上消费人工智能研究院院长陆全。
像人一样聪明,但效率高出成千上万倍
组合金融产品的投资收益,是银行客服人员最怕遇到的问题之一。
为吸引客户,银行通常会同时推出几十甚至上百种投资产品,比如我们熟悉的理财、定期存款等。如何组合投资,让客户最大限度获取收益并降低风险,这是一道复杂的数学题。传统模式下,客服人员通常要查阅文件、分头计算,找出若干方案一一比对,再把最佳方案推荐给客户。
“天镜大模型的推出,解决了上述难题。”陆全说,通过海量数据的训练,大模型瞬间能完成各种投资收益的计算,然后根据客户的风险等级和投资偏好,马上给出最佳组合投资方案。
陆全介绍,通过机器学习,大模型掌握了一套类似于人类的逻辑推理方法,遇到问题可以自行分析判断,像人一样聪明,但效率可以高出成千上万倍。
不能“为了大模型而大模型”
陆全介绍,他们很早就实现了业务的数据化,从客户画像到信用评级再到风险定价,所有信息都变成了数字,储存在机房中的服务器里。在大模型诞生之前,上述数据库的主要功能相当于资料库,大家要做业务,就要去查查。
2022年,ChatGPT上线。据此,国际国内诞生了许多模型。马上消费也通过自主研发,为自己的数据使用安装上了一款国产模型,天镜由此诞生。由此,从客户提出贷款申请到后台审批再到放贷,实现了全程无人化操作,业务效率提升了80%,人力成本降低了21%。
2025年1月,在天镜大模型2.0发布两个月后,DeepSeekR1模型问世。充分利用DeepSeek参数量大的优势,马上消费用它来标注数据,然后再把数据投喂给天镜大模型用于训练,进一步提升天镜大模型的“智商”,马上消费业务办理的准确率提升了15%。
不过,由于参数量是一般“小模型”的上百倍,DeepSeek虽然聪明,却多少有些臃肿和卡顿。“即便马上消费这样年信贷规模位居消费金融行业前列的体量,也不需要直接采用DeepSeek大模型基座,否则你的速度会很慢,”陆全称,要根据自己的实际需求,采取多种模型协同使用的策略,而不是“为了大模型而大模型”。
对冲高昂的成本,最好的办法是物尽其用
建设数字重庆,就大模型的应用而言,陆全认为:要大胆地用,但又不能拿来就用。首先,要提升自己的信息化水平。其次,要有充足的资金准备。
针对市场需求,有商家推出了一体智能机,简单地说,就是服务器上搭载了免费的大模型。但一体智能机售价不低,且一体机上用的GPU算力芯片,故障率是电脑CPU的10倍以上,维护成本颇高。算力芯片迭代速度很快,资产折旧损耗也大。
陆全认为,对冲设备成本和维护成本,最好的办法是物尽其用。目前,重庆不少单位只是在数据库上安装了大模型基座,只能满足资料的查询和生成摘要这样的简单功能。所有的业务流程都需要全部接进来,尤其是用户端,客户或服务对象要获得便利感,否则大模型只能满足自己的员工,从成本上讲很划不来,同时也有悖于数字重庆建设的初衷。