度小满金融大模型论坛|邬贺铨院士:金融大模型要走合作开发的路径
10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士、原互联网协会理事长邬贺铨、度小满CEO朱光,浦发银行、平安银行、泰康保险、麦肯锡等十余位高管、数百位金融从业者出席论坛。
邬贺铨院士认为,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。
大模型的技术门槛很高,邬贺铨认为,除了工农中建这些大银行,大部分金融机构并不具备金融大模型有私有化部署的能力,而且大模型私有化部署面临两个挑战:一是金融行业人工智能人才是不足的,所以即便金融大模型有私有化,仍然离不开大型的互联网企业支持,否则的话纯粹金融企业封闭来开发一个大模型,只引用金融数据量而通用数据不足,很难会出现涌现能力。
还有一点就是纯粹的本地私有化部署需要自建算力设施,对于信创的要求比较高,带来的成本也相当高。对于怎么既能解决既要满足大型金融企业对风控的要求,又能够很好的发展大模型,他建议在目前金融大模型上有一些场景对这种安全性、隐私性的要求没那么高的情况下,还是可以跟互联网企业合作开发,比如说金融企业对于员工的培训以及对客户的一些解答,包括智能客服还有一些金融企业常用的代码优化这些跟风控的关系不是非常密切。
对于中小的金融企业,邬院士建议,更多的是走合作开放行业大模型的路径,可以有两种模式,一种是“中心化模式”,垂直行业可将企业数据交基础大模型进行再训练,待调优至理想后再进行知识蒸馏、量化及针对特定场景迁移等缩小模型的工作。企业调用基础大模型的API叠加到SaaS上增强软件工具能力。但后续模型微调和云边端部署等仍需算法工程师支撑,且企业数据交到模型公司有泄露风险,但数据不开放则训练效果差。
另外一种是“非中心化模式”,把基础大模型的算法拿到企业里面来,然后在企业的专有数据拿过来的大模型上进行微调,形成一个缩减版的大模型,或者形成基于实际业务的小模型。但这种做法预训练和微调的数据可能存在矛盾,且用于微调的专业语料不足将影响模型学习效果。
“度小满的开源金融大模型‘轩辕’将预训练数据和指令数据随机混洗到一个训练数据中进行混合微调,通过多阶段逐渐训练解决了训练的数据跟垂直行业数据之间的不匹配、不兼容的问题,提高了模型的表达、理解、迁移和泛化能力”,邬院士表示,“轩辕大模型通过大规模融合高质量的金融专业预训练和指令数据,并且针对金融行业进行了能力的优化,保持了通用能力的同时,提高了金融的专业能力,在‘轩辕’大模型的底层模型上,金融企业可以在上面继续做自己的开发和私有化部署”。
对于人工智能对金融行业未来的影响,邬院士认为,随着生成式人工智能技术的出现,现在通过大算力可以突破算法的演进瓶颈,人工智能赋能了新一代IT的创新,大模型驱动了数字化的加速,通过大模型,小切口可以融入云平台,推动了普惠金融的落地,大宽带、大连接、大平台、大模型,使得我们金融业从互联网时代的网上银行到移动互联网时代的手机银行,到大模型时代的数字银行,“大模型改变融科技范式,开拓了金融业的新生态,开启了数字化新时代”。
度小满CEO朱光表示,“未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。度小满将不断加大金融垂类大模型及应用的布局和投入,和业界一起把握机遇,推动新一轮金融科技发展浪潮。”
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。
热门文章
