• 微信公众号

  • 官方微博

  • 官方抖音

课题研究
中美金融领域人工智能大模型的比较分析
来源:国际金融杂志     作者:汪勇     发布时间:2025-04-29

摘要

 

  人工智能大模型在中国及全球范围内都取得了显著进展,对金融数字化、智能化转型发挥了积极的推动作用。全球金融领域人工智能大模型的竞争,也受到世界各国的高度重视。当前,美国、中国同处于AI大模型的第一阵营,但中国在金融领域的应用范围、应用场景深度和数据语料基础质量方面,相较美国仍存在一定差距。差距形成的原因,主要在于科技力量和技术人才、资本投入和融资规模、算力支撑能力、中文高质量训练数据等方面。要想进一步提高人工智能大模型在我国金融领域中的应用能力,应当提升金融大模型科技水平,注重探索通用基础大模型和建立垂直金融行业平台,强化大模型在金融领域的落地应用。

 

  关键词:人工智能;大模型;数据语料;算力支撑

 

  近年来,人工智能大模型在中国及全球范围内都取得了显著进展,主流的人工智能大模型包括国外的ChatGPTClaudeGemini,以及国内开发的DeepSeekKimi、豆包、文心一言通义千问等。这些AI大模型在自然语言理解、生成、图像识别、语音识别等领域表现出色。人工智能大模型具备复杂的算法结构和完备的数据处理能力,在面对文本、音频、图像、视频和数据时,均展示出强大的解析与生成能力(欧阳日辉,2024)。人工智能大模型的兴起标志着人工智能正逐步向通用智能方向发展,而多模态下的文生图模型和视频生成模型,也正在推动人工智能技术进入多模态领域(Eisfeldt and Schubert, 2024)。同时,金融行业成为人工智能大模型落地的最佳应用领域。金融机构借助大模型可以更高效地梳理和分析海量数据,大幅提升金融服务质效,从而在激烈的市场竞争中抢占先机。

 

  目前,美国推出众多金融领域大模型,如彭博基于长期金融领域洞见,积累了高质量财经信息、数据等金融语料库,其同时采用通用数据和金融领域数据训练大模型,发布了BloombergGPT,此模型对相关金融问题具有强大的理解、分析和推理能力,实现了在金融领域多场景应用。这些金融大模型的成功应用,引发了业界的普遍关注,也反映出中美两国的巨大差距。202310月,中央金融工作会议提出,要做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章。党的二十届三中全会进一步对深化金融体制改革作出部署,提出“积极发展科技金融、绿色金融、普惠金融、养老金融、数字金融”。2025年两会中,“人工智能+”被再次提出,并首次以独立章节形式写入2025年《政府工作报告》。因此,探讨人工智能大模型对金融领域的积极作用,对比和分析中美两国在金融领域大模型开发应用上的差距,提出提升我国金融大模型应用水平的政策建议,对发展科技金融与数字金融、建设金融强国、服务实体经济与应对国际竞争均具有重要意义。

 

一、人工智能大模型对提高金融服务质效的积极作用

 

  人工智能大模型在金融领域的应用具有重要的积极意义,主要体现在以下几个方面。一是在风险管理方面,人工智能大模型能够分析和处理海量复杂数据,帮助金融机构更准确地评估风险,包括信贷风险、市场风险和操作风险,通过预测市场趋势和个别客户的信用行为,更有效制定风险管理策略和采取风控措施。二是在欺诈管理方面,金融机构利用人工智能大模型,能够提高欺诈检测的效率和准确性,人工智能大模型能够学习正常交易模式,并识别出异常行为,从而快速发现欺诈活动。三是在个性化金融服务方面,人工智能大模型可以根据客户的行为、偏好和需求提供个性化的金融产品和服务,如通过分析客户数据,可以为不同客户提供定制化的投资策略或保险方案。四是在自动化决策和效率提升方面,人工智能大模型可以自动化决策部分金融服务和流程,如客户服务、交易执行和交易报告生成,从而降低运营成本,提高金融运行效率(申么等,2023)。五是在智能投顾领域,人工智能大模型助力金融机构开展投资咨询与管理,创建智能投资顾问系统或智能机器人,提供市场分析、投资组合管理和资产配置建议。六是在信用评估领域,人工智能大模型能够综合考虑多种数据源,助力金融机构有效评估传统信用评分体系难以覆盖的客户群体,提供信用评分服务,从而扩大信贷范围(中国人民银行烟台市分行课题组,2024)。七是在市场趋势预测领域,人工智能大模型通过分析历史数据和实时信息,能够助力金融机构预测市场走势和宏观经济形势,为金融机构提供决策支持。八是在合规性管理方面,人工智能大模型助力金融机构更好地理解和遵守复杂的法律法规要求,通过自动化监控和报告来减少违规风险。可见,人工智能大模型通过提高数据处理能力、增强预测准确性以及优化客户体验,极大地提升了金融服务质效,引发了金融领域的深刻变革。

 

二、金融领域人工智能大模型的中美比较

 

  人工智能已成为全球新一轮产业技术变革的核心动能,人工智能大模型竞争也逐渐成为各国信息产业生态与技术的竞争;这是探索金融演变和引领科技产业变革的全新高地,受到世界各国的高度重视。当前,美国人工智能大模型的应用走在前列,我国与美国相比,在技术生态、场景渗透、数据质量等方面仍存在显著差距。

 

  (一)我国金融领域人工智能大模型的应用范围较窄

 

  中国的大模型发展迅速,但整体仍处于局部场景优化阶段,而美国已构建起“技术—场景—生态”的完整闭环。国内金融领域人工智能大模型应用集中于商业银行,如农业银行的ChatABC,主要提供智能搜索与工单支持服务。虽部分证券、资管机构引入DeepSeek模型辅助研报生成,但整体应用局限于客户服务与简单交易。而美国人工智能产业已拥有相对完善的生态体系,且金融领域整体数字化程度较高,成为AI大模型运用高价值的垂直领域。根据腾讯研究院发布的《2023金融业大模型应用报告》,基于行业渗透率视角,人工智能大模型在美国金融领域的渗透率已经高达到78%,远高于中国金融领域约50%的人工智能大模型渗透率。

 

  通过与大量科创企业、投资机构和研发平台合作,美国金融机构已将AI大模型广泛应用于银行、证券、保险、资产管理等各个细分领域。例如,彭博发布的BloombergGPT结合彭博累积的金融数据语料库和公开语料库,能够赋能市场行情与趋势分析、理财顾问和风险评估等,极大地增强了通用自然语言处理能力在银行、证券、资产管理等多个金融领域的应用。摩根士丹利和OpenAI合作,基于内部研究资源和数据库,结合自身数十万页语料库,训练出基于GPT-4的内部对话式AI,实现人机高效配合,提供更合理的投资建议,有效降低投顾时间成本,实现多个细分领域金融服务降本增效。

 

  值得注意的是,中国金融大模型也在快速发展。例如,百川智能发布的Baichuan4-Finance在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,实现了金融能力和通用能力的同步提升,在金融场景的整体可用性上有了一定突破。我国的大模型在金融领域的应用与美国的差距正在逐步缩小。

 

  (二)我国金融领域人工智能大模型的应用场景深度不够

 

  中国大模型在单点场景上已具备一定竞争力,但在跨场景协同能力方面仍有待提升。在数字化交易、在线支付及基础人机交互等方面已实现初步应用。例如,部分银行利用AI实现了快速转账、智能客服应答等功能,但目前这些应用主要集中在满足客户的基本操作需求上,对于复杂金融决策的辅助能力还较为有限。

 

  相比之下,美国在金融领域已将AI大模型深度应用于营销、投顾、投研、风控、承保理赔等各类场景,展现出更为成熟和广泛的应用实践。在营销方面,人工智能大模型助力精准触达客户群体,辅助金融产品和营销内容的生产环节,快速迭代营销物料,精准推荐符合客户需求的差异化产品。例如,通过分析海量客户数据,AI大模型能够识别出不同客户群体的特征和偏好,从而为银行、证券等金融机构制定个性化的营销策略,提高营销效果和客户满意度。在投顾方面,AI大模型赋能客户沟通环节,协助投顾在数据中明确客户需求和搜集有效信息,基于与AI多轮对话构建用户画像和分析市场行情趋势,推荐更加准确的投资建议,提升投顾效率。在投研方面,AI大模型通过浏览宏观政策、行业信息和公司公告等公开数据和私域数据,引入更多金融垂直类数据与语料,开展各类应用场景下的数据训练,实现公开数据和私域数据的整合分析,生成各类投资研究报告。这使得金融机构能够更全面、准确地把握市场动态,为投资决策提供有力支持。在风控方面,AI大模型通过自动分类从非结构化数据中提取关键信息,或从客户沟通等自然语言信息中识别信用风险、欺诈风险和异常交易等,及时发出风险警示,协助风控人员灵活调整风险管理策略。在承保理赔方面,AI大模型赋能投保申请、风险评估、合同审核、报价管理等渠道,提高保险承保效率和降低失误率;通过赋能实时风控、损失通知、索赔处理等流程,提升保险理赔效率和减少损失率。

 

  (三)我国金融领域AI大模型数据语料基础质量相对较差

 

  人工智能大模型作为预训练模型,需要经过大量的数据标注清洗、调优调参和宽泛训练,才能适应通用任务并进行产品内容创作,其参数级可以达到百亿级以上。因此,数据和语料的基础质量对于人工智能大模型在金融领域的落地应用至关重要。

 

  互联网研究网站W3Techs报告显示,当前全球56%的网站为英文内容,而只有1.5%的网站为中文内容,使得互联网络上英文数据容量更大、质量更高且更易于清洗,这直接提升了美国金融领域大模型的应用性能。例如,ChatGPT相较于文心一言在回答问题上表现更好,主要得益于网络上大量比较准确的英文知识类信息数据,这些数据有利于AI大模型宽泛训练。不过,凭借混合专家(MoE)架构和强化学习训练,DeepSeek在中文语言理解与生成、数学和逻辑推理任务等方面已经不逊于甚至优于OpenAI GPT-4的表现。国内大多通过微信、微博等App互动,数据语料大量储存于移动端APP,大部分内容都未在搜索引擎上建立索引,导致AI大模型在训练时难以抓取和吸收此类数据语料。同时,金融科技公司与金融机构之间的数据库又相互封闭,这些因素都降低了国内金融领域AI大模型应用所需数据语料基础的质量。此外,美国政府以公共数据开放服务于训练语料,社会力量以融合公共数据和网络公开数据提升语料广度、精细度和专业性,形成了较为完善的数据资源生态。而中国在数据资源生态建设方面相对滞后,可供大模型训练的有效数据资源呈现碎片化分散状态,中文语料、科研成果等高质量数据集开放程度低,开源后存在一定的合规隐患,使得企业更倾向于自采、自用,大模型数据流通机制尚未形成。值得欣慰的是,政府正在推动数据开放和共享,鼓励科研单位、文化单位等开放训练数据,加强AI相关数据的标识和开发利用,以促进国内AI大模型的发展。

 

三、中美金融领域人工智能大模型存在较大差距的原因

 

  当前,中国在金融领域人工智能大模型发展方面,相较美国仍存在一定差距,形成差距的原因,主要在于科技力量和技术人才、资本投入和融资规模、算力支撑能力、中文高质量训练数据等方面。

 

  (一)中国金融大模型领域的科技力量和技术人才略显不足

 

  首先,中国金融领域人工智能大模型的发布数量有了显著增长,但与美国相比仍有一定差距。20192023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。2024年,中国人工智能计算力市场迎来爆发式增长,智能算力规模达到725.3EFLOPS,同比增长74.1%,增幅是同期通用算力增幅的3倍以上。

 

  其次,中美金融领域的人工智能大模型参数规模存在差距。2020年,美国OpenAI发布的GPT-3参数规模已达到1750亿,并在零样本学习任务上实现了性能巨大提升(宋云飞、岳一飞,2023)。2023年,OpenAI发布的GPT-4大模型的参数规模进一步攀升至1.8万亿,是GPT-310倍以上,分布在120层结构中,并使用混合专家(Mixture of Experts)模式控制成本,每次前向迭代传递时需要选择两个专家组方案。同时,GPT-4大模型也具备了多模态理解与多类型内容生成能力。而中国科技厂商发布的大模型参数规模普遍处于千亿水平,如中国工商银行的千亿级大模型已在金融市场、信贷风控、网络金融等业务场景落地应用。尽管DeepSeek的模型参数也不到万亿级,但它凭借模型技术结构的优化,大幅降低计算成本同时保持高性能,已展现出接近国际前沿大模型的推理能力。

 

  最后,中国人才储备和人才吸引力虽在逐步提升,但与美国相比仍有较大差距。根据2022年入选AI2000榜单的学者国籍来看,美国学者入选1146人次,占全球的57.3%,是中国学者人数的5倍。美国对全球科技人才仍然极具吸引力,根据英国智库AI治理中心统计,在国际期刊上发表论文的美国AI专家中有三分之二并非出生于美国本土,其中华裔工程师占到这个顶尖群体数量的四分之一。不过,随着中国在人工智能领域的快速发展和政策支持,人才储备和吸引力也在不断增强。

 

  (二)中国金融大模型领域的投融资规模相对较低

 

  金融领域的人工智能大模型的软件、硬件研发投入巨大,且维持训练成本极高,对其研发和训练均需要投入大量资本。如ChatGPTGPT-1开始到GPT-4诞生,共计花费数十亿美元,ChatGPT的一次训练成本约为1200万美元。

 

  在投资方面,国际数据公司IDC测算2023年中国大模型投资规模为147亿美元,而美国投入超过了474亿美元,是中国投资规模的三倍以上。相较于中国互联网和金融科技公司更加注重场景应用,美国互联网和金融科技公司对人工智能大模型的投资更加积极。以英伟达、微软等为代表的科技巨头已成为全球AI领域最重要的“独角兽猎手”,上述公司的持续巨大投入,带动8AI明星独角兽公司在2023年拔地而起,平均轮次融资达到3.3亿美元,为美国大模型发展和研发注入了资本力量。然而,中国AI市场受制于资本规模,对大模型研发投资并不积极,投资机构更倾向于利用龙头企业的开源模型进行应用落地和解决产业技术壁垒。

 

  在融资方面,根据CB Insights统计报告测算,2023年上半年全球AI领域共计完成融资1387件,融资总规模255亿美元。其中,美国硅谷在AI领域融资42起,融资规模高达140亿美元,占世界总融资的55%;平均轮次融资金额为3.3亿美元,是全球平均融资水平的13倍。而2023年上半年中国AI领域融资161起,较2022年同期减少153起;国内融资总规模仅为61.74亿元,远落后于美国,甚至较2022年同比下降了62%CB Insights统计报告显示,2023年全年,全球人工智能领域的融资总额约为425亿美元,其中,美国的融资规模保持了绝对领先地位,占全球AI公司投资份额的53%,约为270亿美元;而中国人工智能领域的融资数量为232笔,融资总额仅约20亿美元,同比大幅下降了70%。尽管如此,随着技术的不断成熟和应用场景的拓展,中国AI大模型市场正处于爆发式发展阶段,市场规模有望快速增长。

 

  (三)中国金融大模型领域的算力支撑能力受限

 

  一方面,我国GPUAI专用加速芯片的算力支撑存在不足。金融领域人工智能大模型的算力集中消耗在训练环节,主要依赖GPUAI专用加速芯片,如ChatGPT每日支持2500万人次访问量需要至少3万张英伟达A100芯片算力支撑。目前,以英伟达为代表的美国企业在性能和市场份额上均处于全球领先地位,而中国GPUAI加速芯片等适用大模型训练场景的芯片缺乏,极大限制了国内金融领域大模型的研发能力和训练水平。

 

  另一方面,美国技术和硬件出口管制限制了中国算力支撑。2022年以来,美国在一些AI领域的关键技术和硬件方面,面向中国实施出口管制。例如,英伟达被美国政府限制向中国出口两款旗舰GPU芯片A100H100,仅可出售数据传输速率较低的芯片A800。英国智库AI治理中心分析了26个中国人工智能大模型后发现,超过一半模型的芯片都要依赖美国芯片公司英伟达。2024122日,美国政府宣布了新一轮对华出口限制措施,将140余家中国企业加入贸易限制清单,进一步加剧了中国AI芯片的供应压力。目前,国内尚未出现可实现全面国产化替代的AI芯片方案,这在一定程度上导致国内人工智能大模型的研发进度受到限制,但一些企业和科研机构正在加速推进国产化替代方案的研发工作,以期打破对进口芯片的依赖。

 

  (四)中国金融大模型领域中文高质量训练数据匮乏

 

  一方面,美国金融领域积累了大量丰富的结构化数据和金融语料库,为其人工智能大模型的研发与落地应用奠定了坚实数据基础。而中国金融领域虽然数据孤岛现象有所缓解,但数据整合与共享仍面临挑战,基础数据缺失和数据质量不高的问题依然存在,导致人工智能大模型的数据搜集、整理、清洗难度大,显著降低了金融领域人工智能大模型的应用性能。另一方面,高质量中文训练数据较为匮乏。以ChatGPT为例,其训练数据涵盖公开数据、开源数据集、私有数据集和网页爬取等,如在训练GPT-3模型过程中,ChatGPT一共爬取了31亿个网页和约3000亿词汇。ChatGPT涵盖的训练数据中有93%为英文语料数据,公开数据较多且质量较高,而中文语料数据占比不足千分之一,并且中文开源高质量数据较少,特别是缺少构建通用领域大模型的百科类、问答类、图书文献、学术论文、报纸杂志等高质量内容。不过,近期有研究者发布了CCI3.0-HQ等高质量中文语料库,这在一定程度上为中文大模型训练提供了更有力的数据支持。这反映出我国专业数据服务还处于发展完善阶段,可用于AI模型训练的经过加工、清洗、标注的高质量中文数据相对匮乏。

 

四、提升中国金融领域人工智能大模型应用的建议

 

  人工智能大模型不仅是一项人工智能技术,更是未来国力竞争与生产力提升的重要资源,对加快建设金融强国和培育新质生产力具有重要意义。在对比和分析中美金融领域人工智能大模型发展差距的基础上,本文提出提升中国AI大模型在金融领域应用水平的建议。

 

  (一)提升金融服务的科技水平

 

  国内金融机构要高度重视数字科技的力量,加快布局AI大模型技术研发,创新各类孵化器和研发平台。政府部门要用好举国体制优势,着力培养人工智能领域的顶尖技术人才,充实专业技术人才储备,积极吸引国际高端人才来华工作,助力提升金融领域人工智能大模型的科技水平,推动向具备更广泛场景应用和更强大内容生产能力的多模态AI大模型转型。同时,国内金融机构可通过自主研发或与科技平台合作的方式,运用预训练模型,并结合金融机构自身多年累积的金融数据集,包括公开的语料库和相关金融语料库等,深度整合内外部数据信息与金融资源,将大模型高效便捷地应用于各类金融业务之中。在此过程中,国内金融机构要制定并实施严格的数据保护措施,通过采用联邦学习和迁移学习等新技术,确保不同机构间可以在本地共享模型参数,而不必交换原始数据,最大限度降低数据泄露的风险。借助自然语言处理、计算机视觉、文本图像和语音识别、内容生成等技术,国内金融领域要积极探索挖掘大模型在市场交易、行情分析、财富管理、理财顾问和风险评估等金融场景的应用潜力,推动金融行业数智化转型,发挥AI大模型降低成本和提升金融服务质效的功能。

 

  (二)探索通用基础AI大模型和建立垂直金融行业平台

 

  一是借鉴美国OpenAI等公司的成功经验,致力于提升中国金融领域人工智能大模型的通用性,集成插件打造生态平台,强化与赋能办公、写作软件等各类应用巨头的合作,形成以AI大模型为通用基础层的产业协作分工,继而借助先进技术和人工智能生态,向金融各个细分领域和各个应用场景加速渗透,实现金融服务效率的大幅提升。二是要注重通用基础AI大模型的研发,强化自主研发能力。基于开源模型和海量数据,结合金融产业生态布局,打造垂直基础大模型,建立垂直金融行业的平台生态,触达金融应用场景落地,并做厚做强金融应用服务,继而助力金融强国建设,寻找中美金融领域人工智能大模型产业博弈下的弯道超车机会。

 

  (三)强化AI大模型在金融领域的落地应用

 

  一是变革金融领域的人机交互方式。加速形成人工智能大模型成为用户发布操作指令的新模态,并将其应用从搜索引擎等知识信息平台,拓展到一切人机交互型领域。这不仅能够提升既有软件的接入对话能力,实现人机交互界面变革,而且能够显著提升人机交互的友好度和功能性,从而激活软件服务的增量用户市场,提升金融服务的数字化、智能化水平。二是丰富数字产品类型。强化金融领域人工智能大模型的落地应用,利用AI技术,引入新一批类AI-first应用,继而丰富营销、投顾、风控、中后台管理等各类金融服务场景的数字产品类型,提升金融服务质效。三是重构应用开发流程。借助人工智能主导的“模型即服务”商业逻辑,重构应用开发流程,帮助传统金融机构低成本构建金融服务应用模型,继而降低金融服务的获取成本。四是塑造全新流量入口。借助人工智能大模型技术,在用户需求与各类金融服务之间,基于自然语言交互构建新兴生态平台,塑造移动互联网之后的全新流量入口,从而扩大普惠金融范围和金融交易可能性(刘志雄,2024),充分发挥数字科技的长尾效应。

 

  (四)推动我国人工智能产业长远发展积极应对国际竞争

 

  金融领域的人工智能大模型技术作为新兴科技生产力,已成为科技封锁和保护主义对象的趋势愈发明显。当前,中国在这一领域仍处于追赶者角色,类ChatGPT产品及其下游应用产业对于我国金融、经济和科技发展的意义重大,而半导体产业“卡脖子”的前车之鉴发人深省。未来我国AIGC产业应对国际竞争,需要立足长远战略,采取以下措施:一是打造国家级产业基金,积极引入各类投资资金,加大人工智能领域的资本投入;二是打破美国技术和硬件出口管制限制,加速国家层面的GPUAI专用加速芯片研发,提升我国金融领域AI大模型的算力支撑能力;三是提高金融业整体的信息化水平,缓解金融行业内的数据孤岛问题,开展金融领域大模型数据语料的搜集和整理工作,进行高质量中文训练数据的加工、清洗、标注,提升基础数据语料质量。

 

  作者系中国社会科学院金融研究所副研究员


新时代金融发展研究院由首都经济贸易大学 中国金融思想政治工作研究会主办
京ICP备2024077778号-2
电话:010-63366566 邮箱:jrfzzk@126.com
关于研究院
未经书面授权禁止复制或建立镜像
Copyright © 新时代金融发展研究院版权所有