机器学习总监洞见 [第 3 部分:金融版]
如果您有兴趣更快地构建机器学习解决方案,请立即访问 hf.co/support!
👋 欢迎回到我们的“机器学习总监洞见系列”,本期是金融版!如果您错过了之前的版本,可以在这里找到:
金融领域的机器学习总监们面临着独特的挑战,他们需要在遗留系统间穿梭、部署可解释的模型,并维持客户信任,同时还要应对高度监管的环境 (以及大量的政府监督)。每一个挑战都需要深厚的行业知识和技术专长才能有效驾驭。以下来自美国合众银行、加拿大皇家银行、穆迪分析以及前彭博人工智能研究科学家的专家们,将共同揭示机器学习与金融交叉领域的独特宝藏。
您将听到一位前希腊全国青少年网球冠军、一位拥有超过 100 项专利的出版作家,以及一位曾在世界最古老的马球俱乐部 (加尔各答马球俱乐部) 定期打自行车马球的球员的分享。他们都转型成为了金融机器学习专家。
🚀 伙伴们,系好安全带,以下是来自金融界机器学习领军人物的顶尖洞见。
免责声明:所有观点均来自个人,不代表任何过去或现在的雇主。
Ioannis Bakagiannis
背景: 充满热情的机器学习专家,拥有提供可扩展、生产级别和最先进机器学习解决方案的经验。Ioannis 还是 Bak Up Podcast 的主持人,并致力于通过人工智能对世界产生影响。
趣闻: Ioannis 曾是希腊全国青少年网球冠军。🏆
加拿大皇家银行 (RBC): 世界领先的组织将加拿大皇家银行资本市场视为资本市场、银行业和金融领域的创新、可信赖的合作伙伴。
1. 机器学习 (ML) 如何为金融业带来积极影响?
我们都知道机器学习是所有行业的颠覆性力量,同时不断创造新的商业机会。许多金融产品因机器学习而产生或改变,例如个性化保险和定向营销。
颠覆和利润固然很好,但我最喜欢的金融影响是机器学习引发的关于金融决策信任的讨论。
过去,像贷款审批、利率确定、投资组合管理等金融决策都是由具有相关专业知识的人来完成的。本质上,人们信任“其他人”或“专家”的金融决策 (并且常常不加质疑)。
当机器学习试图自动化这个决策过程时,人们开始问:“我们为什么要信任一个模型?”。模型看起来像是要取代诚实工作者的厄运黑匣子。但这种争论引发了关于金融决策中信任和道德的讨论,无论涉及的是人还是物。
作为一个行业,我们仍在定义这场对话,但得益于机器学习在金融领域的应用,透明度更高了。
2. 金融领域内,机器学习面临的最大挑战是什么?
我不能代表所有公司,但成熟的金融机构面临一个持续的斗争,就像所有历史悠久的组织一样:遗留系统。
金融组织已经存在很长时间了,并且随着时间的推移不断发展,但今天它们发现自己某种程度上变成了“科技公司”。这样的组织需要融入尖端技术,以便与新兴的竞争对手抗衡,但同时也要保持使我们的金融世界正常运转的稳健性。
这种内部斗争受到机构风险偏好的影响。金融风险通常随着你提供的解决方案的规模线性增加,因为我们谈论的是钱。但除此之外,系统故障还会引发其他形式的风险,例如监管风险和声誉风险。这种复合风险,加上将一个庞大、成熟的系统迁移到新技术栈的复杂性,至少在我看来,是采用像机器学习这样的尖端技术最大的挑战。
3. 在尝试将机器学习集成到金融应用中时,您观察到的常见错误是什么?
机器学习,即使在最近备受关注的情况下,在软件工程领域仍然是一个相对较新的领域。机器学习应用的部署通常不是一个定义明确的过程。艺术家/工程师可以交付一个机器学习应用,但它周围的世界仍然不熟悉这个技术过程。在技术世界和非技术世界的交叉点上,我看到了最多的“错误”。
很难为正确的业务和机器学习关键绩效指标 (KPI) 进行优化,并定义正确的目标函数或期望的标签。我见过一些应用因为不期望的预测窗口或因为预测了错误的标签而付之东流。
最糟糕的结果是,这种不一致没有在开发阶段被发现,而是进入了生产环境。
然后,应用程序可能会产生不希望的用户行为,或者干脆测量/预测错误的东西。不幸的是,我们倾向于为机器学习团队配备工具和计算资源,但没有提供坚实的流程和沟通缓冲。在一个定义不明确的流程开始时的错误会随着每一步而增长。
4. 关于机器学习的未来,什么最让您兴奋?
很难不对机器学习领域涌现出的所有新事物感到兴奋。这个领域变化如此之快,令人耳目一新。
目前,我们擅长解决单个问题:计算机视觉、下一个词预测、数据点生成等,但我们还未能同时解决多个问题。我很高兴看到我们如何能够用目前看起来相互矛盾的数学表达式来模拟这些行为。希望我们能尽快实现!
Debanjan Mahata
背景: Debanjan 是穆迪分析人工智能团队的机器学习总监,同时也在印度德里信息技术学院 (IIIT-Delhi) 担任客座教授。他是一位活跃的研究者,目前对自然语言处理 (NLP) 中的各种信息提取问题和领域自适应技术感兴趣。他在制定和应用机器学习到各种用例方面有良好的记录。他积极参与机器学习领域不同顶级会议的程序委员会。
趣闻: Debanjan 小时候曾在世界最古老的马球俱乐部 (加尔各答马球俱乐部) 打过自行车马球。
穆迪分析 (Moody's Analytics): 提供金融情报和分析工具,支持我们客户的增长、效率和风险管理目标。
1. 机器学习 (ML) 如何为金融业带来积极影响?
机器学习 (ML) 在金融行业以多种方式产生了显著的积极影响。例如,它帮助打击金融犯罪和识别欺诈交易。机器学习在“了解你的客户 (KYC)”筛查和“反洗钱 (AML)”等应用中已成为一个关键工具。随着全球金融机构的反洗钱罚款增加、制裁领域不断变化以及洗钱活动的复杂性加剧,银行正在增加对 KYC 和 AML 技术的投资,其中许多技术都由机器学习驱动。机器学习正在彻底改变该行业的多个方面,特别是通过自动化各种流程和帮助分析师更高效、更准确地完成工作,从而带来巨大的效率提升。
机器学习的一个关键有用特性是,它可以从大量数据中学习并发现隐藏的模式。随着对数字化的关注,金融行业产生的数字数据比以往任何时候都多,这使得人类难以理解、处理和做出决策。机器学习正在帮助人类理解数据,从中获取信息,并做出明智的决策。在穆迪分析,我们正在使用机器学习帮助我们的客户更好地管理风险,并满足业务和行业需求。
2. 金融领域内,机器学习面临的最大挑战是什么?
在不影响真正例的情况下减少假正例 —— 在监管科技领域,许多使用机器学习的应用依赖于警报。由于严格的监管措施和错误决策带来的巨大财务影响,人工调查可能既耗时又要求高。机器学习在这些场景中无疑有助于协助人类分析师做出正确的决策。但如果一个机器学习系统产生大量的假正例,它会使分析师的工作更加困难。在金融领域,找到正确的平衡点是机器学习的一个重要挑战。
基础研究与教育中的机器学习与金融中的机器学习之间的差距 —— 由于金融行业的受监管性质,我们看到在机器学习领域,基础研究和金融部门之间的思想、数据和资源交流有限。当然也有少数例外。这导致了为满足金融行业需求的机器学习研究发展不足。我认为必须做出更多努力来缩小这一差距。否则,金融行业将越来越难以利用最新的机器学习进展。
遗留基础设施和数据库 —— 许多金融机构仍在使用遗留基础设施,这给应用现代机器学习技术,特别是集成它们带来了挑战。在开发新基础设施和使机器学习专业人员能够创新并产生更大影响方面,金融行业可以从科技行业借鉴关键思想、文化和最佳实践。在整个行业中,将机器学习投入运营无疑存在挑战。
数据和模型治理 —— 在这个领域需要进行更多的数据和模型治理工作。随着我们收集越来越多的数据,收集高质量数据和正确数据的努力也应相应增加。当机器学习模型参与决策时,需要采取额外的预防措施。需要为不同的金融应用开发适当的模型治理措施和框架。这个领域的一个巨大挑战是缺乏将数据和模型治理操作化的工具和技术,而这对于在该领域运行的机器学习系统通常是必需的。还应做出更多努力来理解训练模型的数据中的偏见,以及如何使其成为整个过程中缓解偏见的常规做法。确保可审计性、模型和数据血缘关系对于机器学习团队来说一直是一个挑战。
可解释性和可理解性 —— 开发既高度准确又可解释和可理解的模型是一个巨大的挑战。现代深度学习模型通常优于更传统的模型;然而,它们缺乏可解释性和可理解性。金融领域的大多数应用都要求可解释性。采用该领域的最新发展并确保开发具有可解释预测的可解释模型一直是一个挑战。
3. 在尝试将机器学习集成到金融应用中时,您观察到的常见错误是什么?
- 没有很好地理解数据,以及基于这些数据训练的机器学习模型所做的原始预测。
- 不分析失败的尝试并从中学习。
- 不了解最终的应用及其使用方式。
- 在简单的解决方案可能就足够的情况下,尝试复杂的技术。
4. 关于机器学习的未来,什么最让您兴奋?
现代机器学习模型如何利用大量数据进行自监督学习,从而学习文本、音频、图像、视频、代码等的丰富表示,这真的让我大为震惊。未来无疑是多模态的,通过机器学习的视角理解多模态内容方面已经取得了持续的进展。我认为这在不久的将来将扮演关键角色,我对此感到兴奋,并期待成为这些进步的一部分。
Soumitri Kolavennu
背景: Soumitri Kolavennu 是美国合众银行企业分析和人工智能组织的高级副总裁兼人工智能研究负责人。他目前专注于基于深度学习的自然语言处理、视觉和音频分析、图神经网络、传感器/知识融合、时间序列数据,应用于金融系统中的自动化、信息提取、欺诈检测和反洗钱。
此前,他在霍尼韦尔国际公司工作期间,担任过 Fellows Leader 和高级研究员,致力于物联网和控制系统在智能家居、智慧城市、工业和汽车系统中的应用。
趣闻: Soumitri 是一位多产的发明家,在控制系统、物联网、无线网络、优化、涡轮增压、语音识别、机器学习和人工智能等不同领域拥有超过 100 项已授权的美国专利。他还发表了约 30 篇出版物,撰写了一本书、书籍章节,并当选为美国国家标准与技术研究院 (NIST) 智能电网委员会的成员。
美国合众银行 (U.S. Bank): 美国最大的区域性银行,美国合众银行将其关系团队、分行和 ATM 网络与数字工具相结合,让客户可以随时、随地、随心所欲地办理银行业务。
1. 机器学习 (ML) 如何为金融业带来积极影响?
机器学习和人工智能对整个金融业,特别是银行业,产生了深远而积极的影响。在银行业的许多应用中,做决策时需要考虑许多因素 (特征),而机器学习在这方面传统上一直很有帮助。例如,我们普遍依赖的信用评分就是由机器学习算法得出的。
多年来,有趣的是,机器学习还帮助消除了决策中的人为偏见,并提供了一种一致的算法化决策方法。例如,在信用卡/贷款承销和抵押贷款中,现代人工智能技术可以考虑更多的因素 (自由格式文本、行为趋势、社交和金融互动) 来做决策,同时还能检测欺诈。
2. 金融领域内,机器学习面临的最大挑战是什么?
由于行业性质,金融和银行业带来了许多挑战。首先,这是一个受到高度监管的行业,许多方面都有政府监督。所使用的数据通常是非常个人化和可识别的数据 (社会安全号码、银行对账单、税务记录等)。因此,在创建私密且无偏见的机器学习和人工智能模型时需要非常谨慎。许多政府法规要求任何模型都必须是可解释的。例如,如果一笔贷款被拒绝,就必须从根本上解释为什么被拒绝。
另一方面,在其他行业可能稀缺的数据,在金融行业却很丰富。(例如,抵押贷款记录必须保存 30 年)。当前数据数字化的趋势以及更复杂的人工智能/机器学习技术的爆炸式增长,为应用这些进步创造了独特的机会。
3. 在尝试将机器学习集成到金融应用中时,您观察到的常见错误是什么?
最常见的错误之一是在不了解模型的基本工作原理、优点和缺点的情况下使用模型或技术。人们倾向于将人工智能/机器学习模型视为一个“黑匣子”。在金融领域,理解模型并能够解释其输出尤为重要。另一个错误是没有在一个有代表性的输入空间上全面测试模型。在选择模型时,模型性能、验证、推理能力和模型监控 (重新训练间隔) 都是需要考虑的重要因素。
4. 关于机器学习的未来,什么最让您兴奋?
现在是从事应用机器学习和人工智能的大好时机。人工智能/机器学习的技术无疑正在完善,甚至重新定义许多科学学科。我非常兴奋于所有正在进行的进展将如何重塑未来。
当我第一次开始从事自然语言处理工作时,我为神经网络/语言模型能够生成一个代表一个词、一个带有关联语法的句子,甚至一个段落的数字或向量 (我们现在称之为嵌入) 的能力感到敬畏。我们一直在不断寻找更合适、更具上下文的嵌入。
我们已经远远超出了为文本生成“简单”嵌入,发展到了“多模态”嵌入,这对我来说更加令人敬畏。我最兴奋并期待生成和使用这些新的嵌入,从而在未来实现更多激动人心的应用。
🤗 感谢您参与我们的第三期机器学习总监洞见。敬请期待更多来自机器学习总监的洞见。
非常感谢 Soumitri Kolavennu、Debanjan Mahata 和 Ioannis Bakagiannis 在本文中提供的精彩见解和参与。我们期待见证您持续的成功,并将在每一步为您加油。🎉
如果您有兴趣通过 Hugging Face 专家加速您的机器学习路线图,请访问 hf.co/support 了解更多信息。