普鲁托:在全球背景下开创希腊金融人工智能的先河

社区文章 发布于 2025 年 2 月 27 日

引言

在金融科技领域,语言至关重要。多年来,英语一直主导着金融人工智能的基准和模型,导致其他语言的代表性不足。**普鲁托**正在改变这种局面。普鲁托是第一个全面的**希腊金融语言模型和基准**,旨在为希腊金融业带来先进的人工智能能力(普鲁托:在低资源希腊金融领域对大型语言模型进行基准测试)。普鲁托以希腊财富之神命名,象征着知识的丰富——它确实为**开发人员、金融分析师和区块链爱好者**提供了丰富的工具。该项目引入了**普鲁托-ben**,一个涵盖多项任务的希腊金融基准套件,以及**普鲁托-8B**,一个定制的希腊金融大型语言模型(LLM)。该项目由**NaCTeM(国家文本挖掘中心)、Archimedes AI、AIRC(人工智能研究中心,AIST)和The Fin AI**共同完成,他们在计算资源、领域专业知识和研究合作方面的贡献对普鲁托的开发至关重要。他们共同弥补了人工智能领域的一个关键空白:帮助计算机以行业所需的细微差别和准确性理解和生成希腊金融语言。

这为什么重要?希腊在全球经济中发挥着举足轻重的作用,并拥有丰富的金融历史,但直到现在,还没有专门针对希腊金融的人工智能基准或模型。通用或多语言模型在处理**希腊语的语言复杂性和金融领域的特定术语**时常常会遇到困难。普鲁托旨在弥合这一差距。在这篇博客文章中,我们将探讨普鲁托的意义和应用,看看它与FinBen(开放金融LLM排行榜)等更广泛的金融人工智能工作相比如何,并了解其对金融和区块链社区的潜在影响。

为什么希腊金融需要普鲁托

金融语言即使在英语中也很难懂——加上**希腊语的复杂性**,挑战就更大了。在普鲁托之前,研究人员指出,将多语言NLP模型应用于希腊金融时,存在“相当大的性能差异”。换句话说,一个经过多种语言或通用金融文本训练的人工智能模型在处理**希腊语**时往往**表现不佳**,会漏掉上下文或错误识别术语。这部分是由于可用于训练的希腊金融数据有限,以及希腊语独特的语法和词汇(想象一下一个经过英语训练的模型试图解析希腊语股票招股说明书——它注定会遇到困难)。在普鲁托出现之前,**没有专门的希腊金融基准或专门的希腊金融LLM**,这意味着没有标准的方法来衡量人工智能在阅读希腊年度报告或从希腊金融新闻中提取数据等任务上的表现。

普鲁托的诞生正是为了解决这些挑战。通过专注于金融领域的**低资源语言**,它强调了一个重要原则:**金融人工智能不应该一刀切**。正如希腊经济学家和分析师有自己的行话一样,人工智能模型需要专门的训练才能真正理解它。普鲁托的创建者强调,跨语言迁移(仅仅在希腊文本上使用英语模型)存在局限性。他们的研究结果表明,如果没有针对希腊语的特定训练,即使是最先进的模型在希腊语内容上的准确性和推理能力也会遇到困难。简而言之,**希腊金融需要普鲁托,以确保它不会在人工智能革命中掉队**。

普鲁托-ben

普鲁托的核心是**普鲁托-ben**,这是第一个希腊金融评估基准。该基准是一套涵盖希腊金融领域实际需求的**五个核心自然语言处理任务**。这些任务包括:

  • 数字命名实体识别(Numeric NER)——识别文本中的数字实体,例如货币值、百分比、日期和其他数字。例如,在希腊金融报告中,“€5 εκατ.”(500万欧元)应被识别为货币金额。普鲁托-ben为此提供了一个名为**普鲁托 Finner Numeric**的数据集,其中包含来自希腊年度报告的专家标注示例。模型通过其标记这些数字实体的准确性(用F1分数衡量)进行评估。

  • 文本命名实体识别(Text NER)——从金融文档中提取人名、组织名和地点等命名实体。**普鲁托 Finner Text**数据集专注于希腊金融文本(例如,报告中的公司名称、高管姓名)。这有助于解析新闻以查找提及的公司或首席执行官等任务。同样,实体F1分数用于衡量性能。

  • 问答(QA)——根据提供的上下文回答金融问题。独特的是,普鲁托的问答以**多项选择题形式**呈现,并附有文章。许多问题来自希腊大学的金融考试,确保它们能测试真实的金融知识。例如,一个问题可能会问:“Ποιος είναι ο κύριος κίνδυνος για μια τράπεζα?”(“银行的主要风险是什么?”),选项包括 A) 信用风险,B) 流动性风险等。模型必须选择正确的答案。评估通过准确性进行——模型是否选择了正确的选项?

  • 摘要生成(Abstractive Summarization)——生成希腊语金融文档的摘要。此任务解决了诸如摘要年度报告或新闻文章以获取快速洞察的情况。普鲁托包含一个摘要生成组件(其数据集在结果中被称为**GRFNS-2023**,基于**FNS-2023**挑战数据集构建)。模型使用ROUGE等指标进行评估(衡量AI生成的摘要与参考摘要之间的重叠程度)。

  • 主题分类(Topic Classification)——按主题对金融文本进行分类。**普鲁托 Multifin**数据集利用现有数据集**MultiFin**中的希腊语部分,对希腊金融新闻标题进行分类。每个标题(和简短上下文)都附有一组可能的主题,例如“Φορολογία & Λογιστική”(税务与会计)、“Επιχειρήσεις & Διοίκηση”(商业与管理)、“Οικονομικά”(经济学)等,模型必须选择正确的类别(TheFinAI/plutus-multifin · Hugging Face上的数据集)。这也通过准确性进行评估。

总之,普鲁托-ben中的这五项任务涵盖了从理解原始数字和名称到回答复杂问题和总结长文本的一系列技能。重要的是,该基准不仅仅是理论;它是建立在由**希腊本土金融专家精心策划和注释**的数据基础上的。该团队创建了**三个新颖的高质量希腊金融数据集**,并辅以两个现有资源。例如,主题分类任务通过提取其希腊语部分来利用现有的**MultiFin**数据集(一个多语言金融新闻集合)(TheFinAI/plutus-multifin · Hugging Face上的数据集)。大多数其他任务(NER和QA)需要创建全新的希腊语特定数据,例如注释年度报告和收集考试问答。所有这些数据集都已公开发布,因此任何人都可以检查它们或使用它们来训练自己的模型。

普鲁托-8B

仅有数据是不够的——您还需要一个能够从中学习的模型。普鲁托-8B就是这样一个模型:一个**80亿参数的大型语言模型,专门针对希腊金融文本进行微调**。它建立在Llama 3架构(一个现代LLM基础模型)之上,通过**LoRA微调**(一种有效微调模型部分的技术)进行调整。本质上,该团队从一个通用的希腊语语言模型(实际上,我们使用了**Llama-Kríkri-8B**,一个经过希腊语训练的模型)开始,然后用希腊金融数据对其进行进一步训练。这不仅包括普鲁托-ben任务数据,还包括额外的希腊金融文档,以使其对该领域有更广泛的了解。

结果是**普鲁托-8B-instruct**,一个经过指令微调的模型,能够理解提示并用希腊语生成金融领域的答案。经过指令微调意味着它被训练成能够遵循人类指令,使其适用于对话代理或问答系统(想象一下用希腊语询问它:“总结这份收益报告”或“X公司的债务股本比是多少,为什么它很重要?”并获得连贯的答案)。作者提供的模型卡强调,普鲁托-8B旨在完成**“以希腊语为中心的金融语言任务”**,旨在高保真地生成和理解希腊金融文本。

至关重要的是,普鲁托-8B及其训练数据是开源的。这种开放性对开发人员和研究人员来说是一个福音:**金融分析师可以根据自己的数据进一步微调它**,开发人员可以将其集成到应用程序中(例如,一个回答希腊市场数据问题的聊天机器人),社区也可以帮助改进它。创建者明确发布了普鲁托-8B和所有数据集,以**促进可复现的研究和金融领域更广泛的多语言包容性**。实际上,一家希腊银行或金融科技初创公司可以采用普鲁托-8B并将其部署以自动化希腊语报告分析或客户查询,这些任务以前可能需要以英语为中心的模型或根本没有AI。

性能洞察:普鲁托表现如何?

构建一个模型是一回事;证明它的价值是另一回事。普鲁托团队在普鲁托-ben基准上评估了**22个不同的LLM**(包括普鲁托-8B本身和许多其他模型),以了解它们的表现。这些模型从小型的开源模型到像GPT-4这样的巨型专有模型不等。结果揭示了一个关于专业化价值的引人入胜的故事。

普鲁托-8B在希腊金融任务中整体表现最佳,在五项任务指标上的平均得分达到0.60(满分1.0)。相比之下,被认为是黄金标准的强大GPT-4在相同的希腊任务上的平均得分仅为0.52。这对普鲁托来说是一个显著的胜利。具体而言:

  • 在**数字实体识别**方面,普鲁托-8B的F1分数达到**0.70**,而GPT-4仅为**0.28**。这个巨大的差距表明普鲁托对希腊金融数字的专注训练取得了成功——它在希腊文本中识别货币金额或日期等信息的能力比即使是最大的通用模型也要可靠得多。我们这些处理希腊金融文件的人都知道数字格式和语言有多么棘手;普鲁托似乎已经掌握了这一点。

  • 在**文本实体识别**方面,普鲁托-8B得分**0.57**,几乎与GPT-4的**0.60**持平。它在识别希腊语文档中的人物、组织和地点方面也优于许多其他模型,包括一个名为“Meltemi”的希腊通用模型和各种多语言LLM。实际上,这意味着普鲁托非常擅长解析新闻稿并正确提取公司和高管姓名。

  • 在**问答任务**中,普鲁托的准确率达到**64%**,具有竞争力,但略低于GPT-4的**71%**和另一个大型模型74%。尽管如此,考虑到普鲁托的参数量只有GPT-4的一小部分,并且专注于希腊语,这仍然令人印象深刻。这可能意味着普鲁托对希腊金融概念的理解很透彻,但偶尔会被非常复杂的问题难倒(GPT-4庞大的通用知识在这方面有所帮助)。然而,普鲁托的表现远超小型开源模型——其中许多模型在问答方面得分低于50%。

  • 在**摘要**方面,以ROUGE-1重叠度衡量,普鲁托(0.34)略低于GPT-4(0.38)。总结长篇细致的报告很难,即使是GPT-4也不擅长(低于0.4的分数表明所有模型在这方面都有改进空间)。普鲁托不错的表现表明它能够对希腊金融文档生成相当好的摘要,尽管可能不如GPT-4流畅。这并不奇怪——摘要通常受益于极大的规模和在海量语料库上的训练。

  • 在**主题分类**中,普鲁托-8B达到了**72%的准确率**,与一个720亿参数的模型并列第一,并超越了GPT-4(63%)。这意味着在将希腊金融新闻分类到正确的类别时,普鲁托与任何现有模型一样优秀。如果您正在构建一个根据主题将希腊新闻分发给分析师的工具,普鲁托将是一个出色的引擎。

总的来说,这些结果强调了一个关键点:**越大不一定越好——在正确的数据上进行训练至关重要**。普鲁托-8B虽然比GPT-4小得多,但它利用其希腊语特定知识在多项任务上超越或媲美这个巨头。作者指出,由于语言和领域复杂性,希腊金融自然语言处理仍然具有挑战性,但普鲁托显示出比尝试跨语言迁移学习的通用模型有了明显的改进。它验证了**投资于特定领域、特定语言的模型可以产生卓越性能**的理念。这与我们在其他语言和领域所见的情况相似,现在在希腊金融领域也有了证据,这令人兴奋。

对于那些对技术感兴趣的人来说,值得注意的是在更广泛的金融LLM排行榜上观察到的一些“令人惊讶的结果”:例如,在股票价格预测任务中,小型微调模型有时会击败更大的模型。这与普鲁托的成功不谋而合——专注的模型可以在专业任务上超越通用巨头。这提醒我们,在小众领域,**训练的质量胜过参数的数量**。

实际应用与影响

普鲁托在实践中究竟能做什么?希腊金融LLM的应用涵盖了广泛的利益相关者:

  • 对于金融分析师和投资者:普鲁托-8B可以阅读和总结冗长的希腊金融报告,节省无数时间。想象一下一个涵盖希腊市场的分析师——他们不必手动翻译或粗略浏览一份100页的希腊公司年度报告,而是可以使用普鲁托**即时获得关键财务指标和叙述的摘要**。该模型的抽象摘要功能在这里特别有用,可以在保持准确性的同时浓缩复杂信息(并使用严格的ROUGE基准进行评估)。此外,问答功能意味着分析师可以提出具体问题:“X公司2024年的净利润是多少,与2023年相比如何?”并从报告中获得快速答案。这种**交互式分析**可以极大地加快希腊股票或债券的研究速度。

  • 对于希腊金融机构:希腊的银行、保险公司和监管机构会产生大量文本——文件、合规文档、新闻稿。普鲁托可以进一步微调,以协助从这些文档中**提取信息**。例如,**数字命名实体识别(numeric NER)**功能可以自动从监管文件中提取所有相关数据(资本比率、流动性百分比等)。监管机构可以使用它更有效地监控公司的披露情况。银行可以将普鲁托集成到其内部系统中,以标记传入文档中的重要名称或数字(例如,每天识别希腊新闻中所有提及其银行的信息,以及情绪)。

  • 对于金融科技开发者:为希腊市场构建金融应用程序的开发者现在拥有了一个强大的工具。考虑一个提供**希腊语对话式金融建议**的金融科技应用程序——它需要理解用户关于希腊股票或经济指标的查询。借助普鲁托-8B,该应用程序可以利用一个能够开箱即用理解“ATHEX指数”或“Ελληνική Τράπεζα”等上下文的模型。此外,由于普鲁托-8B是开源的,开发者可以将其部署在本地,这对于数据隐私很重要(金融数据可能很敏感,并非所有公司都乐意将查询发送到像ChatGPT这样的API)。普鲁托为希腊金融提供了更**安全、本地化的人工智能解决方案**。

  • 对于区块链社区:有趣的是,“Plutus”这个名字可能会让区块链爱好者感到耳熟——它也是Cardano区块链上的一种智能合约语言。虽然无关,但这个巧合突出了一个交集:**区块链和去中心化金融(DeFi)项目可以使用普鲁托-8B来分析链上金融数据或希腊语的加密货币监管新闻**。例如,如果希腊发布新的加密货币法规,像普鲁托这样的模型可以总结和阐明希腊语的影响,甚至将其翻译成英语供国际读者阅读。加密货币市场是全球性的,拥有一个多语言金融模型意味着更好地洞察不同国家(如希腊)如何参与区块链和金融。更广泛地说,**区块链项目通常需要解析金融文档(白皮书、法律文本)**——一个以希腊语为重点的模型增加了覆盖所有基础的工具包。

  • 教育用途:普鲁托的问答数据集来自大学考试,这意味着它拥有与学术金融课程相关的知识。希腊金融课程的教授可以使用该模型开发辅导系统或生成练习题。学生可以向该模型查询希腊语概念的解释,使金融教育更易于获取。这就像拥有一个精通希腊金融术语的知识渊博的助教。

除了这些具体示例之外,普鲁托的**象征性影响**是巨大的。它表明,**人工智能中的多语言能力是可行的且有益的**,即使在高度专业的领域也是如此。这可以鼓励其他拥有重要金融部门的语言的类似项目(想象一下阿拉伯金融或北欧语言的普鲁托等效物)。正如普鲁托论文总结的那样,目标是促进“金融领域更广泛的多语言包容性”。在全球经济中,这种包容性至关重要——我们不希望人工智能只懂华尔街而不懂雅典或马德里。普鲁托是迈向金融人工智能民主化的一步。

结论

普鲁托站在金融、语言和技术的交汇点——它证明了有针对性的人工智能开发所能达到的成就。通过围绕**希腊金融语言**构建基准和模型,普鲁托的创建者不仅提供了强大的即时工具,而且树立了先例。他们强调**语言不应成为金融领域人工智能赋能的障碍**。无论您是解析一家希腊航运公司的资产负债表,还是试图从一份希腊金融稳定报告中获取洞察,普鲁托都能以希腊语将大型语言模型的清晰度带到您的指尖。

对于希腊的金融部门而言,普鲁托可能预示着一个新时代的开始,在这个时代,人工智能将协助日常运营、研究和决策,所有这些都以用户的母语进行。对于全球人工智能社区而言,普鲁托提供了宝贵的经验和纳入更多语言和领域的蓝图。随着我们向前迈进,我们可能会看到普鲁托被整合到更大的开放金融LLM排行榜中,像我们对待英语和西班牙语一样,激发希腊任务的竞争和改进。下一个FinBen将包含更多语言,确保人工智能在金融领域的益处真正惠及**所有人**,从华尔街到索福克勒斯街。

最终,普鲁托体现了**金融人工智能应说您的语言**——字面意义上。通过为希腊金融提供量身定制的人工智能基准和模型,普鲁托不仅通过传播知识的“财富”来纪念其同名神祇(财富之神)的遗产,而且还确保希腊金融社区能够与时俱进地参与人工智能革命。这是迈向金融和技术领域更具包容性、更有效和多语言未来的一大步。

社区

📻 🎙️ 嘿,我为这篇博文生成了一个 AI 播客,快来听听看吧!

此播客由ngxson/kokoro-podcast-generator生成,使用DeepSeek-R1Kokoro-TTS

注册登录 发表评论