金融数据标准化征途: 数据治理决定成败 产业链数据率先试水
发布时间:2022-08-12 05:13:55来源:华体会官方平台下载app 作者:华体会体育在线登录入口

  金融数据标准化的建设,绝非设计技术平台就能解决,更不是做完数据标准化再建技术系统,而是一个长期的、迭代的、滚动的且分步骤实施的进程。

  面对日益丰富的海量数据603138),越来越多基金证券等投资机构却陷入金融数据标准化缺乏的新烦恼。

  “我们投研部门每天都需要花费不少精力开展各类数据校对与表述口径统一,很大程度影响了投研建模效率。”一位券商分析师向记者透露。比如“维他命”在不同金融数据服务商有着不同表述——“维生素”“Vitamin”等,往往造成不同业务部门对同一个事物产生歧义;此外,“集成电路”也被不少金融数据服务商称为“微芯片”“芯片”“Integrate Circuit”(IC),也造成不同业务部门明明在讨论同一种事物,但因各自表述不同造成理解偏差。

  他直言,众多金融数据不统一,还会大幅增加他们对外拓展业务的沟通成本。其中最常见的现象是,作为卖方的券商向基金、保险资管等买方机构推介投资策略时,由于彼此对某些金融数据的计算口径不够一致,导致买方机构对投资策略有效性心存顾虑,直接影响到券商业务合作进程。

  2月初,人民银行、市场监管总局、银保监会、证监会联合印发的《金融标准化“十四五”发展规划》提出,深入推进证券期货标准建设;大力推进资本市场基础数据标准和监管数据标准制定,研究构建资本市场数据标准体系,提升证券期货业数据治理水平。

  恒生电子600570)首席科学家白硕向记者透露,在金融资讯数据标准化领域,目前恒生电子正设计统一的资讯模型——基于SDOM证券行业模型的数据域划分、证券分类方式以及词根定义等标准,并综合考虑现有各业务系统应用资讯数据的场景,沉淀公共的资讯数据服务能力,助力实现金融资讯数据标准化。

  在一位公募基金公司信息技术部负责人看来,要做到真正意义的金融数据标准化,除了对基本数据定义实现标准化的口径统一,还需将金融数据标准化应用范畴扩展到数据治理体系——从数据采集、数据分类分级、数据存储,到实现公司内部的金融数据标准化建模与标准化定义,都得构建业务、技术、管理三个维度相一致的规范操作体系。

  记者多方了解到,在探索金融数据标准化的征途上,众多金融机构仍面临三大挑战,一是数据打通存在诸多痛点,众多金融机构尚未做好具有可行性的顶层设计方案,导致投研建模、资管产品创设、客户营销、产品经营分析、监管应用等各个业务操作环节难以使用一致性的金融数据,由此造成巨大的业务操作隐性成本;二是数据治理人才匮乏,尤其是兼顾业务知识与技术背景的数据治理人才相当少,影响众多金融机构的数据治理成效;三是随着数据来源日益丰富且金融机构在同一款资管产品担任不同角色(可能是托管人或渠道管理人),如何根据金融机构不同角色对数据出处与使用状况进行精准标识以满足合规监控与监管要求,同样考验着他们的内部控制与合规运营能力。

  上述公募基金公司信息技术部负责人直言,金融数据标准化的建设,绝非设计技术平台就能解决,更不是做完数据标准化再建技术系统,而是一个长期的、迭代的、滚动的且分步骤实施的进程。

  “目前,众多金融数据的表述差异化,已让我们相当难受。”一位券商机构IT部主管向记者透露。比如“集成电路”在不少金融数据服务商的表述截然不同,有些机构称之为“集成电路制造”或“半导体产品”,无形间加大他们数据校对的工作量。

  令他更心烦的是,部分金融数据服务商提供的专业术语存在明显歧义,以锂电池为例,按正极材料可以分为三元锂、碳酸锂、磷酸锂、钴酸锂等,若按照封装则有圆柱、方形、软包之分,按不同使用场景也有动力电池、储能电池与消费电子电池等不同称谓,但这些金融数据服务商都将它们笼统称成“锂电池”,导致投研部门不得不再反复核查各家上市企业财报所披露的锂电池生产工艺与应用场景,最终确定金融数据服务商所说的“锂电池”具体指向。

  “这给我们造成很多额外工作量,导致投研建模效率降低与对外业务拓展沟通成本骤增。”他坦言。表面而言,这些问题是因专业术语等基础数据名称表述口径不统一而引发,但深层次而言,它涉及到各家机构数据治理规范化运作制度的缺失。

  前述基金公司信息技术部负责人向记者透露,为了强化数据治理能力以促进金融数据标准化,过去两年他所在的基金公司专门设立数据治理委员会,受IT治理委员会管理。

  “考虑到基金公司规模不够大,我们的IT治理委员会和数据治理委员会其实是一套人员班子,在强化IT能力升级同时推进数据治理架构建设。”他指出。这无形间令基金公司IT能力升级与数据治理紧密挂钩,帮助基金公司借助IT系统持续升级,先后完成架构管理、资产管理、标准管理等方面的数据标准化制度设计和业务流程建设。

  这位基金公司信息技术部负责人直言,其间他们走过一些“弯路”,目前尚未完成企业级的数据标准化治理,包括将众多报表重新优化,以高度标准化的数据体系报送监管部门。

  “此外我们正与量化团队做沟通,如何打造并行计算的环境,但在实际操作过程,金融工程团队只有单机版的Python,无法充分发挥公司的科技能力,即难以最大化使用算力开展各类算法建模研究。”他直言。这无形间给金融数据标准化构成新的阻力——因为众多金融数据无法充分使用,也就找不到“标准化”的操作空间与运作尺度。

  记者了解到,不少基金券商机构还发现,基于数据中台的数据标准化服务也存在不少操作难题,最常见的是面对不同来源海量数据,哪个数据主体或数据标准应当作为“基准”,

  一位金融数据服务商向记者透露,鉴于上述痛点,他们正尝试输出自助查询技术服务——基于数据湖方式,通过智能科技提供自助分析、多维、数据实验室、API、excel插件和固定报表等功能,帮助各类金融机构按照自身数据标准化要求完成产品管理系统、客户ECIF系统、机构主数据和证券主数据的迭代升级,从而在实现数据迁移管理同时搭建更具标准化的数据采集、处理、分析与治理体系。

  “我们调研发现,目前产业链数据标准化的应用场景相当广泛,比如各类金融机构的投研领域对此需求比较旺盛,比如众多主动投资模型需要通过这类数据,构建热门行业上下游企业与相关资产之间的核心逻辑架构。”他告诉记者。此外,越来越多金融机构投研人员还将这类数据作为投资决策完善的新辅助工具,为智能投研打下扎实的基础。

  上述金融数据服务商向记者直言,尽管不少同行都将产业链数据标准化视为数据服务业务拓展的新突破口,但在实际操作环节,要做好这项工作难度不小。

  首先,在产业链数据采集处理环节,他们会普遍遇到产业链数据信息来源有限、披露不规范、透明度差异、行业标准不完善等问题,导致他们无法构建完善、完整的标准化产业链数据。

  其次,金融数据服务商要建立一套被市场广泛认可、逻辑清晰、可行性高的标准化产业链数据,极具挑战性。因为很多行业都有各自的产业链发展特点,且金融机构在不同数据应用场景存在着主观认知偏差,都会加大数据场景的应用成本。

  第三,产业链数据在不同业务场景有着不同需求与扩展要求,无形间变相提高产业链数据标准化的使用成本。

  第四,在投研建模环节,产业链的复杂性或导致某些关键节点缺乏完整的标准化数据,导致投研建模难度骤增。

  夏青对此表示,针对上述痛点,他们通过智能化技术设计针对性的解决方案。比如数据规则通用性层面,他们通过对产品、产业链关系、产品属性的标准化,可以兼容不同来源的数据,形成同一套产业链发展逻辑关系与数据表述,提升数据标准化程度同时降低金融机构的“理解成本”——以便快速准确地获取错综复杂的产业链信息。

  此外,恒生聚源还通过大量数据分析技术进行相互验证,避免标准化产业链数据之间所存在的错误逻辑关系,减少产业链数据的冗余信息。

  “目前,我们还借助NLP等人工智能技术,促进标准化产业链数据在投研建模层面的精准识别能力,有效提升投研模型的数据探寻效率。”他指出。通过制定产品分类标准、产品纳入标准、产品命名定义标准、上下游构建标准等机制,目前他们已打通上市公司、重点非上市企业等数十万家企业的各类产业链关联关系,广泛应用在智能投研、智能风控等智能金融场景。

  多位金融数据服务商指出,尽管越来越多同行在产业链数据标准化方面做出大量尝试,但在实际使用普及层面仍受到多方面因素影响,一是众多金融机构投研人员基于原有的数据使用习惯,未必会很快适应新的产业链数据,导致后者普及难度加大,其标准化效应无形间被减弱;二是新的产业链数据计算口径若与金融机构现有数据治理操作方式不一致,后者未必愿意花费大力气重新调整现有的数据计算口径,令其应用范畴受到制约;三是产业链数据要实现“标准化”,还需众多金融机构认可使用,但这又涉及到众多金融机构的excel表格、日报周报信息是否会采用其数据演算公式,若金融机构使用意愿不高,其标准化进程的难度又将加大。

  前述金融数据服务商向记者透露,目前业界正尝试采取一个相对可行的操作方式,即金融数据服务商与证券交易所、知名买方机构、指数研发机构共同合作,参与各类产业链数据的业务标准、技术标准与应用维度机制设计,并成功将数据标准导入越来越多知名金融机构的产业知识图谱与智能投研系统,通过交易所、知名买方机构与指数研发机构的影响力,逐步实现这套产业链数据应用的普及化,最终达到“标准化”目标。

上一篇:绿地控股5亿美元债寻求展期网传投 下一篇:岳麓区政协对现代金融产业链发展工