
在数字化浪潮席卷全球的当下,一项由中国科研机构与企业联合主导的关键性国际标准正式破茧而出,为机器理解海量文本数据中的“数字密码”提供了全球统一的解决方案。近日,经过3轮国际投票,国际标准化组织(ISO)正式发布了ISO 24617-15: Language resource management — Semantic annotation framework (SemAF) — Part 15: Measurable quantitative information extraction (MQIE)。这是全球首个专门针对文本中可度量数量信息(MQI)通用自动抽取流程的国际标准,目前已翻译为多种语言被德国、法国、荷兰、丹麦、瑞士等国家10多个国家标准机构入库,标志着我国在语义计算与数据标准化基础领域取得重要话语权突破。
聚焦核心痛点,破局非结构化数据“掘金”难题
当前,从医疗电子病历到上市公司财报,从电力运行报告到金融审计文本,海量非结构化文本中蕴藏着海量的可度量数量信息——即描述实体、属性、数值、计量单位及其复杂关系的关键客观数据。这些信息是驱动大数据分析与智能决策的核心“燃料”。然而,其提取长期面临严峻挑战:语义表示混乱、实体关系复杂、表达歧义丛生、计量单位缺失或混淆、特殊数值区间表达等问题层出不穷,严重制约了数据的有效利用。
MQIE标准应运而生,直击三大核心价值:
通用抽取框架: 基于前期中国主导制定的ISO 24617-11:2021(MQI语义表示框架),MQIE首次构建了统一的、可跨领域应用的MQI信息自动抽取流程规范。
赋能机器智能: 为计算机高效处理文本中的数量信息提供标准化指南,服务于机器辅助数据处理、大规模文本挖掘、自动数据转换与比对等任务。
释放数据潜能: 打通从非结构化文本到结构化数据的转化路径,为构建高质量数据资源、深化数据要素应用奠定坚实基础,赋能科研、企业运营与政府决策。
中国智慧引领,产学研用协同攻关
值得瞩目的是,此项国际标准由中国科研力量与关键行业用户深度协同主导完成,牵头单位是华南师范大学、中国标准化研究院,核心企业广西电网有限责任公司作为首个企业参与单位,深度参与研发和应用,牵头企业力量发挥了重要作用,充分体现了“产、学、研、用”一体化创新模式的强大生命力。

项目团队在欧盟总部和欧洲议会参加ISO会议并做工作报告
专家观点:标准化是激活数据要素的关键一步
“MQIE标准的发布,是解决全球性文本‘数量’信息理解难题的关键里程碑。”项目牵头人、华南师范大学郝天永教授强调,“它首次为机器自动、一致地‘读懂’文本中的数量关系提供了通用‘说明书’,特别是在医疗健康、电力、金融等强数据驱动行业,将显著加速数据价值向业务洞察和智能决策的转化进程。”
标准牵头单位之一广西电网有限责任公司的参与专家指出:“电力文本数据专业性强、结构复杂,对关键数值信息的精准捕捉直接影响电网安全和运营效率。 MQIE标准为电力行业提供了一套国际认可的抽取‘标尺’,将有力推动智能电网建设中的数据治理智能化,提升对海量文本信息价值的挖掘能力,提升网络数据互联互通、资产及数据识别、自适应流量分析、人工智能安全、电力专用网络安全防护的处理效率,支撑更安全、高效、绿色的电力服务。”
落地被寄予厚望,领域应用潜力巨大
MQIE标准在诸多领域被视为驱动行业数字化转型与智能化升级的基石性工具。
在医疗健康领域,MQIE标准正成为解锁临床文本价值的核心工具。电子病历、检验报告、科研文献中蕴藏着海量的可度量信息——从患者用药剂量、生化指标阈值到药物浓度区间,这些结构化数据的缺失长期阻碍医疗大数据应用。通过自动抽取病历中关键数值信息,系统可实时预警用药冲突、辅助制定个性化治疗方案。标准化抽取临床试验报告中的药效数据,构建跨机构可比对数据库,可缩短药物有效性分析周期。高效解析千万级公共卫生文本中的量化指标,可为疾病防控提供精准时空动态图谱。该标准将改变传统人工核查医疗数据的模式,为AI诊断模型提供机器可读的高质量数据源,推动循证医疗向智能化跃迁。
在电力领域,电力系统运行、设备管理、客户服务等环节产生巨量文本报告、工单、日志,其中蕴含的设备参数、负荷数据、能耗指标、故障统计等MQI信息至关重要。MQIE标准将极大提升从巡检报告、调度日志、客服记录等文本中自动、精准提取关键数值信息(如电压电流值、故障发生次数、用户用电量区间)的效率与准确性。标准化抽取的数据可直接服务于电网状态评估、风险预警预测、设备健康管理、能效优化分析等智能应用,为构建“无人值守”变电站、智能调度、精准负荷预测等高级应用提供高质量数据支撑,从而改变传统依赖人工查找、核对文本数据的低效模式,释放人力,加速业务流程,降低运营成本,提高电力行业业务运行的安全性和可靠性。
未来展望:驱动全球数字化升级
作为ISO SemAF框架标准系列的重要组成部分,Part 15 MQIE标准与前期中国主导的Part 11 MQI标准共同构成了覆盖“语义表示”到“信息抽取”的完整技术链条。其应用前景远超电力领域,在金融风控、临床医疗数据分析、智能制造、建筑能效管理、跨境贸易标准对接等涉及复杂数值信息处理的场景均具有革命性潜力。我国企业参与人工智能标准化工作能力,发挥标准支撑引领作用,助力推进人工智能赋能千行百业,建设中国—东盟人工智能创新合作中心,加快形成“北上广研发+广西集成+东盟应用”跨境产业生态,构筑面向东盟的人工智能合作新高地,服务构建更为紧密的中国—东盟命运共同体。中国团队在该领域的持续引领,创新人工智能高质量发展路径。夯实人工智能发展基础硬实力,打造人工智能高融合产业生态,深化开放合作与技术应用示范,统筹人工智能产业发展与安全,不仅彰显了科技创新实力,更将为全球数字化进程贡献坚实的“中国标准”力量。随着标准的推广应用,一个由机器深度理解数据、驱动智能决策的新时代正加速到来。
(广告)
| 资讯频道







京公网安备 11010502035903号