专栏中心

EEPW首页 > 专栏 > 中电金信:源启数据建模平台:建模效率和管理精细度进一步提升

中电金信:源启数据建模平台:建模效率和管理精细度进一步提升

发布人:中电金信人 时间:2024-10-08 来源:工程师 发布文章

源启数据建模平台是源启·数据资产平台面向数据仓库等大型数据模型构建专门打造的模型设计工具。它以需求牵引模型动态演进,持续变更模型适应业务变化,并以Web和图形化方式,提供正向、逆向建模能力,高效复用模型资产和构建大型数据模型。同时,秉承“建模即治理”的思想,在数据模型中融入标准、规范、质量、安全等方面的业务要求,依标建模、依规建模。此外,因应国产化创新趋势,平台可以输出适配十余种国产数据库的DDL脚本,并持续扩展适配范围。


● 适用行业:银行、保险、证券、能源、制造等

● 应用技术:实体关系建模、维度建模、DV建模、智能化贯标

● 应用场景:业务系统开发中的数据模型设计、数据仓库构建中的数据模型设计、数据模型全生命周期管理、数据治理中的数据模型标准化和规范化管理等。


面向数据仓库等大型数据模型的设计构建需求,基于多维度模型架构、自动化逆向建模和规范化模型设计,源启数据建模平台提供了业界领先的B/S架构数据建模工具,为客户提供企业级模型统一管理能力和“建模即治理”一体化能力。


2024年上半年,源启数据建模平台已经推出了需求管理、模型目录、标准管理、规范管理、数据建模等核心功能,并不断根据客户的反馈和需求,上线新的功能特性。


近期,新版本的源启数据建模平台在模型设计能力、设计操作便捷性、模型逆向恢复、模型版本管理等方面,优化推出新特性,提供更优质的使用体验,夯实数据工程的模型基石。


01支持表的分区设计,物理模型设计能力进一步完善


■ 功能介绍

设计物理模型数据表的表分区,定义分区类型、分区表达式、分区字段等。本功能考虑了特定数据库类型表分区的差异,在生成建表DDL脚本时可以自动化处理这些差异,使之对用户无感,提高了对不同数据库类型的适应能力。


■ 应用场景

数据库表过大可能会导致性能下降、数据查询变慢、存储空间占用大、数据维护困难、数据库备份和恢复时间过长等问题。表分区是解决数据库表过大的有效方式,它将一个大表划分成更小、可管理的多个区域,每个分区都包含表的一部分数据。这些分区可以存储在不同的系统分区、硬盘甚至服务器上,实现数据的均衡分配,提高查询效率。同时,分区虽然在物理上被分割成多个部分,但在逻辑上表现为一张表,简化了管理。


在表分区定义时,首先选择一个分区类型,比如Range、List、Hash等;再选择分区表达式和分区字段,表达式支持ABS、Day、Floor等,分区字段可以是时间、序号等字段;最后为各个表分区确定分区名称和分区边界值即完成了分区设计。在生成的建表DDL脚本中,可以看到包括了表分区脚本。


表分区信息的定义:

图片



表分区脚本的生成:

图片


02支持模版导入建模时自动生成英文名称,提高建模效率和规范化


■ 功能介绍

Excel模版导入建模时,在Excel模版中仅需填写表/字段的中文名称、字段数据类型及长度等。表/字段的英文名称会在导入时,自动根据中文名称生成。英文名称的自动生成,结合了中文分词技术和词根库,使得英文名称的有效率高达99.5%。同时,生成的英文名称也遵循模型的命名规范,实现了名称生成的自动化、标准化和规范化。


■ 应用场景

名称是表/字段表达业务语义的核心属性。由于历史和技术原因,数据库使用英文名称,而国内更熟悉和习惯使用中文名称,因此在使用Excel模版对业务进行建模时,通常只填写中文名称,英文名称留待后续补充更新。然而,人工翻译英文名称工作量大且重复度高、翻译效果因人而异、翻译结果可能会出现不准确不规范不统一的情况,造成模型设计的设计效率、规范程度、标准程度等不高。企业构建词根库是解决数据模型英文名称定义困难的有效方式。词根库建立了模型组件中文名称与英文名称以及英文缩写之间统一、规范的对应关系,并随着建模工作的开展持续扩展、迭代和提升质量,是模型质量的重要保障,可提高模型的易读性和可用性、以及数据治理成效。基于高质量词根库提供的中英对应关系,再结合自然语言处理技术,Excel模版导入建模可根据中文名称自动生成统一、规范的英文名称。同时,如果引用了模型命名规范,还可以统一模型表/字段命名格式,例如:英文名称的大小写、分隔符、前后缀等。


本功能导入的Excel模版中整理了模型表中文名称、字段中文名称、字段类型、长度、精度、主键等信息,导入时即可基于Excel模版信息批量自动生成规范化的表/字段英文名称,一键还原数据模型。


Excel模版样例:

图片


英文名称生成结果:

图片



03记忆模型设计操作,实现操作的撤销/恢复,提升设计效率


■ 功能介绍

在模型设计过程中,把每一步的设计操作记录到操作序列,通过撤销功能可逐步取消上一次的设计效果,通过恢复功能可逐步还原被取消的设计效果。可记录的设计操作全面,包括表/字段/索引/关系等模型组件的编辑步骤及内容、模型画布的位置变更、颜色调整等。同时,提供了鼠标点击和快捷键两种操作方式,提高了设计工作的便捷性和效率。


■ 应用场景

数据模型的设计是逐步将业务含义反复沟通、梳理、理解,并通过结构化形式表示的过程。设计过程的反复修改非常频繁,没有“后悔药”会极大地降低设计效率。通过系统自动记忆设计操作,保留模型设计的操作序列及变更前后信息及状态,根据设计需要随时撤销或者恢复设计效果,是一种有效的“后悔药”,可高效提高模型设计效率。


本功能提供了操作撤销按钮和操作恢复按钮,通过鼠标点击撤销/恢复按钮,即可实现模型设计的上一步/下一步的状态恢复要求。同时,也可以通过键盘快捷键实现同样的功能。


撤销/恢复按钮:


图片



撤销/恢复快捷键:

图片



04提供模型版本管理功能,提升从需求到模型联动管理的精细化


■ 功能介绍

模型版本管理按需求生成模型新版本,可以查看每个版本关联的建模需求,提供模型版本回退、版本导出、版本对比以及生成增量脚本或者导出对比结果等功能。本功能完整记录了模型从无到有、从有到大、从大到优等模型随需求演进的全部过程,建立了数据模型的成长档案。版本管理的粒度可细化到模型表/字段的单属性,版本之间的差异可以高亮方式对比显示。


■ 应用场景

业务的持续发展,应用系统或者数据仓库的数据模型也会随需而变。Excel表格或传统建模工具缺乏需求跟踪管理能力,造成模型变更不可溯源。此外,模型以文件形式保存,模型差异对比分析困难,难以对模型进行统一管理和连续跟踪,使得模型构建的历史经验不能有效利用。通过建立模型库和模型版本管理,能够汇集模型资源统一存储,保留数据模型各阶段的设计结果,形成模型全生命周期的连续历史记录。同时,通过数据模型的差异对比和生成的增量DDL脚本,满足模型的差异分析及模型迭代投产要求。


本功能通过打版把当前设计态的模型生成模型的新版本,版本内容包括表、字段、关系、主外键、关联数据标准、命名规则等,对模型的全部数据进行备份。新版本变动内容所关联的需求可以通过需求详情了解。同时,通过版本对比分析,可查看版本之间的差异,决定是否需要回退版本或者生成增量DDL脚本等。


版本管理:

图片

版本对比:

图片



专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们

关键词: 人工智能

相关推荐

个人-口罩识别系统项目采访

2026 全球半导体产业冲刺 1 万亿美元规模

中国硅片国产化提速 带动奕斯伟产能大幅扩张

2026-05-12

低代码利器!MIT 可视化编程赋能 AI + 物联网移动端开发

个人-窗口卫士项目采访

人工智能与机器人

微软X英特尔黑客松大赛

新品发布:Diodes 首发六通道超低抖动 PCIe 7.0 时钟芯片

东南大学人工智能02

软银宣布已在日本正式启动电池业务 满足AI电力需求

东南大学人工智能03

仿人机器人

东南大学人工智能01

AI 服务器 “胃口” 激增,高容高压 MLCC 供货紧张

三菱携手Tallgrass布局怀俄明州 AI 专属能源枢纽

AOS 推出 SmartClamp 智能功率级 适配 AI 高动态电流应力工况

光电路交换何以成为 AI 数据中心刚需

ADI公司:工业4.0——人工智能的端

视频 2019-11-08

本科毕业设计:一种基于发育思想的语音识别系统实现

AI 全域数字孪生加速半导体与电子系统研发落地

更多 培训课堂
更多 焦点
更多 视频

技术专区