在当下,确保数据科学和机器学习平台符合治理规则与政策,已成为一项至关重要的挑战。通常,治理规则隐藏于冗长繁杂的文件之中,给相关工作带来诸多不便。在Altair,我们采用了一种创新的方法,将知识图谱作为合规决策的核心依据。
Altair RapidMiner数据分析和人工智能平台构建了一套包含两层架构的AI架构体系。
其中,第一层是数据架构,它能够通过数据抽取、清洗、关联等一系列流程将企业的基础数据生态系统整合为一个集成化、协调化且可扩展的知识图谱。
第二层是智能分析执行层,借助它,用户能够轻松设计工作流,通过ETL(提取、转换、加载)、传统机器学习以及AI模块,对知识图谱中的数据进行分析与丰富。这两层紧密集成的数据架构为智能分析执行层提供数据基础,为维护治理规则和政策的合规性带来了显著优势。
数据架构拥有出色的扩展性,旨在打造专门用以存储合规信息的知识图谱。其构建根基在于对多渠道合规数据的深度发掘与融合。起始阶段,从企业内部的合规制度文件、业务操作中涉及合规的流程记录,以及外部行业规范和法律法规条文等共同构成的综合资料集入手,启动非结构化数据处理流程。
这些处理流程以分布式方式运作,依靠并行且极具扩展性的处理体系,能够有效应对因法规变更、业务范畴扩大等引发的数据规模和类型的持续动态变化。
流程中配备了丰富且可定制的解析工具。简单的像正则表达式,能快速定位符合特定合规格式的数据;复杂的如前沿的自然语言处理(NLP)技术,可精准识别数据里的合规相关实体(如具体法规条款、合规流程中的关键步骤)以及它们之间的关联。
比如,从企业业务流程数据里,解析工具能提炼出“接触客户敏感信息前需完成三级安全认证”这类关键合规准则。
数据处理流程的产出是一个合规知识图谱数据集,其中完整涵盖了从多源数据中精心提取的合规规则与关联。
此数据集被导入数据架构后,用户可在此对数据进行映射与协调,并将其与财务数据库(用于核对财务领域合规数据关联)、供应链数据库(关联供应链环节的合规要点)等其他核心数据源相互连通,进而构建出一个全面、完整且紧密关联的合规知识图谱。
例如,当该数据集与财务数据库整合后,能清晰梳理出资金流动环节里涉及的合规规则及关联,像每一笔重大资金调动所对应的合规审批流程和相关法规依据。
最终形成的“操作规则与合规性图谱集市”,在人工智能工厂中承担着中央控制的关键职责。它在人工智能工作流程及操作过程中,保障治理的合规性,确保企业运营严格契合内部合规管理要求与行业通行的合规标准。
AI工作流不仅能够查询数据,还可以查询知识图谱中存储的合规信息。Altair CoPilot 是一款利用知识图谱的对话助手,其工作流与数据架构实现了无缝集成。
任何智能代理工作流程都可以对“运营商规则与合规图谱”进行查询,以此确保用户请求符合企业和国家的相关指导方针。
例如,当AI工作流请求包含地址、姓名或其他个人身份信息的数据时,由于这些数据被标记为高风险数据,系统响应会触发人工审批流程。在数据访问方面,从完整数据集到单个数据点,都可以在灵活的粒度级别上进行限制、标记或分类。
一旦出现不当的数据请求,会在工作流中直接被标记并处理,同时详细记录用户、相关法规等元数据。这些日志还可以进一步存储在数据架构中,以便进行全面的合规性分析。
Altair RapidMiner 通过将数据架构中创建的知识图谱与AI工作流相结合,构建出完整的AI Fabric,形成了一个强大的系统,以此确保治理合规性。这种集成式的方法,不仅保障了合规性,还使企业能够快速适应不断变化的监管环境。