本文摘要(由AI生成):
这篇文章主要介绍了数据准备工具 Knowledge Hub,包括它的必要性、功能、优势等。Knowledge Hub 是一个基于浏览器的数据准备平台,提供团队驱动的数据准备和集中的数据市场,以加速整个企业的协作和数据治理。它具有自助式分析、集中数据市场、可控的团队协作与数据治理、数据社会化等特点,可以优化分析师的工作效率、在企业内培养数据驱动的文化、降低 IT 负担、连接数据孤岛、奖励数据分析给企业带来的贡献、简化数据发现、提高数据质量、消除重复数据和工作。文章还介绍了 Knowledge Hub 的产品特点和亮点,并通过一些应用场景进行了说明。
01
为什么要有专门的数据准备工具
纽约 时报曾有过一篇报道,数据科学家在挖掘出有价值的“金块”之前,要花费50%至80%的时间在收集数据、准备不规则数据、清理数据的烦冗任务上。混乱的数据在数据科学家的工作中是非常耗时的。
没有合适的工具,数据准备将是耗时的、昂贵的、手工且容易出错的,下面是一些公司在此方面的反馈。
Blue Hill:
分析师花费80%的时间来查找和清理数据,每年每个分析师花费公司22000美元。
Forbes:
88%手动创建的电子表格包含重大错误。
IBM:
2016年,糟糕的数据质量使得美国损失3.1万亿美元。
Harvard Business Review:
大多数企业单位使用小于50%的结构化数据和小于1%的非结构化数据进行业务决策。
因此,数据准备方案不再是一个可选项任务,它已经变成了数据分析流程中的必选项。
同时,在越来越强调团队协作的环境下,企业分工越来越重要,对数据来说,创建社区型的数据市场,一人创建,全体受益的模式,在现代型企业中越来越受欢迎。
02
Knowledge Hub企业级云端数据准备和数据市场
Knowledge Hub是一个基于浏览器的数据准备平台,提供团队驱动的数据准备和集中的数据市场,以加速整个企业的协作和数据治理。
自助式分析工具可以使用户更加灵活的进行数据处理。然而,灵活性的提高可能会导致孤立和单干的工作,这是导致一些数据无法应用的部分原因。
Knowledge Hub通过专业的方案解决了这些问题,这样可以使企业用户更加收益,同时,简化和改进了IT数据的治理工作。
为所有人进行的数据准备
Knowledge Hub是唯一一种将简单但功能强大的数据准备与基于浏览器的协作界面相结合的数据准备解决方案。
Knowledge Hub扩展了数据访问,消除了数据清理和数据转换命令的编码和脚本,简化了数据融合,并在协作环境中自动执行可重复的流程,使日常用户能够克服任何报告创建或分析的挑战。
Knowledge Hub是唯一一个提供可互换的数据准备流视图和网格视图的数据准备解决方案,以适应各种用户偏好和应用场景。
集中数据市场
在许多企业单位中,数据准备、报告创建和分析都在各个桌面端上完成。
Knowledge Hub的创新界面促进了数据文化从单个无名数据英雄到到团队相互协作的巨大变革。
Knowledge Hub为每个部门的数据专家提供集中的位置,以共享原始和/或整理的数据集、报告、模型、工作空间和数据专业知识,打破数据孤岛,消除重复工作,提高整个企业的数据有效性。
可控的团队协作与数据治理
Knowledge Hub的治理功能通过提高最终用户灵活性而不影响数据完整性来消除数据访问的顾虑和IT负担。
凭据设置允许管理员根据预定义规则提供或限制对数据,工作空间和业务模型的访问权限。
此外,数据沿袭,活动日志和完整的数字指纹使管理员能够始终清楚地了解谁访问数据,他们如何使用数据以及如何更改数据。
数据社会化
Knowledge Hub是第一个集成“基于机器学习”众包功能的数据准备解决方案,用于加速和改进整个企业的协作。
Knowledge Hub为您的企业数据提供了类似Netflix的体验。共享、评论、喜好、关注和订阅被整合在一起,以提供智能建议,从而推动更好的数据发现、促进协作并确保在分析中使用可信数据。
将数据社会化引入到数据准备中可以培养更高效的数据驱动决策文化。
发掘企业数据贡献者
每个人都喜欢因其努力工作而受到认可。在Knowledge Hub,所有贡献(数据集、业务模型等)都清楚地标记了创建者、喜好、分享、批准、排名和使用的时间,将更加容易识别和奖励对企业洞察力产生重大影响的人。
03
Knowledge Hub 产品介绍
产品特点:
可视化、无代码数据准备
创建可信数据市场
“数字指纹”的数据使用
直观的搜索和社交功能(如,订阅、跟踪)
机器学习建议-新数据集和数据准备步骤
角色化以奖励参与
支持任何数据类型
高性能混合架构(支持Microsoft和Linux)
基于浏览器并支持云构建
与您的基础架构(LDAP、SSO、AD)集成
产品亮点:
优化分析师的工作效率
在企业内培养数据驱动的文化
降低IT负担
连接数据孤岛
奖励数据分析给企业带来的贡献
简化数据发现
提高数据质量
消除重复数据和工作
04
应用场景
对账&异常报告
服务对象:会计和财务、运营、信用卡、支付、ATM、内部审计、合规与风险、人力资源
困难点:信用单位无法控制从第三方客户或系统(如ATM或信用卡和支付服务)接受到不同版本的数据格式。手动调整这些不同报告中的数据非常耗时且易出错。
解决方案:利用预先构建的提取“模型”,消除在协调和异常报告中可能出现的人为错误。
自动获取不同的数据,并将其标准化成统一的格式,不论何种数据源;
配置“负链接”和/或“计算字段”,以主动创建异常报告;
节省时间,提高准确性,避免罚款和其他与错误相关的结果。
会员消费分析
服务对象:市场、销售、高管、核心系统
困难点:营销部门必须知道客户关心什么,这样才能精确的定位他们的客户。但是,只能通过银行核心系统的自动化交易所和借记报告访问此信息,并主要以TXT,PDF,CSV等格式提供信息。
解决方案:Knowledge Hub可以使市场营销部门能够将ACH和借记报告转换为可操作的数据,了解会员将钱花在哪里,并有效的推广产品和服务。
市场营销和会员服务事业“筛选器”来识别和解决风险;
在其它金融机构支付贷款或抵押的会员可获得有竞争力的利率信息;
使用其它金融科技产品(如Paypal,支付宝,微 信)的客户可获得有关转账以外的服务信息;
有效的信息传递提高了客户留存率,并促进了新客户的加入。
抵押贷款服务
服务对象:抵押服务
困难点:一些抵押贷款服务平台创建大型报表,这些报表不容易存储或转换为可用于报告和分析的数据。因此,迟缓的数据准备会导致积压贷款服务和客户报告积压。
解决方案:Knowledge Hub可以提供一个内容管理系统,它在基于文本的报告和数据仓库计划之间创建无缝集成点。
存储在服务器中的“模型”简化了数据清洗和创建报表;
报告是可索引,可存储和可挖掘的;
大大减少了全时等效(FTE)时间依赖性和尝试管理和集成传统服务系统提供的核心数据源的工作量