本文摘要(由AI生成):
Altair Monarch 是 Altair 的数据准备工具,已有三十年的历史。它提供了用户需要的所有基本功能和支持数据准备迭代特性的无代码接口,拥有直观的数据视图,可帮助用户轻松优化数据准备。与之相比,Alteryx 不是为迭代而设计的,所以当用户意识到他们需要改变过程时,它需要耗费一定时间并进行手动返工。
# 总结 #
Altair Monarch™提供了用户需要的所有基本功能和支持数据准备迭代特性的无代码接口。它同时拥有直观的数据视图,帮助你决定什么是有效的,什么是需要调整的,可帮助用户轻松优化数据准备。
然而,Alteryx 不是为迭代而设计的,所以当用户意识到他们需要改变过程时,它需要耗费一定时间并进行手动返工,将耗费大量时间和人力。
Alteryx
VS
Altair
Altair Monarch 是 Altair 的数据准备工具,已有三十年的历史。利用 Monarch 可从多种数据来源中快速、简单地提取需要的数据,包括将非结构化数据,如 PDF、文本、网页等,转化为行与列的结构化数据。
提取数据后,用户可以在无需编码和基于鼠标点击的方法下进行数据的清理、转换、合并、去重等工作,并且可以导出到任何的数据分析平台或者 BI 工具进行进一步的操作。
在数据准备方面,流程是非常重要的,Monarch 建立在30年的发现、转换和共享准确数据集方面的经验之上,用于预测分析和机器学习。
Altair Monarch 提供了独特的能力:
从各种复杂的半结构化文件、大数据和其他结构化来源获取和准备数据
利用80+预构建的数据准备功能,快速无缝转换不同的数据,并保证无差错
只需点击一下,就能从电子表格、PDF、日志文件、JSON、XML、文本文件、网页等中提取信息
轻松地从复杂的、分层的 Excel 文件(如从业务系统导出的报告)中提取数据
直接将数据导出到云可视化解决方案,如 Tableau、Qlik、Power BI 和 Cognos Analytics
轻松重复、自动化和共享以前使用的工作流程
在不编写脚本或需要 IT 支持的情况下准备数据
维护生产流程和分销的完整传承和管理
最近对 Monarch 和 Alteryx 在整体性能、易用性和功能上进行了比较。下面我们将在各个分项上,给大家做简要说明:
总体可用性
Altair
✔ 类似 Excel,熟悉的界面使不同技能水平的用户能够准备数据
✔ 主要是拖放和/或鼠标点击命令---不需要脚本
✔ 如有必要,可提供公式编辑器,用于创建复杂的准备功能
✔ 业务用户无需脚本即可解锁多结构 (XML、JSON) 和半结构化 (PDF) 数据源的独特解决方案
✔ 自动解析和手动报表抓取功能
✔ 将沿袭和变更的历史编目在工作区中,保证透明性、易管理和一致性
✔ 可快速将数据集拉入预览区和工作区,以便进一步处理
✔ 数据可直接以行和列的形式呈现
✔ 所有的更改都是可见的,以便立即反馈操作的有效性
✔ 提供快速、简单的结果/工作空间共享和管理
Alteryx
✖ 数据清理过程的接口是格式化的
✖ Alteryx 的处理需要培训,并面向技术专业人员
✖ 可拖入工作空间并手动连接的几个可自定义功能
✖ 需要比 Monarch 更多的单击和鼠标拖动来完成相同的功能
✖ 没有数据更改的即时反馈,只有点击“运行”后的问题警告
✖ 允许用户构建和准备结构化和非结构化数据
✖ 多结构数据需要 R 编码的知识,与 Monarch 相比,R 编码技术要求高、复杂度高,很难调试
数据连接和输入选项
Altair
✔ 支持文件类型(包括PDF)数量最多的的主流数据准备软件
✔ 解析半结构化文件类型的最有效解决方案
✔ HTML 文件和 web 抓取支持
✔ 支持的文件类型:PDF, Excel, Delimited Text, MS-Access, HTML, JSON, XML, fixed- width text, EBCDIC, Google Sheets, OData, SAS transport, generic ODBC, generic OLE DB, Oracle, SQL Server, MySQL, DB2, PostgreSQL, Informix, Teradata, Vertica, SAP Business Objects, Sybase IQ, SQL Azure, Amazon Redshift, Google BigQuery, IBM Cloudant, Cassandra, MongoDB, Apache Hive, Amazon EMR Hive, Cloudera CDH Hive, Hortonworks Hive, MapR Hive, Spark SQL, Cloudera Impala, Google Ads, Google Analytics, Hubspot, Salesforce, Netsuite, JIRA, Zendesk, SugarCRM, Splunk, Active Directory / Sharepoint / Box / Google Drive Metadata
Alteryx
✖ 兼容标准文件类型,如 Access, Excel, JSON 和 TXT
✖ 兼容的数据库包括 Amazon Aurora, Google Sheets, Adobe Analytics 和 Salesforce
✖ 不能像 Altair Monarch 那样无缝地处理 PDF 文件和其他半结构化数据
输出功能
Altair
✔ 导出到 CSV, Excel, Access, SAS, IBM Cognos Analytics, QlikView, Qlik Sense, Tableau, Microsoft Power BI 及更多
Alteryx
✖ 导出到数据库,包括 Amazon Redshift, Apache Avro, Oracle Database, Google Analytics, Marketo, Tableau 和 TXT
✖ 可以导出到 Google Earth KML 和 Tableau TDE 文件
业务用户的用户界面的直观性
Altair
✔ 易于浏览和有效使用
✔ 数据准备画布在视觉上类似于 Excel,提供了熟悉性和一致性
✔ 选项以简单、有组织的方式呈现
✔ 无需预先定义步骤的顺序。用户可以方便地在清理、连接和转换之间切换,以便根据需要修改数据
Alteryx
✖ 业务用户需要投入大量时间来学习使用全部功能
✖ 适用于具有IT背景的个人使用,并要求用户按顺序连接每个步骤
与半结构化数据的兼容性
Altair
✔ 从半结构化文件中自定义字段和信息
✔ 自动和手动解析 PDF 中的信息
✔ 从复杂的、分层的 Excel 文件中解析信息
Alteryx
✖ 不能从半结构化的 PDF、Excel 或 TXT 文件中解析信息
✖ 允许导入 TXT 文件,但它无法以合乎逻辑或富有成效的方式提取数据
数据准备/混合功能
Altair
✔ 只需单击右键并选择移动列即可轻松更改列的顺序
Alteryx
✖ 用户可以重新排列数据,但必须首先拖放"选择"功能
✖ 不像"移动列"那么简单,它是一个通用的"选择"功能
准备阶段的自动可视化和/或直方图
Altair
✔ 在预览阶段提供视觉效果和直方图,以帮助解释数据发生了什么以及识别错误
Alteryx
✖ 不可用