本文摘要(由AI生成):
这篇文章主要介绍了 Altair Knowledge Studio 数据分析平台的定义、优势、适用业务场景、新版本功能及详解。Knowledge Studio 是一个先进的数据挖掘和预测分析工作台,具有行业领先的专利决策树、策略树以及工作流和向导驱动的图形用户界面。它可应用于信用风险、欺诈、市场营销等业务场景,新版本提供了更高效的数据准备和建模方法,包括 AutoML、时间序列预测、Python 代码节点、R 代码节点以及新的 WOE 输出格式选项等功能。
Altair® Knowledge Studio® 是一个先进的数据挖掘和预测分析工作台,以其行业领先的专利决策树、策略树以及工作流和向导驱动的图形用户界面而闻名。
凭借先进的预测建模功能,Knowledge Studio 为数据挖掘周期的所有阶段提供全面的预测分析,在模型开发和部署方面功能尤其强大。
Knowledge Studio 的独特之处在于它的通用性和效率。它的高性能可视化环境为用户提供了直观的工作流和向导驱动的图形用户界面,帮助用户在无需编码的情况下建立有效的模型。
Knowledge Studio可应用于众多行业和部门,比如信用风险、欺诈、市场营销、销售、CRM分析和工程等等。
业务分析师和定量分析师可以通过可配置的设置访问更复杂的功能,以便对高级模型参数进行微调,以适应任何复杂性的模型。
新版本的核心内容是在数据准备和建模方面为用户提供更高效的方法,提升用户体验。
AutoML – 在 AutoML 节点模型中新增特征工程(变量变换)的选项
时间序列 – 基于 Keras 的时间序列预测
Python代码节点 – 与 Jupyter Notebook 的集成
R代码节点 – 代码可以保存为自定义库面板中的新节点,可以在其中重命名、在工作流中使用或导出到文件中
WOE – 增加了两种输出格式选项:Excel 和 Word
01
AutoML – 特征工程
特征工程选项卡定义了变量转换,这些转换适用于为 AutoML 选择的所有变量,并在 AutoML 过程的数据预处理和建模阶段之间进行。它们仅应用于训练数据集,并在验证数据集上进行评估。
主要包括主成分分析(PCA)、因子分析、最优分组、WOE等。
02
时间序列 – 基于 Keras 预测分析
使用 Keras 可以进行时间序列预测。Keras 是一个开源软件库,它使用 Python 接口进行人工神经网络及深度学习。时间序列预测是根据以前的观测值来预测未来的值。
Knowledge Studio 支持 3 种预测模型:
长短时记忆(LSTM)
双向 LSTM
封闭循环单位(gru)
03
Python 代码节点
– 与 Jupyter Notebook 的集成
Knowledge Studio 用户现在可以利用最流行的数据科学工具之一进行代码开发和表示。Jupyter Notebook 是一个开源的网络应用程序,允许用户创建和分享实时代码、方程和可视化等功能。
Knowledge Studio 与 Jupyter Notebook 的集成能让您轻松地将本地 Knowledge Studio 数据格式转换为 pandas 数据表格式。
04
R 代码节点 – 自定义用户功能库
在 R 代码编辑器中,可以将代码保存为自定义库中的新节点。
05
WOE – 新增输出格式
WOE 增加了两种输出格式选项:Excel 和 Word,输出包括了所有的 WOE 步骤和图象。