首页 热点 业界 国际新闻 数码 电子消费 通信 前沿动态

联合建模:DarwinML自动建模最佳实践, 全流程自动化的建模

2021-01-13 09:49:00 来源 : 壹点网

探智立方的愿景还只是做好模型自动化生成这一件事。创始人们希望能够通过 AutoML 技术降低人类的重复性劳动,甚至在未来 3-5 年时间里实现超越人类的水平。探智立方一站式全自动机器学习平台DarwinML 2.0升级,在为企业带来全流程自动化的建模能力的同时,显著提升了AutoML技术在企业中应用和部署的易用性,让普通业务人员也可以参与AI开发,帮助更多企业实现人工智能带来的的商业价值,引领企业AI赋能。

为了帮助研究者专注于领域内积累,考虑到医疗研究者同时面临临床医疗和病理研究等多方压力,在使用DarwinML过程中,我们全程支持点击拖拽,中间结果可视可下载,研究者只需重点关注原始数据输入和评估结果输出。

DarwinMLDataFusion数据抽取平台

该平台帮助研究者将原始数据自动转换为可以被模型使用的特征数据,功能通过数据流形式实现,研究者可以通过修改参数和拖拽节点灵活改变特征抽取过程。下图是一个数据流示意图。

DarwinMLStudio自动建模平台

从数据导入和清洗为起点,DarwinML可自动建模并给出模型多方位评估结果,研究者只需要重点关注模型评估结果。研究者根据研究目标,自行返回去调整最初的数据清洗方案和模型设置,多次建模,选择符合研究需要的最终模型。

DarwinML自动建模平台全流程如下:

1)数据清洗:均衡样本分布,填补缺失值,消除特征异常值,文本特征数值化等。

2)模型设计:根据数据自身特性,以及研究者的参数设定,自动构建搜索空间内的最优网络结构。网络结构会在平台中显示如下。

3)

超参调优:对最优网络结构,结合数据特性,给出相匹配的最优超参组合,比如下图所示的“超参数”列中XGBClassifiler的learningRate和nEstimators等。

4)模型训练:使用最优网络及超参组合,实际训练模型。

5)模型评估:给出查全率,查准率,AUC等基础指标值,并且从模型角度,给出重要列分析结果,从样本角度,给出单个样本的重要特征分析。

同时可以根据需要,我们也支持只使用部分功能。比如可以导入一组新患者的检查数据,使用上次训练好的模型,只做模型评估,来对这一组新患者的患病几率做预判。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:
相关文章