一个机器学习数据和实验的公共存储库

从事机器学习或数据科学项目时经常会遇到为具体问题选择最合适数据和算法工具的问题。OpenML就是一个可以与热衷于数据科学人员共享有趣的数据集并共同构建最佳解决方案的地方,它是一个用于机器学习数据和实验的公共存储库,它允许每个人上传开放的数据集,OpenML自动对每个数据集进行版本控制和分析,并使用丰富的元数据对其进行注释以简化分析。通过在线组织所有资源,你能轻松搜索成千上万个数据集,OpenML可无缝集成到现有数据科学环境中,使全世界的数据科学工作者相互协作并与整个社区共享详细的实验结果。并将其直接导入代码或工具箱中,或者快速查找相似的数据集以及最佳的机器学习方法。OpenML将直接集成到当今流行的机器学习工具中。这种简单自由的实验交流具有巨大的潜力,可以加快机器学习的研究速度,进行更大,更详细的研究,使研究变得更加高效。并为从业人员提供如何建立更好模型的自动建议。

作为开放的科学平台,OpenML为数据科学界带来重要价值。使机器学习和数据分析变得简单易用,协作开放,并在计算机和人之间实现最佳分工。

科研人员使用OpenML可以协助执行许多繁琐的日常工作:查找数据集,任务,流程和先前的研究结果,设置组织实验以进行进一步分析。而且新实验研究可以立即与现有技术进行比较,而不必总是重新运行其他人的研究成果。利用openml还可以将不同人的实验结果联系起来具有很大的发现潜力。

OpenML还为学生,科研人员和相关从业人员提供了一个有用的学习和工作环境。学生和科研人员可以轻松地探索最新技术,并通过贡献自己的算法和实验与顶尖人才相互协作。机器学习从业人员可以探索和重用针对特定问题的最佳解决方案,与科学界进行互动或有效尝试许多可能的方法。OpenML将是机器学习和数据挖掘教育的宝贵资源。

链接 https://www.openml.org

来了,老弟
-------------    本文结束  感谢您的阅读    -------------
0%