
本数据集是什么?
本数据集是国家重点研发计划“基于大数据的软件智能开发方法和环境”公布的软件工程研究数据集系列之一,主要是当前主流自动化配置工具Puppet, Chef, Ansible和SaltStack的软件配置代码制品,这些制品基于配置即代码的方式,可用于对目标软件系统的自动化部署、配置和管理。
本数据集为什么?
配置管理工具利用配置制品实现软件系统的自动化部署和配置,是开发运维一体化(DevOps)的重要组成部分。当前互联网开源社区中存在数量众多的可复用配置制品,本数据集汇聚了当前主流配置管理工具的可重用配置代码制品,主要用于本项目的配置制品分类管理和检索问题的研究。同时,该数据集中的配置制品可以用于实现对目标系统的自动部署和配置。
本数据集有什么?
本数据集包括了Puppet, Chef, Ansible和SaltStack四个主流配置管理工具所对应的共计10,000+的配置代码制品,每个配置代码制品以压缩包(.rar)的形式存储,在压缩状态下共计1.11GB。这个数据集的存储如下:
scripts(数据集根目录)
-> ansible (ansible的制品目录)
-> chef (chef的制品目录)
-> puppet(puppet的制品目录)
在每个子目录下是以压缩包形式存储的配置代码制品。
数据下载
configuration-artifacts.part01.rar
(
140 MB)
configuration-artifacts.part02.rar
(
140 MB)
configuration-artifacts.part03.rar
(
140 MB)
configuration-artifacts.part04.rar
(
140 MB)
configuration-artifacts.part05.rar
(
140 MB)
configuration-artifacts.part06.rar
(
140 MB)
configuration-artifacts.part07.rar
(
140 MB)
configuration-artifacts.part08.rar
(
104.524 MB)