前一段时间完成了glusterfs restful平台的重构,完成了glusterfs restful API的代码编写。但是,仍然存在一部分问题。
显著的功能性问题是,glusterfs只提供了基于文件的分布式存储,如图:一个数据文件中的File 1,File 2,File 3会分布到不同机器。
而我们存储的是数据文件夹,是一个文件夹是一个整体,这样一旦一个机器出现故障,所以集群中存储的数据文件将失效;而且,在热区或者在线区,会选择存储资源非常昂贵的固态存储设备,并且glusterfs提供的备份机制对于存储利用率非常低,是线性增长消耗存储空间的,所以对于我们并不适用。我们比较好的解决方案是,将一个数据文件夹整体存储在一台机器上,这样即使分布式中的一台机器宕机,或者出现故障,别的机器中存储的数据文件夹仍然可用,提高稳定性。
今天和涛哥讨论,下一步工作分为两部分同步进行:
1. 总结整理前一段实现的glusterfs restful API的框架,结果,写一篇技术实现类的论文。
2. 研究glusterfs这部分的实现机制,修改源代码,实现文件夹为单位的分布式存储。