中国数据存储服务平台

最佳实践|杉岩MOS双引擎助力某动力学科研机构智能化档案管理

一、动力学研究——航空航天取得成功的理论基石

2021年3月26日,国家航天局发布2幅由我国首次火星探测任务天问一号探测器拍摄的南、北半球火星侧身影像,这无疑是我国深空探测成果的一个缩影。自2020年7月23日成功发射以来,天问一号探测器已累计飞行两百余天,为后续着陆和巡视探测奠定了良好的基础。这一切的背后,离不开科研人员的持续攻关,而相关的动力学研究便是重要的攻关领域之一。

某动力学科研机构是为适应中国航空航天事业发展需要而组建的,迄今为止已圆满完成大量航空航天飞行器相关的科研任务,获得国家级和部委级科技进步奖千余项。作为国内动力学研究的核心力量,几十年来,机构科研人员默默坚守,逐一攻克该领域发展中的层层阻碍,为我国迈向科技强国做出了突出贡献。

二、档案管理的新要求:数字化 合规化 智能化

该机构积攒了大量的历史档案资料,绝大部分是以非结构化数据存储的电子文档,包括纸质档案扫描件、录音、录像等。目前所采用的传统IT架构在海量档案存储管理面前显得捉襟见肘。

海量小文件存储

目前档案扫描件数量超过1亿,当录入文件数达到2000万,原有的集中式存储便已出现明显性能瓶颈,影响数据读取和备份效率。后续总文件数预计超过5亿,传统存储显然无法支撑。

档案数据智能处理

由于档案扫描件多是PDF格式,信息检索查阅不便。比如:科研人员想要基于文献内容查阅历史资料就很难实现。因此,该机构要求存储能够对扫描件进行内容提取,进而支持基于内容的检索,提升效率。

全生命周期管理

按照合规要求,档案需长期甚至永久保存,因此要制定生命周期管理策略,让档案数据在在线库、近线库和离线库间自动迁移。而目前无论是原有存储本身还是档案管理系统都没有考虑此问题。

跨部门档案收集

该机构档案资料分散在不同下属机构,以往是通过移动硬盘拷贝到传统存储中,效率低且存在安全风险。

为了满足上述需求,客户最终选择杉岩MOS海量对象存储替换原有传统存储,实现IT基础架构的演进升级。

三、基于MOS构建海量档案智能存储管理平台

MOS支撑海量存储与便捷管理

该平台基于多台杉岩对象存储一体机构建百TB级对象存储资源池,满足百亿级小文件存储和高效访问的需求,为该机构提供统一的非结构化数据存储和管理平台,并通过生命周期管理策略、智能数据处理引擎等实现电子化档案的集中存储、全局管理、智能处理和自动运维。

截屏2021-01-28 下午3.56.48

图1.基于MOS构建海量档案智能管理平台

MOS智能数据处理引擎带来效益加成

值得一提的是,MOS独有的智能数据处理引擎在该方案为客户带来了极大价值。前述讲到,档案扫描件多是以单层的PDF文件形式进行存储,业务端无法基于PDF中的文字内容进行检索,查阅资料十分不便。

通过MOS智能数据处理引擎集成的OCR识别插件,客户可以根据需要设定文件处理策略,存储自动调用OCR识别功能,将单层PDF文件(文字不可读取)转为双层PDF文件(文字可读取),然后基于文字内容通过检索引擎建立全文索引,方便快速检索查阅,充分发挥档案资料的知识价值。

截屏2021-01-28 下午3.56.31

图2.MOS智能数据处理引擎实现档案数据智能处理

四、客户价值

集合海量存储核心引擎和智能数据处理引擎,MOS海量对象存储为客户带来显著价值。

安全合规:海量数据永久保存

MOS承载包括纸质档案扫描件、视频、图片在内的多种类型数据,分布式架构支撑海量小文件高效存取和未来扩展性,满足永久保存的合规性要求。

简化管理:集中存储与全局管理

基于MOS构建统一的存储和管理平台,实现全局档案自动化管理,避免了单独拷贝带来的安全风险,同时简化了运维。

效率提升:智能处理助力科研提效

通过智能数据处理引擎,存储自身实现档案数据处理,配合检索工具,科研人员能够快速获取所需档案资料,一定程度上提升了科研效率,让档案的知识价值最大化。

该项目基于MOS构建的智能存储管理平台,不仅解决了客户海量文件读写慢、共享管理难的痛点问题,同时,也证明了MOS智能数据处理引擎在数据价值利用方面的效益加成,是传统IT基础架构向新型分布式智能基础架构演进的成功实践。

未经允许不得转载:存储在线 » 最佳实践|杉岩MOS双引擎助力某动力学科研机构智能化档案管理
分享到: 更多 (0)