火星高科助力档案局开创档案收集新途径
火星高科 发表于:11年08月19日 14:56 [来稿] 存储在线
网络信息档案的收集、保存和利用的解决方案通过多种技术手段,适应目前网络上的多种类信息的采集,文字、声音、视频、音频、Flash、博客、微博等等,由于是模块式的结构,可以通过开发增加模块适应未来互联网多种信息发布形式的采集、编目以及再展现的形式。该解决方案通过页面分析和地址发现:随着互联网大量使用动态展现技术、Flash动画和视音频技术,网页链接地址被隐藏在各种展现的内容中。系统利用地址形成规则使用页面内容分析、用户地址截取、链接地址推测等多种方法准确获取各种页面元素的网络地址。
下载内容的缓冲管理:系统对下载内容进行智能缓冲,实现对同一内容元素的“一写多读”功能,合并对同一个元素的多个下载请求,并支持边下载边展现。
元数据提取和编目:系统提取页面的多种元数据,生成关键页面的缩略图,使用者也可以对网站和频道补充元数据(编目),用户可以设置分类、提取关键词等,形成内容的多种检索途径。
存储与归档管理:当页面数据量逐渐变得庞大时,系统支持对页面中的实体元素(主要是视音频数据)进行迁移式归档,以减少在线存储量。当用户需要访问相关页面时,系统支持“一揽子”回迁,把相关网站或频道的实体数据一次性快速回迁完毕。
页面组织和展现:系统对页面内容地址进行“本地化”处理,即把原来对原始网站的访问(绝对地址)全部过滤和替换成对本地系统的访问(静态和动态替换),以支持对网站的封闭式收藏和原始展现。(参考下面信息档案收集、保存和利用解决方案的逻辑图)
网络信息档案的收集、保存和利用的解决方案为了能够适应互联网技术的飞速发展,专门采用了模块组合式的架构,当随着信息网络档案工程逐步开展起来以后,需求也会有较大的发展,这个方案也会随之大幅度的提升,而这种构架恰恰适应方案的调整,而又不会影响到之前所做的各种档案管理工作。
总而言之,建立网络信息档案在我们国家目前还没有真正形成档案管理所必须采用的手段,但在现代城市中,如果要完整地记录历史,网络信息档案工作已迫在眉睫,但是的确作为档案行业我们要做的事情还很多,也许许多事情还没有准备好,可是我们也不能总停留在实验和研究阶段,只有真正做起来,才会逐步有我们自己的信息网络档案标准,也只有在实践中信息网络档案工作才能得以迅速发展和不断地完善,跟上现代城市发展的步伐。
