本标准规定了WARC文件格式:--存储来自于主流互联网应用层协议(如HTTP、DNS和FTP)的有效载荷内容和控制信息;--存储与其他已存储数据(如主题分类、语言、编码)相关的任意元数据;--支持数据压缩,且保证数据记录的完整性;--存储来自收割协议的全部控制信息(如请求标头信息),而不仅仅是响应信息;--存储与其他已存储数据相关的数据转换结果;--存储与其他已存储数据相关的重复监测活动(当相同或者大体相似的资源出现时,可以减少存储消耗);--在不中断当前功能的情况下进行扩展;--支持对超长记录在所需处进行截断或分段操作。
英文名称:
Information and documentation—WARC file format
中标分类:
综合 - 经济、文化 - A14图书馆、档案、文献与情报工作
ICS分类:
信息技术、办公机械设备 - 信息技术应用 - 35.240.30信息技术在信息、文献和出
采标情况:
ISO 28500:2009
发布部门:
中华人民共和国国家质量监督检验检疫总局 中国国家标准化管理委员会
发布日期:
2017-07-12
实施日期:
2018-02-01
提出单位:
全国信息与文献标准化技术委员会(SAC/TC 4)
归口单位:
全国信息与文献标准化技术委员会(SAC/TC 4)
起草单位:
国家图书馆、中国科学院文献情报中心、中国国防科技信息中心、中国科技信息研究所、北京万方数据股份有限公司
起草人:
毛雅君、李春明、吴振新、真溱、曲云鹏、张晓丹、张兰、杨贺、敦文杰、张彪
页数:
32页
出版社:
中国标准出版社
出版日期:
2017-07-20