Sequencefile是什么

这篇文章主要介绍了Sequencefile是什么,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

创新互联主营浦东网站建设的网络公司,主营网站建设方案,成都app软件开发公司,浦东h5重庆小程序开发搭建,浦东网站营销推广欢迎浦东等地区企业咨询

SequenceFile是Hadoop API 提供的一种二进制文件,它将数据以的形式序列化到文件中。这种二进制文件内部使用Hadoop 的标准的Writable 接口实现序列化和反序列化。它与Hadoop API中的MapFile 是互相兼容的。Hive 中的SequenceFile 继承自Hadoop API 的SequenceFile,不过它的key为空,使用value 存放实际的值, 这样是为了避免MR 在运行map 阶段的排序过程。

SequenceFile的文件结构图:
Sequencefile是什么
 

Header通用头文件格式:

SEQ3BYTE
Nun1byte数字
keyClassName 
ValueClassName 
compression(boolean)指明了在文件中是否启用压缩
blockCompression(boolean,指明是否是block压缩)
compressioncodec
Metadata文件元数据
Sync头文件结束标志

感谢你能够认真阅读完这篇文章,希望小编分享的“Sequencefile是什么”这篇文章对大家有帮助,同时也希望大家多多支持创新互联,关注创新互联行业资讯频道,更多相关知识等着你来学习!


当前文章:Sequencefile是什么
链接URL:http://lszwz.com/article/iiesss.html

其他资讯

售后响应及时

7×24小时客服热线

数据备份

更安全、更高效、更稳定

价格公道精准

项目经理精准报价不弄虚作假

合作无风险

重合同讲信誉,无效全额退款