标签:
题目:
1-1 数据压缩的一个基本问题是“我们要压缩什么”,对此你是怎样理解的?
1-2 数据压缩的另一个基本问题是“为什么进行压缩”,对此你又是怎样理解的?
1-6 数据压缩技术是如何分类的?
答案:
在回答题目之前,先对‘数据压缩’进行一定的了解,数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。
对1-1的解答:
因为在有限的空间内,不能存放无限的东西。大数据的到来,使数据爆炸式的增长,因此我们对数据进行压缩。
对1-2的解答:
由于空间有限,对传输速率、存储和处理效率的要求,因此要进行压缩。
对1-6的解答:
多媒体数据压缩技术按照数据来源的不同,可以通过使用不同的数据模型和算法组合得到最有效的压缩效果。
信息理论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。去掉冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,数据则不能完全恢复。不过在允许的范围内损失一定的熵,数据可以近似地恢复。根据压缩过程中是否减少了熵,目前常用的压缩编码方法可以分为两大类:一类是无损压缩编码法(Lossless compression coding),也称冗余压缩法或熵编码法;另一类是有损压缩编码法(Loss compression coding)。
无损压缩法去掉或减少了数据中的冗余,但这些冗余值是可以重新插入到数据中的,因此,这种压缩是可逆的,也称为无失真压缩。为了去除数据中的冗余度,常常要考虑信源的统计特性,或建立信源的统计模型,因此许多适用的冗余度压缩技术均可归结于统计编码方法。此外,统计编码技术在各种熵压缩方法中也经常会用到。统计编码方法有霍夫曼编码、算术编码、游程编码等。冗余压缩法由于不会产生失真,因此在多媒体技术中一般用于文本、数据以及应用软件的压缩,它能保证完全地恢复原始数据。
有损压缩法压缩了熵,会减少信息量。因为熵定义为平均信息量,而损失的信息是不能再恢复的,因此这种压缩法是不可逆的。熵压缩主要有两大类:特征抽取和量化。特征抽取的编码方法如基于模型的编码、分形编码等。对于实际应用而言,量化是更为通用的熵压缩技术,包括特征提取、零记忆量化、预测编码、直接映射、变换编码等,其中预测编码和变换编码是最常见的实用压缩编码方法。
标签:
原文地址:http://www.cnblogs.com/wxh-bk/p/5798456.html