什么是冷数据?为什么企业80%的数据都在变冷?

很多企业第一次听到“冷数据”时,会以为它只是“不常用的数据”。这个理解没有错,但还不够完整。

在企业数据中心里,数据通常可以按访问频率分成三类:热数据、温数据和冷数据。热数据经常被业务系统调用,要求高性能、低延迟;温数据偶尔被访问,需要保留一定的可访问性;冷数据访问频率很低,但由于合规、审计、历史追溯、科研复用、AI训练等原因,不能简单删除。

冷数据的问题不在于“没人用”,而在于“不能删、还要存很久”。

冷数据为什么越来越多?

第一,业务数字化以后,企业几乎所有业务行为都会产生数据。医疗影像、电子档案、政务办件记录、金融交易凭证、科研实验数据、视频监控数据,都会不断沉淀。

第二,很多数据在产生初期需要高频访问,但过了几个月或几年后,访问频率会快速下降。

第三,合规要求越来越严格。数据虽然变冷了,但不代表可以删除。

冷数据应该如何存?

更合理的方式,是按数据温度建立分层架构:热数据放在 SSD 或高性能在线存储中;温数据放在磁盘阵列或近线存储中;冷数据进入长期归档层。

对于保存周期超过十年的冷数据,光存储具有明显优势。蓝光光介质具备长寿命、低功耗、物理WORM等特点,适合承担长期可信归档任务。

磐基光忆的思路

磐基光忆采用磁光电融合架构,将电存储、磁存储、光存储按照数据温度进行分层。电存储承担高频访问,磁存储承接温数据,光存储承担长期保存。