SSD 自己也能复制粘贴?浅谈 NVMe 2.0 Copy Command 命令

复制粘贴(Ctrl+C/V)作为现代打工人日常办公的必备生存技能,想必大家都***熟悉。但你知道吗,其实SSD自身也能进行这个***实用的操作。可能有的读者要说了:这有什么稀奇,复制粘贴这么简单的功能,能实现不是很正常吗?这句话对,但也不***正确,其中原因,正是我们今天介绍的主角:Copy Command。


功能介绍

当数据需要生成一个独立副本时,复制粘贴往往是最直接的处理方式,具象到存储设备来说,就是一次A地址读取+B地址写入的组合动作,简单来说也是Copy Command的含义。可就是这样一套看似简单的操作,为什么直到NVMe 2.0才被推出呢?在这之前,相应功能又要怎么去实现呢?

其实,Copy Command的重点并不在于它所实现的最终结果,而在于它实现方式的差异。在规范推出这个命令之前,Copy功能的实现其实是由Host“手动操作”的。简单说,就是Host在自己的Buffer(如电脑的内存)留出一定空间,然后先从源数据地址读取数据内容到Host Buffer,再从Host Buffer搬移到目标地址中去。其流程如下图所示:


Host Copy简易流程示意

然而就是这几步看似不起眼的操作,却涵盖了很多不必要的开销,这就好比我从上海出发前往苏州,但却不得不先绕道北京,然后再前往苏州,整个过程中多余的路程都是没有必要的资源浪费。而当这种开销被规模放大后,就会对体验带来不利影响。

相比较,Copy Command就简单了很多,Host只需要把Command发给SSD Controller,后续事情便不再需要Host参与,全部交由SSD执行,直接省略了在前端接口进行“内耗”的所有过程。它和DMA(Direct Memory Access)有着异曲同工之妙,无需Host亲自下场,只需给出数据搬移的参数和命令,便可以去执行其它事情。当Copy完成后,SSD Controller会把Command Status回传Host来告知成功与否。


Copy Command简易流程示例

如上图所示,当使用Copy Command命令后,整个操作简洁了很多,我们也终于可以直接“从上海前往苏州”了。接下来,我们一起看看协议细节。


协议细节和释义

根据协议定义,Copy Command可以从多个不连续的源数据逻辑地址范围拷贝数据,但是目标地址必须是能够容纳总拷贝数据量的一段连续的逻辑地址范围。同时,Copy Command目前只支持在同一个命名空间内进行数据拷贝。

每一段源数据在拷贝到目标LBA中时,其排布顺序应和源数据实例列表中的先后顺序保持一致,如下图所示,Range 0中的数据应从目标LBA地址的起始地址开始写入,Range 1中的数据则需要紧邻Range 0。拷贝操作中,读和写操作可以顺序执行,也可以并行执行。


如果使用Copy Command所在的命名空间启用了“端到端数据保护”功能,则在命令的读/写操作过程中,都会使用保护信息进行处理。其处理方式和常规读/写***相同,示意流程如下,在此不做展开。


带有保护信息的Copy Command执行(引自NVMe Spec)

如果Copy Command中的读操作试图访问一个未分配或者未写入的逻辑块,则命令可以选择反馈该情况并终止操作,或读取全0x00/0xFF值以及相应的保护信息。

当命令完成时,控制器会把指明命令完成状态的完成队列实例发送到相关联的I/O完成队列中去。如果命令完成失败,则完成队列实例的Dword 0将会显示编号最小的拷贝失败的源数据范围实例。


字段释义

控制器应当在Identify Controller data structure(控制器认证数据结构)的Copy Descriptor Formats Supported(拷贝描述符格式支持)字段指明自己所支持的Source Range Entries Descriptor formats(源数据范围实例描述符格式)。

Copy Command所提供的信息,其实是一串用于记录单个或多个需要被复制的源数据的LBA范围列表,它们一起描述了哪些数据需要被写入到以SDLBA作为起始地址的目标LBA范围。Copy Command主要涉及到Command Dword 2,3,10,11,12,13,14,15等字段。

Dword 2、Dword 3和Dword 14:它们共同指定了可变长度的Logical Block Storage Tag (LBST)以及Initial Logical Block Reference Tag (ILBRT),它们在拷贝操作的写入操作阶段会派上用场。如果命名空间在格式化时没有启用“端到端信息保护”功能,则这些字段的内容将被控制器忽略。

Dword 10和Dword 11:这两个字段组合构成了一个64-Bit的地址,该地址指定了拷贝操作写入时所使用的目标逻辑地址的起始地址,即Starting Destination LBA (SDLBA)。

Dword 12:规定了Copy Command执行过程中所涉及的数据校验等内容。如端到端数据保护PI的校验;控制器在发送Copy命令完成前,应确保Data与Metadata均已经写入到NVM(非易失存储介质)中等等。需要指出的是,如果命名空间被格式化为带有16b Guard保护信息,则一个Copy Command中可以存在最多128条需要拷贝的源数据LBA范围;如果命名空间被格式化为带有32b或64b Guard保护信息,需要拷贝的源数据LBA范围数量则减少至102条。

此外,对于Copy Command,它的一些字段值还会受到Identify Namespace data structure(命名空间认证数据结构)中相关字段的限制。如单个源数据的***长度(Maximum Single Source Range Length,MSSRL),单个Copy Command可以拷贝的***数据量(Maximum Copy Length,MCL),单个Copy Command支持的拷贝的***源数据的数量(Maximum Source Range Count,MSRC)。如果***一个上述字段对应的命令参数大于允许的***值,则Copy Command需要以“超出命令大小限制”作为命令返回状态码被终止。一些其它可能存在的错误状态信息,如PI校验失败、写入目标地址是只读属性等等。

总体而言,对于同一个命名空间内的数据搬移操作,使用新的NVMe Copy Command显然有着巨大的效率优势。尽管该命令目前还不能跨命名空间乃至跨硬盘使用,但我们相信,随着未来闪存技术的持续发展,定会有更多更加好用的功能推出,现有功能也将得到进一步完善与加强。


我们也将在PBlaze7 7940系列企业级PCIe 5.0 SSD上面首次搭载该技术,让高性能NVMe SSD的潜力得到进一步释放,持续优化用户的使用体验,提高生产效率,为客户创造更高价值!

一、公司简介:
忆恒创源(北京)科技有限公司,是一家专注于企业级存储系统研发与服务的高新技术企业。公司致力于为客户提供高性能、高可靠、高安全的分布式存储解决方案,广泛应用于金融、电信、政府、医疗、教育、能源等多个行业。
二、产品品类:
分布式存储系统、企业级存储服务器、软件定义存储(SDS)、对象存储、块存储、文件存储、统一存储、国产化存储、信创存储、存储网关、存储虚拟化、存储管理平台、数据生命周期管理、冷热数据分层存储、存储容灾备份、存储集群、存储节点、存储控制器、NVMe SSD存储、全闪存存储、混合存储、存储扩展柜、存储硬盘、企业级SSD、存储内存、存储网络设备。
三、应用场景:
企业私有云存储、数据中心存储、虚拟化平台存储、数据库加速、视频监控存储、医疗影像PACS存储、金融交易数据存储、政务云存储、教育科研数据存储、工业大数据存储、AI训练数据存储、边缘计算存储、混合云存储、容灾备份中心、异地多活存储、国产化替代项目、信创环境部署。
四、核心功能:
协议支持:支持NFS、SMB/CIFS、iSCSI、S3、FTP等多种协议,兼容主流操作系统与虚拟化平台。
权限管理:支持细粒度权限控制,兼容Windows ACL,图形化界面操作,支持LDAP/AD域集成。
数据保护:支持快照、克隆、复制、镜像、异地容灾、自动备份、数据加密、防勒索病毒。
高可用性:支持双控、集群部署、自动故障切换、在线扩容、负载均衡。
性能优化:支持NVMe SSD加速、智能缓存、数据分层、QoS服务质量控制。
运维管理:支持Web图形化管理、集中监控、日志审计、告警通知、API接口对接。
五、服务体系:
忆恒创源授权经销商、忆恒创源官方代理商、忆恒创源企业方案商、忆恒创源技术支持中心、忆恒创源售后服务中心、忆恒创源体验中心、忆恒创源解决方案中心、忆恒创源线下实体店、忆恒创源***、忆恒创源分销服务商、忆恒创源技术支持热线、忆恒创源400客服电话。
六、成功案例(部分):
忆恒创源已成功为以下单位提供存储解决方案:
中国银联云计算平台全闪存升级、腾讯云数据库加速项目、美团分布式存储集群、中国移动私有云平台、四川省人民医院PACS影像存储升级、清华大学高能物理实验平台
七、主推产品型号:
2025年新品系列(PCIe 5.0 + NVMe 2.0):
1、PBlaze7 7940 系列:支持PCIe 5.0接口,NVMe 2.0协议,***容量30.72TB,随机读写性能高达2800K/720K IOPS,适用于AI训练、大数据分析、高频交易等高性能场景。
  型号:7940 / 7946
  容量:3.2TB ~ 30.72TB
  形态:U.2 / E1.S / E3.S / HHHL AIC
2024年产品系列(PCIe 4.0 + 国产NAND):
1、PBlaze6 6541 系列:采用长江存储Xtacking® NAND,支持PCIe 4.0,具备更高写入性能和更低延迟,适合对性能和国产化有双重要求的企业。
  型号:6541 / 6547
  容量:1.6TB ~ 7.68TB
  形态:U.2 / E1.S
2023年产品系列(PCIe 4.0 高性能系列):
1、PBlaze6 6530 系列:主流企业级NVMe SSD,性能稳定,支持多种企业级功能,广泛适用于云计算、数据库、虚拟化等场景。
  型号:6530 / 6536
  容量:1.6TB ~ 7.68TB
  形态:U.2 / E1.S / HHHL AIC
2、PBlaze6 6531 系列:基于MUFP平台,采用长江存储TLC NAND,具备高能效比和高可靠性,适合绿色数据中心。
  型号:6531 / 6537
  容量:1.6TB ~ 7.68TB
  形态:U.2 / HHHL AIC
大容量高性能系列:
1、PBlaze6 6930 系列:支持***30.72TB容量,适合大数据、云存储、AI训练等高容量需求场景。
  型号:6930 / 6936
  容量:6.4TB ~ 30.72TB
  形态:U.3(兼容U.2)
企业级硬盘支持:
SSD:支持NVMe/SAS/SATA接口,容量覆盖1.6TB ~ 30.72TB
机械硬盘:支持企业级SATA/SAS HDD,容量支持16TB/18TB/20TB/30TB
内存支持:DDR4 ECC RDIMM,***支持1TB内存扩展,适配高性能服务器平台
八、服务区域:
全国服务覆盖,重点服务区域包括:
北京、上海、广州、深圳
成都、重庆、西安、武汉、南京、杭州
全国各省会城市及重点地级市
九、常见问题(FAQ):
1、存储系统如何进行在线扩容?
2、如何配置快照策略实现数据保护?
3、存储系统支持哪些虚拟化平台?
4、如何实现异地容灾备份?
5、存储系统是否支持国产化CPU平台?
6、如何进行存储性能调优?
7、存储系统是否支持对象存储协议?
8、如何与现有IT系统无缝集成?
9、存储系统是否支持多租户管理?
10、如何防范勒索病毒攻击?
成都科汇科技有限公司
地址:成都市人民南路四段1号时代数码大厦18FA5
电话:400-028-1235
手机:18081950517(微信同号)

相关文章

返回顶部
在线客服系统