当前,企业级数据存储领域核心技术研发及应用市场规模在不断扩大,随之而来的是市场消费需求的增大。北京忆恒创源科技股份有限公司(以下简称“忆恒创源(Memblaze)”)自成立以来,聚焦于企业级数据存储领域核心技术研发及应用,不断推出具有更高性能的国产企业级SSD,形成了差异化竞争优势。
忆恒创源(Memblaze)把科技的命脉牢牢掌握在自己手中,在科技自立自强上不断进步,拥有超过200件闪存技术专利申请,其PBlaze系列企业级SSD在数据库、虚拟化、云计算、大数据、人工智能等领域广泛应用。忆恒创源(Memblaze)销量在中国品牌企业级SSD中处于领先地位。
近日,ChatGPT持续火爆,用户在短短两个月内迅速破亿,大量用户涌入导致ChatGPT访问和数据规模指数级增加。与数月前发布的版本相比,新的ChatGPT“智能”了许多,不仅可以像人类一样聊天交流,甚至能够完成一定程度的稿件撰写、视频脚本创作、翻译、代码,答题等操作。ChatGPT起初基于OpenAIGPT-3语言模型训练开发,用以完成自然语言处理的绝大部分任务。但由于GPT-3自身无监督模型的属性,使得在早先版本的对话中,会存在一些生硬、甚至不恰当的文本响应,交互体验并不理想。全新上线的ChatGPT由GPT-3.5训练模型微调而来通过加入RLHF(人类反馈强化学习训练,ReinforcementLearningfromHumanFeedback)来指导机器学习过程,生成更加符合人类偏好的对话结果。
ChatGPT早期使用的GPT-3数据规模约为45TB,主要来自于互联网,每天产生的数据内容约为45亿字。随着ChatGPT的开放体验,以及如今ChatGPT的再度火热,将不断有新的高质量对话案例产生,甚至呈现几何级增长。这些新增数据将有效推动训练模型的继续迭代,实现ChatGPT应用体验越来越好。
算力方面,ChatGPT由Microsoft为OpenAI开放的AzureAI超算平台提供性能支撑。该平台由NVIDIA、Microsoft联合打造,可以为OpenAI提供超过258000个CPU核心和超过1000颗GPU。强大的计算性能结合GPT-3高达1750亿的训练参数,也让不少行业从业人员称“ChatGPT是大力出奇迹”的结果。
根据Microsoft、NVIDIA的相关报道,未来,AzureAI超算平台还将升级至400Gb/sInfiniBand网络和性能更强的NVIDIAH100GPU,结合Azure先进的云计算架构与下一代NVMe高性能SSD,将可为任意规模的AI训练和深度学习推理工作负载提供可扩展的峰值性能,AzureAI超级计算机也将有望跻身Top500榜单前5名。
NVMeSSD作为存储IO设备,在AI训练等高性能应用场景正全面取代传统SAS、SATA硬盘,其读写性能已经达到7GB/s水平,并向速度更快的14GB/s快速进发,容量方面更是在短短数年间提高了数十倍,让更大规模的训练数据可以保存其中。
GPU是当前AI训练、AI推理普遍使用的算力芯片。相较于数年前行业使用的Tesla、TITAN等GPU,最新的A100、H100算力水平(FP16、FP8)已经提升了数百倍,结合DPU、IB网卡、MagnumIO等软硬件的支持与优化,为AI训练、专业渲染、自动驾驶、科学计算、医疗、视频分析等前沿应用全面加速。
GDS通过利用GPU和NVMeSSD中的DMA(DirectMemoryAccess)引擎,让NVMeSSD可以直接读写GPU专用内存(通常我们更习惯称之为“显存”),而不再需要经过CPU和系统内存中的反弹缓冲区(BounceBuffer),借此缩短IO路径,提高GPU的执行效率,降低系统内存消耗以及CPU占用。
系统空闲状态下,对比传统IO路径与GDS路径存储性能:随着IO队列深度增加,8片PBlaze66930系列SSD总的传输带宽增加。
得益于PBlaze66930系列SSD大压力下的出色表现,以及GPU在数据处理方面更强的性能,GDS在大压力下性能领先幅度更加明显,如,4KB小文件传输带宽可提升33%,延迟降低25%;而128KB、1024KB文件传输环节,传统路径和GDS路径存储性能均可完全发挥,接近50GB/s。
运行stressapptest将CPU、系统内存负载提高(2颗64核心CPU占用率为86%,内存带宽占用50%,达205GB/s),模拟在有计算密集型业务应用存在时,PBlaze66930仍然可以为AI训练提供的传输带宽。从结果看,虽然大量IO资源被占用,但PBlaze66930仍然可以为GPU提供系统空闲状态下50%以上的存储性能,其中,128KB、1024KB文件传输带宽可达系统闲时的75%以上。
如果说,GPUDirectStorage为AI工作负载提供了性能和响应时间优势,那么,PBlaze66930系列PCIe4.0高性能企业级NVMeSSD则凭借其大压力下的出色性能,将GPUDirectStorage的存储性能提升到了新的高度,在极端应用情况下依旧可以为最为复杂的AI模型训练保驾护航。
PBlaze66930系列企业级SSD针对人工智能等IO密集型应用开发,有着高达1600K/680KIOPS的4K随机读/写性能,7.1GB/s和7.0GB/s的128K顺序读/写带宽,在多核计算、动态平滑技术、硬件多队列引擎、IO智能调度等算法深度优化下,无论负载压力如何,始终提供稳定出色的数据读写表现。结合高达30.72TB的单盘容量,为AI训练数据的收集、预处理、训练等任务提供充沛的存储性能与容量支撑。
如今,面向AI等高性能数字技术应用的全新一代GPU、CPU、InfiniBand网络均已悉数亮相,忆恒创源(Memblaze)的PCIe5.0产品PBlaze77940也是呼之欲出,以近乎翻倍的性能和更加丰富的企业级功能,继续为下一代计算平台与高性能业务应用加速。
专注于企业级数据存储领域核心技术研发及应用的忆恒创源(Memblaze),凭借过硬的技术与客户的青睐,核心业务增长势头强劲,订单纷至沓来,业绩也是节节攀升。根据艾瑞咨询出具的行业报告,2020年忆恒创源(Memblaze)企业级PCIe SSD的国内市场占有率约为7%,处于国内品牌领先地位。未来,忆恒创源(Memblaze)将继续开展技术创新,引领行业技术向前发展。
当前,企业级数据存储领域核心技术研发及应用市场规模在不断扩大,随之而来的是市场消费需求的增大。北京忆恒创源科技股份有限公司(以下简称“忆恒创源(Memblaze)”)自成立以来,聚焦于企业级数据存储领域核心技术研发及应用,不断推出具有更高性能的国产企业级SSD,形成了差异化竞争优势。
忆恒创源(Memblaze)把科技的命脉牢牢掌握在自己手中,在科技自立自强上不断进步,拥有超过200件闪存技术专利申请,其PBlaze系列企业级SSD在数据库、虚拟化、云计算、大数据、人工智能等领域广泛应用。忆恒创源(Memblaze)销量在中国品牌企业级SSD中处于领先地位。
近日,ChatGPT持续火爆,用户在短短两个月内迅速破亿,大量用户涌入导致ChatGPT访问和数据规模指数级增加。与数月前发布的版本相比,新的ChatGPT“智能”了许多,不仅可以像人类一样聊天交流,甚至能够完成一定程度的稿件撰写、视频脚本创作、翻译、代码,答题等操作。ChatGPT起初基于OpenAIGPT-3语言模型训练开发,用以完成自然语言处理的绝大部分任务。但由于GPT-3自身无监督模型的属性,使得在早先版本的对话中,会存在一些生硬、甚至不恰当的文本响应,交互体验并不理想。全新上线的ChatGPT由GPT-3.5训练模型微调而来通过加入RLHF(人类反馈强化学习训练,ReinforcementLearningfromHumanFeedback)来指导机器学习过程,生成更加符合人类偏好的对话结果。
ChatGPT早期使用的GPT-3数据规模约为45TB,主要来自于互联网,每天产生的数据内容约为45亿字。随着ChatGPT的开放体验,以及如今ChatGPT的再度火热,将不断有新的高质量对话案例产生,甚至呈现几何级增长。这些新增数据将有效推动训练模型的继续迭代,实现ChatGPT应用体验越来越好。
算力方面,ChatGPT由Microsoft为OpenAI开放的AzureAI超算平台提供性能支撑。该平台由NVIDIA、Microsoft联合打造,可以为OpenAI提供超过258000个CPU核心和超过1000颗GPU。强大的计算性能结合GPT-3高达1750亿的训练参数,也让不少行业从业人员称“ChatGPT是大力出奇迹”的结果。
根据Microsoft、NVIDIA的相关报道,未来,AzureAI超算平台还将升级至400Gb/sInfiniBand网络和性能更强的NVIDIAH100GPU,结合Azure先进的云计算架构与下一代NVMe高性能SSD,将可为任意规模的AI训练和深度学习推理工作负载提供可扩展的峰值性能,AzureAI超级计算机也将有望跻身Top500榜单前5名。
NVMeSSD作为存储IO设备,在AI训练等高性能应用场景正全面取代传统SAS、SATA硬盘,其读写性能已经达到7GB/s水平,并向速度更快的14GB/s快速进发,容量方面更是在短短数年间提高了数十倍,让更大规模的训练数据可以保存其中。
GPU是当前AI训练、AI推理普遍使用的算力芯片。相较于数年前行业使用的Tesla、TITAN等GPU,最新的A100、H100算力水平(FP16、FP8)已经提升了数百倍,结合DPU、IB网卡、MagnumIO等软硬件的支持与优化,为AI训练、专业渲染、自动驾驶、科学计算、医疗、视频分析等前沿应用全面加速。
GDS通过利用GPU和NVMeSSD中的DMA(DirectMemoryAccess)引擎,让NVMeSSD可以直接读写GPU专用内存(通常我们更习惯称之为“显存”),而不再需要经过CPU和系统内存中的反弹缓冲区(BounceBuffer),借此缩短IO路径,提高GPU的执行效率,降低系统内存消耗以及CPU占用。
系统空闲状态下,对比传统IO路径与GDS路径存储性能:随着IO队列深度增加,8片PBlaze66930系列SSD总的传输带宽增加。
得益于PBlaze66930系列SSD大压力下的出色表现,以及GPU在数据处理方面更强的性能,GDS在大压力下性能领先幅度更加明显,如,4KB小文件传输带宽可提升33%,延迟降低25%;而128KB、1024KB文件传输环节,传统路径和GDS路径存储性能均可完全发挥,接近50GB/s。
运行stressapptest将CPU、系统内存负载提高(2颗64核心CPU占用率为86%,内存带宽占用50%,达205GB/s),模拟在有计算密集型业务应用存在时,PBlaze66930仍然可以为AI训练提供的传输带宽。从结果看,虽然大量IO资源被占用,但PBlaze66930仍然可以为GPU提供系统空闲状态下50%以上的存储性能,其中,128KB、1024KB文件传输带宽可达系统闲时的75%以上。
如果说,GPUDirectStorage为AI工作负载提供了性能和响应时间优势,那么,PBlaze66930系列PCIe4.0高性能企业级NVMeSSD则凭借其大压力下的出色性能,将GPUDirectStorage的存储性能提升到了新的高度,在极端应用情况下依旧可以为最为复杂的AI模型训练保驾护航。
PBlaze66930系列企业级SSD针对人工智能等IO密集型应用开发,有着高达1600K/680KIOPS的4K随机读/写性能,7.1GB/s和7.0GB/s的128K顺序读/写带宽,在多核计算、动态平滑技术、硬件多队列引擎、IO智能调度等算法深度优化下,无论负载压力如何,始终提供稳定出色的数据读写表现。结合高达30.72TB的单盘容量,为AI训练数据的收集、预处理、训练等任务提供充沛的存储性能与容量支撑。
如今,面向AI等高性能数字技术应用的全新一代GPU、CPU、InfiniBand网络均已悉数亮相,忆恒创源(Memblaze)的PCIe5.0产品PBlaze77940也是呼之欲出,以近乎翻倍的性能和更加丰富的企业级功能,继续为下一代计算平台与高性能业务应用加速。
专注于企业级数据存储领域核心技术研发及应用的忆恒创源(Memblaze),凭借过硬的技术与客户的青睐,核心业务增长势头强劲,订单纷至沓来,业绩也是节节攀升。根据艾瑞咨询出具的行业报告,2020年忆恒创源(Memblaze)企业级PCIe SSD的国内市场占有率约为7%,处于国内品牌领先地位。未来,忆恒创源(Memblaze)将继续开展技术创新,引领行业技术向前发展。