霄云科技银河存储:重构AI时代的存储新范式
在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为算力释放的关键支撑。上海霄云信息科技有限公司正式推出全新一代AI存储产品--霄云银河存储。这款专为人工智能模型训练、高性能计算(HPC)、生命科学等场景设计的存储系统,以“极速、高可用、全链路可视”为核心,重新定义企业级存储的性能边界。
三大核心场景,释放存储潜能
1. 人工智能模型训练与推理
▪ 内置GPU Direct Storage技术,数据无需经CPU中转即可直达GPU显存,读性能达90GB/s,写性能75GB/s,大幅提升万亿参数大模型训练效率。
▪ 单个元数据服务器(MDS)可支持50亿文件管理,优化CheckPoint存储效率,加速模型训练恢复流程。
2. 高性能计算(HPC)
▪ 支持百万级IOPS与微秒级延迟,通过并行文件系统与IB高速网络,满足气象模拟、石油勘探计算等场景对海量数据并行处理的需求。
▪ Multi-Rail多网卡聚合技术实现带宽利用率90%+,确保多客户端并发访问无拥塞。
3. 生命科学
高效处理基因测序、蛋白折叠等超大规模非结构化数据,结合RAID 10/5/6冗余架构,保障科研数据完整性与分析连续性。
颠覆性设计,打造高可靠架构
霄云银河存储采用“应用-双控-存储”三层架构,以软硬件协同创新重构存储底层逻辑:
▪ 双控服务器层
▪ 内置高性能并行文件系统,支持无缝横向扩展,性能随节点增加线性提升。
▪ 双控机箱10秒级故障切换,配合共享硬件RAID,实现控制器故障时业务零中断。
▪ 存储节点层
▪ 全闪存RAID阵列,支持热插拔与在线扩容,数据冗余无需软件同步,一方面降低软件复杂性,另一方面无需节点间交换数据,不占用IB网络带宽。
▪ 统一命名空间管理,新增节点自动纳入资源池,扩展性提升。
▪ 高速互联网络
支持Infiniband/ROCE RDMA网络协议,提供400Gbps级传输速度,构建低延迟、高带宽数据通道。
六大功能特性,定义未来存储
1. GPU Direct Storage
数据直通GPU显存,消除CPU瓶颈,模型训练速度提升2倍以上。
2. CheckPoint智能优化
自动空间治理系统,优化存储资源分配,加速模型训练恢复效率。
3. 极速故障恢复
双控高可用系统最快10秒内完成I/O接管,保障关键业务连续性。
4. 企业级安全与管理
▪ CSI私有客户端容器化部署,适配K8s生态。
▪ 用户配额+ACL访问控制,满足金融、医疗等行业合规需求。
5. 硬件级冗余
支持RAID 10/5/6,硬盘故障时自动重建,数据安全性超越传统软件RAID方案。
6. 全链路监控系统
独立模块化设计,实时可视化IO性能、硬件状态及网络负载,助力精准故障定位。
技术亮点:重新定义存储效率
▪ 硬件RAID vs 软件RAID
通过专用硬件处理XOR运算,彻底释放CPU资源,同时避免节点间数据交换占用网络带宽。
▪ 统一命名空间
跨节点文件系统无缝整合,用户无需手动映射路径,管理效率提升3倍。
▪ IB网络+Multi-Rail双保险
InfiniBand提供400Gbps基础传输速度,配合Multi-Rail负载均衡,实现大规模并行访问无拥塞。
开启存储新纪元
霄云银河存储不仅是存储设备,更是AI基础设施的中枢。通过软硬件协同优化,解决了传统存储在扩展性、延迟与管理复杂度上的痛点,让数据流动真正匹配算力增长,助力企业抢占AI时代先机。
关于霄云科技
上海霄云信息科技有限公司(简称:霄云科技)成立于2015年,是一家深耕高性能分布式存储领域的高新技术企业。核心技术团队用10年+的时间,承担和钻研上海市科委“PB级海量存储系统”课题,并实现科研成果转化。霄云科技的自研创新高性能分布式存储产品,追求高品质和高可靠性,具备自主知识产权和高技术壁垒,已经服务医疗、金融、电信、教育、制造等多个行业客户,深受用户好评。