浪潮AI资源平台 充分利用闲置计算资源 灵活配置资源配额
随着人工智能和5G技术的发展,深圳大学计算机与软件学院(以下简称“深大计软学院”)早在2012年就开启了AI科学研究与人才培养计划。虽然在此期间大力投入AI计算平台建设,但是随着AI应用场景的增加和使用人数的上升,AI算力资源调度管理问题逐渐凸显。
为此,深大计软学院借助浪潮AI资源平台AIStation巧妙地解决了AI算力资源调配和管理难题,将GPGPU资源利用率提升至60%以上,整体开发工作效率提升75%,AI科研和教学工作驶入快车道。
浪潮AIStation是面向企业级用户提供的一体化人工智能开发资源平台, 可支持数据处理、AI算法开发、模型训练、模型管理、模型部署等AI全链条操作管理。浪潮AIStation可以支持大规模计算集群扩展,支持CPU、GPU、FPGA等多种系统架构,在业内首先可以达到“管资源”、“管人”、“管调度”三管齐下。
通过AIStation平台,集群管理员可以清晰地了解到每个使用者对资源使用和提交训练任务的状况,将闲置的计算资源进行有效的管理,并灵活配置用户的资源配额,防止资源过多占用和浪费。
深大师生通过AIStation可以自行按需申请资源,AIStation自动分配GPU资源给用户使用。其GPU共享策略可实现实现多人共用一台机器、多人共用一张GPU卡,开发环境相互隔离互不影响,大大缩短了以往的排队等待时间,大幅降低了因任务相互干扰而造成的故障停机和数据丢失的风险。
AIStation还提供基于Web的用户界面,师生们无需安装任何插件,通过浏览器即可快速接入实验平台。疫情期间,借助AIstation进行远程教学和科研实验,深大计软学院迅速恢复了正常的教学和科研工作,更好地应对了疫情带来的挑战。
此外,AIStation还支持任务排队托管、定义任务优先级。深大师生们现在可以同时提交多个训练任务,资源不足时排队等待,一个任务训练结束后自动释放资源给排队等待的任务,从而可以更好地利用夜间、假期执行训练任务,同时可设置优先级,让重要任务优先执行。
通过这次的合作,再一次印证了浪潮作为全球领先AI计算品牌的强大实力。在未来,浪潮AI将继续与人工智能领先科技公司保持在系统与应用方面的深入紧密合作,从而帮助AI客户在语音、语义、图像、视频、搜索、网络等方面取得数量级的应用性能提升。
相关文章:
相关推荐:
网友评论: