PyTorch1.8正式支持AMD,炼丹不必NVIDIA
时间:2025-11-04 12:08:15 出处:数据库阅读(143)
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,式支转载请联系出处。炼丹
1.8版本中,不必官方终于加入了对AMD ROCm的式支支持,可以方便的炼丹在原生环境下运行,不用去配置Docker了。不必

AMD ROCm只支持Linux操作系统
1.8版本集合了自2020年10月1.7发布以来的式支超过3000次GitHub提交。
此外,炼丹本次更新还有诸多亮点:
优化代码,不必更新编译器 Python内函数转换 增强分布式训练 新的式支移动端教程与演示 新的性能检测工具相关的库TorchCSPRNG, TorchVision, TorchText和TorchAudio也会随之更新。
要注意的炼丹是,自1.6起,不必Pytorch新特性将分为Stable、式支Beta、炼丹Prototype三种版本。不必其中Prototype不会包含到稳定发行版中,需要从Nightly版本自行编译。
Python to Python函数转换
新增的Beta特性torch.fx可以实现Python到Python的函数转换,可以方便的亿华云计算加入任何工作流程。

新的API,向NumPy学习!
1.7版本中增加的Beta特性torch.fft已成为正式特性。实现了与Numpy中的np.fft类似的快速傅立叶变换,还增加了硬件加速支持与自动求导,以更好的支持科学计算。
还增加了Beta版NumPy风格的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。
增强分布式训练
增加了稳定的异步错误与超时处理,增加NCCL的可靠性。
增加了Beta版的流水线并行功能*(Pipeline Parallelism)*,可将数据拆解成更小的块以提高并行计算效率。

Pipeline Parallelism使用4个GPU时的工作示意图
增加Beta版的DDP通讯钩子,高防服务器用于控制如何在workers之间同步梯度。
另外还有一些Prototype版的分布式训练新特性。
ZeroRedundancyOptimizer:用于减少所有参与进程的内存占用。
Process Group NCCL Send/Recv:让用户可在Python而不是C++上进行集合运算。
CUDA-support in RPC using TensorPipe:增加对N卡多卡运算的效率。
Remote Module:让用户像操作本地模块一样操作远程模块。
移动端新教程
随本次更新发布了图像分割模型DeepLabV3在安卓和IOS上的详细教程。
以及图像分割、目标检测、神经机器翻译等在安卓和IOS上的演示程序,方便大家更快上手。



另外还有PyTorch Mobile Lite Interpreter解释器,可以减少运行时文件的大小。
性能检测工具
增加Beta版的Benchmark utils,用户可以进行精确的性能测试。
以及Prototype版的FX Graph Mode Quantization,实现了量化过程的自动化。云服务器

猜你喜欢
- 探索GalaxyNote3Neo的卓越功能与性能(发现GalaxyNote3Neo的创新之处,了解其先进的技术特性)
 - 百度小度i耳目(探索小度i耳目的功能与应用,领略智能音箱带来的便利生活)
 - 用卧室电脑拍摄风景照片的技巧(利用卧室电脑为你的摄影作品增添美丽风景)
 - 拖线板的生产成本分析及影响因素(解密拖线板生产成本的秘密及降低成本的关键)
 - 用罗技G402玩英雄联盟——打造极致游戏体验(解密G402在英雄联盟中的优势与应用技巧)
 - 电脑蓝屏sys文件错误解决方案(解决电脑蓝屏sys文件错误的有效方法)
 - M823手机(探索M823手机的功能和性能表现)
 - GOGO点歌机(高效、便捷、个性化的音乐点播新体验)
 - 如何正确贴上曲面电脑屏幕保护膜(教你轻松处理曲面屏幕贴膜难题)