当前位置: 纯净系统之家 > 微软资讯 > AMD首款“小语言模型”Llama-135m发布,具备推测解码能力
据报道。推测解码的核心原理是通过小型草稿模型生成候选token,再由较大的目标模型进行验证。此过程在性能不受影响的前提下,每次前向传递可以生成多个token。减少内存(RAM)占用,并提高处理效率。
AMD透露,AMD-Llama-135m在四个AMD Instinct MI250节点上训练了六天,此外还推出了“编程专用版本”——变体AMD-Llama-135m-code,该版本经过额外四天的微调训练,以适应编程任务。
微软资讯推荐
win10系统推荐
系统教程推荐
Copyright © 2012-2024 纯净系统之家 版权声明 网站地图