-
微软亚洲研究院多项创新技术,弥合大模型低比特量化与终端部署间鸿沟
编者按:在人工智能领域,模型参数的增多往往意味着性能的提升。但随着模型规模的扩大,其对终端设备的算力与内存需求 […]
-
两个小模型互相验证,直接比肩大模型?微软的rStar甚至没用CoT和微调 | 机器之心
互相检查,让小模型也能解决大问题。
-
To prospective interns
-
大语言模型应用如何实现端到端优化?
编者按:基于大语言模型(LLMs)开发的应用目前主要使用公共 LLMs 服务提供的 API 进行,但是这些 L […]
-
nnScaler:重塑深度学习并行策略,大幅提升训练效率
编者按:深度学习技术已经在图像识别、语音识别、自然语言处理、搜索推荐等多个领域不断展现出巨大的应用价值。然而, […]