阿里巴巴发布了最新的 Qwen 2 模型。Qwen 2 包含了 5 个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。阿里巴巴称,在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。这得益于其预训练数据及训练方法的优化。
https://qwenlm.github.io/zh/blog/qwen2/
阿里巴巴发布 Qwen 2
-
话说风河是,百度去。。。
2013年3月13日 10:33 -
开源的必须顶
2013年3月12日 21:37 -
开阔了眼界
2013年3月12日 19:44
评论已关闭。
相关推荐
- Cloudflare 谈论多路径 TCP,但 Dings Linux 的支持并不理想
- 新的 Linux 补丁增强了旧 GPU 的 AMD Radeon 视频编码/解码
- Wine 10.0-rc4 发布,修复了另外 13 个错误
- LibreOffice 25.2 RC1 带来了许多开源 Office 套件改进
- PeaZip 10.2 开源存档管理器与适用于 Linux 的 Qt 6 软件包一起发布
- Linux删除了过时、不安全的USB RNDIS网络协议 Windows还在用
- Ditana GNU/Linux 0.9.0 Beta发布
- 建议开始为 Linux 内核提供 32 位 LoongArch CPU 支持的补丁
-
为什么你发的所有微博网页链接都打不开?内容只显示一点点,链接又打不开,那要看什么?看标题?
2024年6月9日 09:23 -
话说风河是,百度去。。。
2013年3月13日 10:33 -
开源的必须顶
2013年3月12日 21:37 -
开阔了眼界
2013年3月12日 19:44
评论已关闭。
为什么你发的所有微博网页链接都打不开?内容只显示一点点,链接又打不开,那要看什么?看标题?