Meta发布Llama 3.1敞开模型 最高4050亿参数 才能超越GPT-4等非敞开模型

09-04 984阅读 0评论

Meta AI 研讨院日前正式发布了 Llama 3.1 系列模型,该系列模型大约在 1 周前提早走漏,其间高达 4050 亿参数的版别被不少业界人士夸奖,由于才能方面现已超越 GPT-4 等非敞开模型。

此次发布的模型分为三个版别,包含 Llama 3.1-8B 版、Llama 3.1-70B 版和 Llama 3.1-405B 版,这些模型均具有改善的 128K 上下文长度。

一起 Meta 现在答应开发者运用 Llama 模型的输出来改善其他模型,也便是能够运用 AI 来练习 AI,某些张口沉默便是敞开模型不如闭源模型的公司狂喜,估量现已下载模型开端练习自己所谓的闭源抢先模型。


                    Meta发布Llama 3.1敞开模型 最高4050亿参数 才能超越GPT-4等非敞开模型

基准测验方面,Meta 在 150 多个基准数据集上评价了 Llama 3.1 的才能,还进行了几回人工评价以便将这些模型与实际场景中的其他模型进行比较。

测验显现 Llama 3.1-405B 版才能超越 GPT-4-0125、GPT-4o 和 Claude 3.5 Sonnet,这三个模型现在都是 AI 范畴最顶尖的模型,而 Llama 3.1-405B 版现已供给相同或更好的才能。

根据测验成果 Meta 称 Llama 3.1-405B 是国际上规模最大、功用最强壮的敞开模型,而 70B 和 8B 版模型在与同参数模型也处于抢先地位。


                    Meta发布Llama 3.1敞开模型 最高4050亿参数 才能超越GPT-4等非敞开模型


                    Meta发布Llama 3.1敞开模型 最高4050亿参数 才能超越GPT-4等非敞开模型

开发者们现在就能够经过 AWS、NVIDIA、Groq、Dell、Azure 和 Google Cloud 等渠道运用 Llama-3.1 系列模型,其间 405B 版还能够经过微软 Azure AI 中直接调用。

开发者们也能够经过 Meta AI 官网下载这些敞开模型,需求提示的是敞开不等于开源,个人、开发者和小规模的科技公司能够直接下载运用几乎没有法律问题,大型科技公司可能要细心研讨 Meta 的敞开答应。

最终扎克伯格表明:

现在许多科技公司正在开发抢先的闭源模型,但开源模型正在敏捷缩小差距,上一年 Llama 2 与闭源模型落后一代,而现在 Llama 3 现已能够与最先进的模型相媲美,并在某些范畴处于抢先地位。

从下一年开端咱们估计未来的 Llama 模型将成为业界最先进的模型,但在此之前 Llama 现已在敞开性、可修改性和本钱功率等方面处于抢先地位。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,984人围观)

还没有评论,来说两句吧...

目录[+]