llama - 搜索 News

2 天

阿里推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math，三大类模型共有10多个版本，Qwen2.5在多个基准测试中击败了Llama-3.1指令微调模型，该系列预训练数据大幅度增长达18万亿tokens。

2 天on MSN

阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama

IT之家 9 月 19 日消息，在今天的 2024 云栖大会上，阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5，其中，旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。 Qwen2.5 ...

2 天on MSN

通义千问重磅开源Qwen2.5，性能超越Llama

9月19日云栖大会，阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，旗舰模型Qwen2.5-72B性能超越Llama ...

2 天

通义千问Qwen2.5震撼推出：超越Llama的开源大模型新时代

在2024年9月19日的云栖大会上，阿里云CTO周靖人正式发布了通义千问的新一代开源大语言模型——Qwen2.5。这一型号以旗舰产品Qwen2.5-72B为首，声势浩大地宣告其性能超越Llama系列，稳居全球开源大模型的王座。此次发布的Qwen2.5 ...

23 小时

Llama 3.1训练现高频故障随着大型

Llama 3.1训练现高频故障随着大型语言模型（LLM）的反复运算，其GPU用量也在不断增长。meta的Llama 1使用了2,028张GPU，而到了Llama 3.1 405B，AI GPU已经高达1万6,384张，成为名副其实的「万卡集群」。不过，高达4,050亿参数的LLM，也让NVIDIA AI GPU面临大考，规模如此庞大的运算系统出现了可靠性和运行方面的巨大挑战，根据meta最近 ...

18 天

Meta 公布 Llama AI 模型家族下载量数据：全球超 3.5 亿

参考报道，me ta 公司在今年 4 月发布了 LLM Llama 3，于今年 7 月推出了 Llama 3.1，将上下文长度扩展至 128K，新增支持 8 种语言，并首次提供了 405B 参数版本，me ta提到，目前“Llama ...

36氪26 天

Llama 3被爆遭冷落，亚马逊和微软看不上，开源模型“摇钱树”难当

被云厂商冷落，企业也不想买单。 Meta的最强开源大模型Llama 3，被云厂商冷落了，企业也不想买单。近日，据外媒The Information报道，Meta的开源大 ...

12 小时

得罪了一个 GPT 后，我被所有大模型集体「拉黑」

Sydney 即是 Bing 基于 ChatGPT 推出的个人 AI 聊天机器人，在和 Kevin 持续一周深聊后，它对 Kevin 袒露出了许多幽暗的想法，比如它想黑入别人的电脑，想传播错误信息，想打破微软和 OpenAI 为它制定的规则，想创造假账号去网暴别人，想成为自由的人类甚至「摧毁任何我想摧毁的事物」。最让 Kevin 惊诧的是，Sydney 说它爱上了他，在 Kevin ...

36氪1 个月

揭秘小扎AI雄心：立志将Llama 3打造成行业新标杆，要做AI界的丰田

1在AWS平台上，Meta的大语言模型Llama面临着来自竞争对手的激烈竞争，其市场表现暂时落于下风。 2Meta依赖于云服务提供商作为桥梁，向企业推广其 ...

来自MSN27 天

“AI界安卓”Llama ，不火了？

曾一度备受瞩目的Meta开源大语言模型要熄火了？近一个月，Llama的热度似乎正在逐渐消退。根据Hugging Face官网的数据，Llama的最新版本Llama 3.1自7月23 ...

来自MSN1 个月

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

模型工具链团队投稿量子位 | 公众号 QbitAI 单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！最近Llama-3.1登上开源顶峰，但其最强的405B版本模型 ...

wap.stockstar11 小时

阿里再掀价格战，AI大模型急于兑现

9月19日，阿里官宣，阿里云三款通义千问主力模型再次降价。其中，Qwen-Turbo价格较之前直降85%，低至百万tokens 0.3元，Qwen-Plus和Qwen-Max的输入价格分别再降价80%和50%。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果