Instruct - 搜索 News

腾讯网2 小时

阿里开源Qwen2.5-Coder，最强开源代码模型来了

支持的编程语言包括Python、Java、C++等，也支持一些小众语言，如Haskell、 Racket等。

腾讯网1 天

最强开源Coder模型来袭！Qwen2.5-Coder新模型超越4o

Qwen2.5-Coder也采用了类似原理。它基于Qwen2.5基础大模型进行初始化，使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练，实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。

2 天

谷歌苹果曝出LLM惊人内幕，自主识别错误却装糊涂，AI幻觉背后藏着 ...

最近，来自Technion、谷歌和苹果的研究人员发现，LLM「真实性」的信息集中在特定的token，而且并得均匀分布。最后，研究团队还解释了，大模型内部编码和外部行为之间存在的差异： ...

1 天

完全开源的代码大模型OpenCoder来了，跻身性能第一梯队

代码大型语言模型（CodeLLM) 在代码生成、推理任务和智能代理系统等多个领域已变得不可或缺。尽管开源的代码大模型性能正逐步接近专有模型的水平，但适合进行科学研究的高质量 CodeLLM ...

1 天

超越 GPT-4o！阿里云开源最强代码模型 Qwen2.5-Coder

在代码推理方面，Qwen2.5-Coder-32B-Instruct 刷新了 CRUXEval-O 基准开源模型的最佳纪录。Qwen2.5-Coder-32B-Instruct 在 40 余种编程语言中表现优异，在 McEval 基准上取得了所有开闭源模型的最高分，并斩获考察多编程语言代码修复能力的 MdEval 基准的开源冠军。

来自MSN20 小时

阿里云开源Qwen2.5-Coder模型，编程新手也能轻松开发应用！

此次开源的Qwen2.5-Coder系列包括从0.5B到32B的六个尺寸，且每个尺寸都提供了Base和Instruct两种模型供开发者选择。其中，Base模型适合进行微调，而Instruct模型则可供开发者直接投入使用，大大提升了使用的便捷性。

1 天

阿里通义千问开源 Qwen2.5-Coder 全系列模型，号称代码能力追平 GPT-4o

IT之家 11 月 12 日消息，阿里通义千问今日开源 Qwen2.5-Coder 全系列模型，其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型，官方号称代码能力追平 GPT-4o。

26 天

Nvidia新AI模型Llama-3.1-Nemotron-70B-Instruct发布，性能超越GPT-4

10月17日，Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的全新AI模型，这一重大举措再次引发了人工智能领域的热议。作为全球半导体行业的领头羊，Nvidia不仅在硬件制造上占据着主导地位，如今也开始积极布局AI软件开发，并已经取得显著成绩。最近发布的Llama-3.1-Nemotron-70B-Instruct模型，初次亮相于流行的AI平台Hugg ...

11 天

清华团队革新MoE架构，像搭积木一样构建大模型，提出新型类脑稀疏 ...

MoE架构的主要优势是利用稀疏激活的性质，将大模型拆解成若干功能模块，每次计算仅激活其中一小部分，而保持其余模块不被使用，从而大大降低了模型的计算与学习成本，能够在同等计算量的情况下产生性能优势。

1 天on MSN

阿里通义千问发布Qwen2.5-Coder系列模型，代码能力直追GPT-4o！

【ITBEAR】阿里通义千问近日宣布开源 Qwen2.5-Coder 全系列模型，其中旗舰模型 Qwen2.5-Coder-32B-Instruct 在多个代码生成基准上展现卓越性能，被官方誉为与 GPT-4o 媲美的开源代码模型。据悉，Qwen2 ...

3 天

清华厦大等提出“无限长上下文”技术：100 万大海捞针全绿，Llama ...

在大数据领域，MapReduce 是一种分布式并行编程框架，具有横向扩展的数据处理能力。受到 MapReduce 所体现的“分而治之”思想的启发，研究人员设计了一种面向大模型的采用分治策略的长文本处理框架，称为 LLMxMapReduce。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果