搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
2 小时
阿里开源Qwen2.5-Coder,最强开源代码模型来了
支持的编程语言包括Python、Java、C++等,也支持一些小众语言,如Haskell、 Racket等。
腾讯网
1 天
最强开源Coder模型来袭!Qwen2.5-Coder新模型超越4o
Qwen2.5-Coder也采用了类似原理。它基于Qwen2.5基础大模型进行初始化,使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。
2 天
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂,AI幻觉背后藏着 ...
最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定的token,而且并得均匀分布。 最后,研究团队还解释了,大模型内部编码和外部行为之间存在的差异: ...
1 天
完全开源的代码大模型OpenCoder来了,跻身性能第一梯队
代码大型语言模型(CodeLLM) 在代码生成、推理任务和智能代理系统等多个领域已变得不可或缺。尽管开源的代码大模型性能正逐步接近专有模型的水平,但适合进行科学研究的高质量 CodeLLM ...
1 天
超越 GPT-4o!阿里云开源最强代码模型 Qwen2.5-Coder
在代码推理方面,Qwen2.5-Coder-32B-Instruct 刷新了 CRUXEval-O 基准开源模型的最佳纪录。Qwen2.5-Coder-32B-Instruct 在 40 余种编程语言中表现优异,在 McEval 基准上取得了所有开闭源模型的最高分,并斩获考察多编程语言代码修复能力的 MdEval 基准的开源冠军。
来自MSN
20 小时
阿里云开源Qwen2.5-Coder模型,编程新手也能轻松开发应用!
此次开源的Qwen2.5-Coder系列包括从0.5B到32B的六个尺寸,且每个尺寸都提供了Base和Instruct两种模型供开发者选择。其中,Base模型适合进行微调,而Instruct模型则可供开发者直接投入使用,大大提升了使用的便捷性。
1 天
阿里通义千问开源 Qwen2.5-Coder 全系列模型,号称代码能力追平 GPT-4o
IT之家 11 月 12 日消息,阿里通义千问今日开源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型,官方号称代码能力追平 GPT-4o。
26 天
Nvidia新AI模型Llama-3.1-Nemotron-70B-Instruct发布,性能超越GPT-4
10月17日,Nvidia悄然推出了一款名为Llama-3.1-Nemotron-70B-Instruct的全新AI模型,这一重大举措再次引发了人工智能领域的热议。作为全球半导体行业的领头羊,Nvidia不仅在硬件制造上占据着主导地位,如今也开始积极布局AI软件开发,并已经取得显著成绩。 最近发布的Llama-3.1-Nemotron-70B-Instruct模型,初次亮相于流行的AI平台Hugg ...
11 天
清华团队革新MoE架构,像搭积木一样构建大模型,提出新型类脑稀疏 ...
MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能模块,每次计算仅激活其中一小部分,而保持其余模块不被使用,从而大大降低了模型的计算与学习成本,能够在同等计算量的情况下产生性能优势。
1 天
on MSN
阿里通义千问发布Qwen2.5-Coder系列模型,代码能力直追GPT-4o!
【ITBEAR】阿里通义千问近日宣布开源 Qwen2.5-Coder 全系列模型,其中旗舰模型 Qwen2.5-Coder-32B-Instruct 在多个代码生成基准上展现卓越性能,被官方誉为与 GPT-4o 媲美的开源代码模型。 据悉,Qwen2 ...
3 天
清华厦大等提出“无限长上下文”技术:100 万大海捞针全绿,Llama ...
在大数据领域,MapReduce 是一种分布式并行编程框架,具有横向扩展的数据处理能力。受到 MapReduce 所体现的“分而治之”思想的启发,研究人员设计了一种面向大模型的采用分治策略的长文本处理框架,称为 LLMxMapReduce。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈