搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
2 天
LoRA、完全微调到底有何不同?MIT 21页论文讲明白了
微调(Fine-tuning)是将经过预训练的大语言模型应用于下游任务的关键范例。最近,低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能,同时可训练参数的数量却大大减少。
腾讯网
10 天
基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例
简单性和可扩展性:Torchtune采用原生PyTorch的设计风格,提供模块化的组件和接口。这使得用户能够根据自己的需求,轻松地对现有功能进行修改和扩展,构建定制化的微调流程。同时,Torchtune也提供了一系列开箱即用的工具和模块,降低了用户的 ...
腾讯网
4 天
大语言模型:LLM的高阶应用「模型微调」
在人工智能的疆域中,大语言模型(LLM)正以其强大的语言理解能力,引领着技术的新浪潮。文章《大语言模型:LLM的高阶应用「模型微调」》深入探讨了如何通过模型微调来优化LLM,使其更精准地适应特定任务。正如阿兰·图灵所预见的,机器不仅能够计算,还能学习 ...
电子工程专辑
27 天
超全!一文详解大型语言模型的11种微调方法
导读:大型预训练模型是一种在大规模语料库上预先训练的深度学习模型,它们可以通过在大量无标注数据上进行训练来学习通用语言表示,并在各种下游任务中进行微调和迁移。随着模型参数规模的扩大,微调和推理阶段的资源消耗也在增加。针对这一挑战 ...
51CTO
5 小时
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍 ...
这种方法不同于标准的微调,因为它是在一个数据量极低的环境中运行的 —— 通常是通过单个输入的无监督目标,或应用于一个或两个 in-context 标注示例的有监督目标。 不过,TTT 方法的设计空间很大。目前,对于哪些设计选择对 ...
太平洋号 on MSN
1 天
外观内饰微调,动力维持不变,2025款奥迪Q5L能吸引哪些人
乘联会数据显示,10月份国内自主品牌零售份额已经达到了65.7%,合资品牌的生存空间被进一步压缩;与此同时,豪华车零售份额10月份也降至9.2%。对奔驰、宝马、奥迪来说,这都不是什么好消息。
红板报 on MSN
3 天
多模态模型免微调接入互联网,即插即用新框架,效果超闭源商用方案
李川皓 投稿量子位 | 公众号 QbitAI 一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。 这是大模型的老毛病了。 因为《黑神话》8月才上市,训练数据里没有它的相关知识。 众所周知,大模型的训练和微调会消耗大量计算资源和时间,这意味着频繁更新大模型的参数是不切实际的。 然而,现实世界中的信息是实时产生的且不断变化的。这使得大模型在完成训练后,对于后续新产生的信息 ...
20 小时
小米大模型升级第二代:MiLM2实现云边端结合,能力平均提升超45%
IT之家 11 月 12 日消息,小米公司 MiLM 大模型在去年 8 月首度现身 C-Eval、CMMLU 大模型评测榜单,并在今年 5 月通过大模型备案,相关模型逐步应用于小米汽车、手机、智能家居等产品中。
3 天
中期改款大众高尔夫亮相:1.5T动力升级,外观微调,市场反响如何?
内饰方面,中期改款高尔夫采用了大众最新的家族化设计语言。高亮黑色系装饰件的运用,为内饰增添了不少运动气息。中控区域换装的12.9英寸悬浮屏,虽然在一些车迷眼中可能不如老款双联屏设计来得直观,但其操作便捷性和信息查看的直观性却得到了显著提升。车机界面的 ...
8 天
曼联微调了战术,激活了所有人,并把切尔西研究得很透,战术克制
曼联球员除了垃什福德有一些进攻天赋还能找得到第二个突破的球员吗?就跟篮球场一样,没有突破的球员怎么吸引对面的防守,怎么有更好的推反击能力?怎么拉的开空间?前锋有没有把握能力如教练一样的一锤定英的前锋。好难。腾帅买了一群什么人?这场真的是靠团队拼下来的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈