搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
51CTO
8 小时
今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议
哈佛、斯坦福、MIT等团队的一项研究表明:训练的token越多,需要的精度就越高。例如,Llama-3在不同数据量下(圆形8B、三角形70B、星星405B),随着数据集大小的增加,计算最优的精度也会增加。
10 小时
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
然后该研究将注意力转向低精度训练,主要研究量化感知训练(仅权重)和低精度训练。该研究将模型分解为权重、激活和 KV 缓存,找到其中任何一个量化到任意精度时损失的 Scaling ...
1 天
Nous Chat 聊天机器人提供类似于 ChatGPT 的界面:并允许用户与模型交互 ...
人工智能研究机构 Nous Research 近期推出了 Nous Chat 聊天机器人,可以访问其大型语言模型 Hermes3-70B。 Nous Chat 聊天机器人提供了类似于 ChatGPT ...
腾讯网
2 天
初创公司推出 Nous Chat 聊天机器人,基于 Meta Llama 3.1 打造
IT之家 11 月 11 日消息,AI 初创公司 Nous Research 近期推出了一款名为 Nous Chat 的 AI 聊天机器人,该机器人基于 Meta Llama 3.1 微调而成的“Hermes ...
2 天
Nous Chat:新一代聊天机器人将如何变革人机交互?
在现代科技的高速发展下,我们似乎每天都在迎接新的AI产品。然而,最近一款名为Nous Chat的聊天机器人引起了众多关注。基于Meta的Llama 3.1微调而成的Hermes 3-70B模型,它到底能为我们带来怎样的惊喜呢? 引人入胜的开头 你是否曾在长时间的对话中感到困惑,或者期待能有一个能理解你情感的“朋友”?Nous Chat正是为了满足这种人际交互的渴望而生。其背后的AI初创公司Nous ...
阿思達克財經網
8 天
腾讯(00700.HK)推Hunyuan-Large开源大模型
内媒报道,腾讯机器学习平台总监康战辉在混元大模型媒体沟通会上发布全新的Huanyuan-large模型。
中時新聞網
13 天
希腊购35架「黑鹰」直升机 欧洲第12个使用国
新闻稿强调,「黑鹰」系列问世迄今,已获得全球36国使用超过5千架各种衍生型号,可说是全球最畅销的中型通用直升机,未来还将透过持续改良,克服各种高强度作战环境挑战,满足21世纪的多元任务需求。
腾讯网
16 天
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
就这两天,Meta 推出了 NotebookLM 的开源平替版 ——NotebookLlama,它使用 Llama 模型进行大部分任务处理,包括 Llama-3.2-1B-Instruct、Llama-3.1-70B-Instruct 和 ...
中国能源网
22 天
英伟达开源模型Nemotron-70B,关注金砖支付及鸿蒙生态机会 | 投研报告
华安证券近日发布全球科技行业周报:英伟达开源模型Nemotron-70B,关注金砖支付及鸿蒙生态机会, 以下为研究报告摘要: 从 ...
IT之家
25 天
消息称 Nvidia App 现代化控制面板将随 RTX 50 系列显卡正式发布
IT之家10 月 19 日消息,消息源 Kopite7kimi 昨日(10 月 18 日)在 X 平台发布推文,曝料称英伟达在推出 GeForce RTX 50 系列显卡的同时,将推出“Nvidia App”应用程序。 英伟达于今年 2 月随 551.61 驱动程序一起,以 Beta 的形式推出一款简单名为“Nvidia App”应用程序 ...
科技讯
26 天
英伟达开源Nemotron-70B模型,性能超越GPT-4o和Claude 3.5
近日,英伟达悄然开源了其最新的超强大模型——Nemotron-70B。一经发布,该模型便迅速在AI社区引发轰动,其性能在多个基准测试中超越了包括GPT-4 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈