The Tokens - 搜索 News

腾讯网4 天

GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

这个功能叫做“预测输出”（Predicted Outputs），在它的加持之下，GPT-4o可以比原先快至多5倍。而且与OpenAI合作开发这个功能的FactoryAI，也亮出了他们在编程任务上的数据： ...

中华网9 小时

日赚4亿的新首富张一鸣，能否医好字节？

近日，《2024胡润百富榜》发布，字节跳动创始人张一鸣以3500亿元的财富规模，成为中国有史以来最年轻的首富。榜单显示，今年41岁（1983年出生）的张一鸣，财富涨幅达43%即1505亿元，粗略计算相当于今年的每天，都能赚约4.1亿元。

1 个月

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps ...

IT之家 10 月 12 日消息，由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

腾讯网18 天

如何通过KV稀疏实现对vLLM的1.5倍加速

作者 | PPIO 算法专家张青青前言近一年以来，自 H2O 起，关于 KV 稀疏的论文便百花齐放，而在实际应用中不得不面临的一个问题便是学术论文与实际应用之间的巨大鸿沟，例如，像 vLLM 等框架采用的是 PagedAttention ...

4 天

GPT-4o 加钱能变快，新功能“预测输出”7 秒完成原先 23 秒的任务

When providing a prediction, any tokens provided that are not part of the final completion are charged at completion token ...

5 天on MSN

Claude 3.5 Haiku AI 模型每百万 tokens 输入1 美元/输出 5 美元

IT之家 11 月 5 日消息，Anthropic 昨日（11 月 4 日）发布博文，宣布开发者可以通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI，调用 Claude 3.5 Haiku ...

19 天

谷歌 Fluid 颠覆共识，AI 文生图领域自回归模型超越扩散模型

IT之家 10 月 23 日消息，科技媒体 The Decoder 昨日（10 月 22 日）发布博文，报道称谷歌 DeepMind 团队携手麻省理工学院（MIT），推出了全新的“Fluid”模型，在规模达到 105 亿参数时候，能取得最佳的文生图效果。目前在文生图领域，行业内的一个共识是自回归模型（Autoregressive Models）不如扩散模型（Diffusion Models）。

7 天

微软清华改进Transformer：用降噪耳机原理升级注意力，一作在线答疑

现在微软亚研院、清华团队出手，提出全新改进版Differential Transformer，专治这个老毛病，引起热议。论文中介绍，整体思路类似差分放大电路或降噪耳机，用两个信号的差值来滤除共模噪声。

6 天on MSN

Anthropic发布Claude 3.5 Haiku模型：定价每百万tokens输入1美元、输出5美元

在定价方面，Claude 3.5 Haiku的API调用费用引起了开发者的广泛关注。每百万tokens输入的费用为1美元，每百万tokens输出的费用则为5美元。不过，通过利用提示词缓存和Message Batches ...

3 天

Meta 开源小语言模型 MobileLLM 家族：适用智能手机

IT之家 11 月 8 日消息，Meta 于上周发布新闻稿，宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族，并同时为系列模型新增600M、1B 和 1.5B 三种不同参数版本，IT之家附项目GitHub项目页如下（点此访问）。

红板报 on MSN6 天

Claude 宣布开放Claude 3.5 Haiku 模型API，每百万 tokens 输入1美元

品玩11月5日讯，据 Anthropic 表示，Claude 3.5 Haiku 模型现已可通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI供开发者访问。 Claude 3.5 Haiku ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果