perplexity - 搜索 News

（关注公众号设为标，获取AI深度洞察）全文 7,000字 | 阅读约28分钟搜索，这个看似再普通不过的需求，却深深嵌入了我们的日常生活。无论是查资料、买东西，还是了解新闻，搜索引擎早已成为我们获取信息的第一入口。但在 AI ...

NSA（硬件优化稀疏注意力机制）由Deepseek、北京大学和华盛顿大学联合提出，旨在解决传统注意力机制在长上下文、多轮对话等场景下的性能瓶颈。其创新性在于通过**三并行分支架构**（Token压缩、Token选择、滑动窗口）结合可学习门控机制，动态平衡全局与局部注意力：压缩分支粗粒度捕捉全局信息，选择分支筛选关键稀疏单元以减少计算量，滑动窗口则保留局部语法与语义连贯性；硬件层面基于Triton框 ...

2 小时

国外权威认证！DeepSeek超150万模型，成最受欢迎开源大模型

值得一提的是，R1仅用了几周的时间就超过了类ChatGPT开源鼻祖Meta发布的Llama系列，国内的开源大模型领头羊Qwen系列，以及微软开源的Phi系列，谷歌开源的Gemma系列。

4 小时

DeepSeek省了训练费，但推理模型应用成"烧钱黑洞"

DeepSeek省了训练费，但推理模型应用成＂烧钱黑洞＂,人工智能,deepseek,推理,机器人,算力,openai ...

4 小时

TikTok五年颠簸“未剧终”

共和党这边，特朗普2024年6月1日在TikTok上开设了个人账号，宣传他的施政纲领，获得约1500万粉丝。美国《时代》周刊报道称，特朗普对TikTok态度的转变，一方面是为了吸引年轻选民，另一方面考虑到TikTok的投资人在其获得党内提名时出力不少 ...

中文科技资讯2 小时

DeepSeek超150万模型，成最受欢迎开源大模型

对于通用数据，则采用奖励模型来捕捉复杂和微妙场景中的人类偏好。基于 DeepSeek-V3的流程，采用类似的偏好对和训练提示分布。在评估有用性时，仅关注最终总结，确保评估重点在于响应对用户的实用性和相关性，同时尽量减少对底层推理过程的干扰; ...

23 小时

还得是上海！百亿级大模型项目现场对接，只用3天

最后在业界生态整体构建上，上海市“模塑申城”开源创新生态建设行动正式启动。阿里魔搭社区、上海国投、库帕思科技、小红书等将深度参与。大模型正在重构产业生态，各方力量都在积极推动新格局形成。

19 小时

人工智能烧钱，火势越来越大

未来几年，技术创新和更先进AI芯片的出现可能意味着，向客户提供AI的系统会比今天高效一千倍。风险投资家Tomasz Tunguz表示，投资者和大型科技公司在赌，未来十年中，由于推理模型和AI的迅速普及，对AI模型的需求可能会增加一万亿倍或更多。

来自MSN4 小时

5种知识库，解决90%的问题

本文来自微信公众号：王智远，作者：王智远，题图来自：视觉中国我对知识库的理解分为五种：公开知识库、个人知识库、小组织知识库、部门知识库和企业知识库。它们类别不同，适用场景也各不相同。 1 先说公开知识库。有些人挑一个主题，整理大量内容后公开分享 ...

少数派3 小时

Apple Intelligence 将于四月支持中文

2 月 21 日，苹果在官网发布新闻稿称，Apple 智能（Apple Intelligence）将于四月拓展至更多语言与地区，包括法语、德语、意大利语、葡萄牙语（巴西）、西班牙语、日语、韩语和简体中文，以及新加坡与印度的本地化英语。这将首次允许欧盟用户用上该功能。但是，在中国推出的时间仍然「依监管部门审批情况而定」。

18 小时

我们访谈了10个职场卷王，看看他们到底都在用哪些AI

为了打破这一信息壁垒，给职场人带来更多启发。《职场Bonus》深入访谈了10位在日常工作中用AI的高手，我们总结了6类打工人日常中实用的AI工具。既有对“老玩家”们熟悉的工具的进一步对比和能力挖掘，也有一些相对冷门好用的工具推荐。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果