site:www.51cto.com - 搜索 News

13 小时

近日，谷歌DeepMind科学家Jacob Austint在X上，发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。

13 小时

大二时，他对人工智能产生了浓厚兴趣，投入到计算机视觉领域的研究中；大三暑假，跟着全球著名计算机视觉专家朱松纯从事相关研究。加入xAI之后，他的研究方向主要聚焦于如何优化AI训练效率，并提升模型的稳定性。

13 小时

美国AI云服务商Together AI宣布完成3.05亿美元B轮融资，估值高达33亿美元！该公司押注开源模型，提供包括DeepSeek-R1在内的200多个模型API服务，并出租GPU算力，年收入已超1亿美元。

13 小时

此外，若这些系统已经在人类不自知的情景下，奖励那些对人类有害的结果（例如短视频成瘾），从而更有效地遵循其预设目标（获得更多用户时长），可能使结果进一步偏离人类偏好，这就是本文要讨论的AI的「隐性对齐」。

17 小时

其中S1是一个80M参数的交叉注意力（cross-attention）编码器-解码器Transformer，负责低层控制。它依赖于一个全卷积的多尺度视觉主干网络进行视觉处理，该网络完全在模拟环境中预训练初始化。

17 小时

由于噪声 - 无条件模型很少被考虑，专门为这种未充分探索的情况设计模型是有价值的。为此，研究者从 EDM 模型中提出了一个简单的替代方案。在没有噪声条件的情况下，该变体可以实现很强的性能，在 CIFAR10 数据集上的 FID 得分达到 ...

17 小时

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

18 小时

一夜之间，游戏产业要变天了！微软公布全球首个世界与人类行动模型，名为Muse，可秒生游戏画面，精准预测玩家操作。未来，游戏开发或将从数月压缩至几分钟，千亿美金游戏市场或被颠覆。

12 小时

当微软、Okta等巨头接连因"非人类身份"漏洞遭黑客攻陷，一场无声的安全危机正在全球企业蔓延——据OWASP最新报告，企业网络中非人类身份数量是人类的10-50倍，而它们正成为黑客最爱的"后门"。2024年多起史诗级数据泄露事件背后，竟都藏着这些不会 ...

15 小时

根据奇安信近日发布的资产测绘监测结果，在8971个Ollama（一款开源大语言模型服务工具）大模型服务器中，有6449个活跃服务器，其中88.9%都“裸奔”在互联网上，面临数据泄漏、服务中断和滥用等严重威胁。私有化部署开源模型的风险主要有以下几点： ...

17 小时

这一次，研究人员将目光瞄准了急性髓系白血病（AML），AI co-scientist通过分析大量的生物医学数据，包括药物的化学结构、药效学和遗传信息，来预测哪些现有药物可能对AML有效。

17 小时

1968年12月，肯特、保罗、里克和盖茨在“C的立方”往往一待就是好几个小时，他们编写代码，调试程序，起草程序错误。他们知道，终有一日，公司会将他们扫地出门，他们必须在机会消失前尽可能地多攫取一些。

一些您可能无法访问的结果已被隐去。