transformer - 搜索 News

1 天on MSN

GPT在模仿人类? Nature发现：大脑才是最早的Transformer!

我们一直深信，人类的大脑，是靠着一套严谨的规则、语法和结构分析来理解语言的，复杂且独一无二。这是一个持续了数十年的「共识」。可最近Nature Communications上发表的一项颠覆性研究，把这个古老的信仰掀了个底朝天。

腾讯网

看懂这篇，你就能秒懂 LLM底层秘密—Transformer原理解析

《LLM学习笔记：最好的学习方法是带着问题去寻找答案》中有简要讲到如何构建一个LLM，看过后应该会想，最初被预训练、后训练修正的原始“模型”是怎么来的，为什么给数据，经过不断训练就能得到一个会说人话的“超大函数”出来呢？

5 天

AGI只剩5–10 年！谷歌DeepMindCEO：必须把Scaling推到极限，还需1-2个 ...

除了业界迭代的RNN、Mamba-2等架构，谷歌提出的新一代解决方案Titans+MIRAS，能够把RNN速度和Transformer准确性相结合，可以让 AI模型在运行过程中动态更新核心记忆，跑得更快，也能处理超长规模的上下文。

腾讯网

华为新架构砍了Transformer大动脉！任意模型推理能力原地飙升

标准的自注意力机制本质上是将输入序列X分别通过三个线性变换WQ，WK，WV生成Query（Q）、Key（K）、Value（V），再通过softmax计算注意力权重： ...

5 天

谷歌祭出Transformer杀手，8年首次大突破，掌门人划出AGI死线

谷歌DeepMind掌门人断言，2030年AGI必至！不过，在此之前，还差1-2个「Transformer级」核爆突破。恰在NeurIPS大会上，谷歌甩出下一代Transformer最强继任者——Titans架构。

6 天

8 年首次大突破：谷歌祭出 Transformer 杀手，掌门人划出 AGI 死线

八年前，谷歌 Transformer 奠基之作出世，彻底改变了 AI 界。如今，谷歌另一个极有潜力成为 Transformer 的全新架构 ——Titans，正式在 NeurIPS 2025 亮相。它完美融合了「RNN 极速响应 ...

15 天

Transformer 如何将 AI 计算效率提升 100 倍？｜DeepMind 首席科学家最新演讲

11 月 25 日， Google DeepMind 首席科学家 Jeff Dean 在斯坦福 AI 俱乐部发表演讲。本次演讲 Jeff Dean 全面复盘了过去 15 年 AI 技术的关键转折点，探讨了算力硬件与模型架构的协同进化、计算范式从 ...

12 天

Transformer作者爆料GPT-5.1内幕，OpenAI内部命名规则变乱了

信息量极大，包括AI的底层范式转变、GPT-5.1的命名规则、未来AI的发展趋势……以及 Transformer 诞生背后的二三事。这类似于摩尔定律，几十年来摩尔定律始终有效，甚至在GPU的推动下还在加速，归根结底也是因为它历经了数代技术的迭代 ...

12 天on MSN

Transformer作者揭秘：GPT-5.1非小版本迭代，AI换代与未来趋势展望

人工智能领域正经历一场静默却深刻的范式变革，其影响或将与Transformer架构的诞生相提并论。过去一年间，行业内部对技术发展路径的认知出现显著分歧：部分观点认为预训练模型已触及天花板，而另一派则持续发布迭代版本，引发关于AI发展速度的激烈讨论。针对这些争议，Transformer核心作者之一、现任OpenAI研究科学家的Łukasz Kaiser通过独家访谈，从技术演进、模型迭代和未来趋势三个 ...

腾讯网

Brain-X：浙大祝向东团队综述人工智能模型Transformer在脑肿瘤诊断和 ...

近日，浙江大学医学院祝向东教授团队在 Brain-X 发表了题为：Potential roles of transformers in brain tumor diagnosis and treatment 的综述论文。该综述总结了人工智能模型Transformer在脑肿瘤诊断和治疗中的应用现状。第一兼通讯作者为浙江大学医学院附属第二医院神经外科 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果