Attention Is All You Need
Attention Is All You Need
ar5iv.labs.arxiv.org
Related
Highlights
The Illustrated Transformer
Jay Alammar
jalammar.github.io
推荐 Paul Liu 老师的这个科普视频:如何微调大语言模型 讲解非常清晰易懂,不需要太多 LLM 训练的前置知识。 https://t.co/9Lm4xyS9pQ...
See more
Jiayuan
x.com
入门大模型的一份 Onboarding/上手论文清单🧾⚡️ 包括经典论文,模型性能优化,长上下文,量化以减少内存,向量等领域技术🤯 了解完基本上能够了解大模型运作的底层原理!🔥 清单地址 👉 https://t.co/1p0NSXFmoJ...
See more
Tom Huang
x.com
Hopfield 确实活该得诺贝尔物理学奖, transformer 的self attention居然可以从hopfield model 推导出来 @bboczeng https://t.co/zfeArsq5mc
soxl.svix
x.com
Unlock unlimited Related cards