发布于 27 天前
摘要
深度解析 Attend2Pack 论文——通过自注意力编码、动作空间分解和优先过采样技术,用深度强化学习求解 3D 装箱问题,在多个基准上达到 SOTA。
深度解析 Attend2Pack 论文——通过自注意力编码、动作空间分解和优先过采样技术,用深度强化学习求解 3D 装箱问题,在多个基准上达到 SOTA。
2017 年的 Transformer 论文,引用量超过 17 万次,GPT、BERT、LLaMA 的底层架构都源自于此。从论文本身出发,讲清楚它做了什么、为什么能工作、以及如何成为现代 AI 的基础设施。
AI Agent 与网页对话有什么不同?以 MikuLab 部署的 Hermes39 为例,介绍 Agent 的技术架构、核心能力和适用场景。
从 EleutherAI 的 lm-eval 到 OpenCompass、Lighteval、OpenAI Evals——六大评估框架的定位、差异和选型建议。
来自 Yann LeCun 团队的 LeWorldModel,用 15M 参数 + 2 个 loss 实现了从像素到世界模型的端到端训练,规划速度提升 48 倍。本文深度解读这篇论文的核心创新、架构设计和研究意义。