AI Memo – MikuLab

发布于 2026-05-04

摘要

深度解析 Attend2Pack 论文——通过自注意力编码、动作空间分解和优先过采样技术，用深度强化学习求解 3D 装箱问题，在多个基准上达到 SOTA。

发布于 2026-05-04

摘要

2017 年的 Transformer 论文，引用量超过 17 万次，GPT、BERT、LLaMA 的底层架构都源自于此。从论文本身出发，讲清楚它做了什么、为什么能工作、以及如何成为现代 AI 的基础设施。

发布于 2026-05-04

摘要

AI Agent 与网页对话有什么不同？以 MikuLab 部署的 Hermes39 为例，介绍 Agent 的技术架构、核心能力和适用场景。

发布于 2026-05-04

摘要

从 EleutherAI 的 lm-eval 到 OpenCompass、Lighteval、OpenAI Evals——六大评估框架的定位、差异和选型建议。

发布于 2026-05-04

摘要

来自 Yann LeCun 团队的 LeWorldModel，用 15M 参数 + 2 个 loss 实现了从像素到世界模型的端到端训练，规划速度提升 48 倍。本文深度解读这篇论文的核心创新、架构设计和研究意义。

Miku Lab