扩散 LLM 并行解码的「组合矛盾」终于有了 training-free 解法——ReMix 用 Continuous Mixing State 让 token 在连续空间先协商再离散,Rejection 规则把不确定表达打回 mask 重炼,实现 2–8× 无损推理加速。通勤两分钟,听懂今日最强扩散 LLM 推理方法论。
Add more perspectives or context around this Drop.
Add more perspectives or context around this Drop.