jjzjj

Desmoothing

全部标签

Truncation Sampling as Language Model Desmoothing

本文是LLM系列文章,针对《TruncationSamplingasLanguageModelDesmoothing》的翻译。截断采样作为语言模型的去平滑性摘要1引言2背景3截断作为去平滑性4方法5实验与结果6相关工作7结论8不足摘要来自神经语言模型的长文本样本可能质量较差。截断采样算法(如top-p或top-k)通过在每一步将一些单词的概率设置为零来解决这一问题。这项工作为截断的目的提供了框架,并为此目的提供了一种改进的算法。我们建议将神经语言模型视为真实分布和平滑分布的混合体,以避免无限的困惑。在这种情况下,截断算法的目的是执行去平滑,估计真实分布的支持子集。找到一个好的子集至关重要:我们