强于_JJZJJ

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

这一次，谷歌DeepMind在基础模型方面又有了新动作。我们知道，循环神经网络（RNN）在深度学习和自然语言处理研究的早期发挥了核心作用，并在许多应用中取得了实功，包括谷歌第一个端到端机器翻译系统。不过近年来，深度学习和NLP都以Transformer架构为主，该架构融合了多层感知器（MLP）和多头注意力（MHA）。Transformer已经在实践中实现了比RNN更好的性能，并且在利用现代硬件方面也非常高效。基于Transformer的大语言模型在从网络收集的海量数据集上进行训练，取得了显著的成功。纵然取得了很大的成功，但Transformer架构仍有不足之处，比如由于全局注意力的二次复杂性，

评论能力强于GPT-4，上交开源13B评估大模型Auto-J

随着生成式人工智能技术的快速发展，确保大模型与人类价值（意图）对齐（Alignment）已经成为行业的重要挑战。虽然模型的对齐至关重要，但目前的评估方法往往存在局限性，这也让开发者往往困惑：大模型对齐程度如何？这不仅制约了对齐技术的进一步发展，也引发了公众对技术可靠性的担忧。为此，上海交通大学生成式人工智能实验室迅速响应，推出了一款全新的价值对齐评估工具：Auto-J，旨在为行业和公众提供更加透明、准确的模型价值对齐评估。论文地址：https://arxiv.org/abs/2310.05470项目地址：https://gair-nlp.github.io/auto-j/代码地址：https: