狂升_JJZJJ

GPT-4拿下最难数学推理数据集新SOTA，新型Prompting让大模型推理能力狂升

近期，华为联和港中文发表论文《Progressive-HintPromptingImprovesReasoninginLargeLanguageModels》，提出Progressive-HintPrompting(PHP)，用来模拟人类做题过程。在PHP框架下，LargeLanguageModel(LLM)能够利用前几次生成的推理答案作为之后推理的提示，逐步靠近最终的正确答案。要使用PHP，只需要满足两个要求:1)问题能够和推理答案进行合并，形成新的问题；2)模型可以处理这个新的问题，给出新的推理答案。结果表明，GP-T-4+PHP在多个数据集上取得了SOTA结果，包括SVAMP(91.9%

当大模型开始规划合作，一个模型打造软件开发团队，代码生成性能狂升

AI自动生成代码是一种使用机器学习技术来生成程序代码的方法。通过对大量的程序代码进行训练，机器学习模型可以学习到程序代码的语法和结构，从而能够自动生成符合要求的程序代码。这种方式极大的提高了研究者的开发效率，特别是在重复性高、逻辑简单的任务中。同时，自动生成的代码还可以减少人为错误的发生，提高代码的可读性和可维护性。然而，现有的代码生成方法或工具在处理简单需求的场景时表现较好，如行级代码补全和初级的函数级代码生成。但在复杂的函数级代码生成、深入的问题分析和软件系统设计方面，它们的表现尚有不足。本文中，来自北京大学李戈教授团队的最新研究通过融入规划和合作的方法论，使大型模型在原有基础上能够应对更