LLaMA-Rider

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用CSDN平台，自主完成项目设计升级，提升自身的硬实力。专栏订阅：项目大全提升自身的硬实力[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya

Meta官方的Prompt工程指南：Llama 2这样用更高效

随着大型语言模型（LLM）技术日渐成熟，提示工程（PromptEngineering）变得越来越重要。一些研究机构发布了LLM提示工程指南，包括微软、OpenAI 等等。最近，Llama系列开源模型的提出者Meta也针对Llama2发布了一份交互式提示工程指南，涵盖了Llama2的快速工程和最佳实践。以下是这份指南的核心内容。Llama模型2023年，Meta推出了Llama、Llama2模型。较小的模型部署和运行成本较低，而更大的模型能力更强。Llama2系列模型参数规模如下：CodeLlama是一个以代码为中心的LLM，建立在Llama2的基础上，也有各种参数规模和微调变体：部署LLMLL

Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效

随着LLaMA、Mistral等大语言模型的成功，各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂，且新旧模型之间可能存在能力的冗余。近日，中山大学和腾讯AILab的研究人员提出了FuseLLM，用于「融合多个异构大模型」。不同于以往的模型集成和权重合并，前者需要在推理时同时部署多个大语言模型，后者需要合并模型具备相同的结果，FuseLLM能够从多个异构大语言模型中外化知识，将各自的知识和能力通过轻量的持续训练转移到一个融合大语言模型中。该论文刚刚在arXiv上发布就引起了网友的大量关注和转发。有人认为，「当想要在另一种语言上训练模型时，使用这种方法是

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读BaichuanBaichuan2:OpenLarge-scaleLanguageModels数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和denseembedding方法tokenizer：更好的压缩率，对数字的每一位分开，添加空格token位置编码：7BRope，13BALiBi使用了SwiGLU激活函数，因为SwiGLU是一个双线性层，多引入一个门控矩阵，参数量更多，hidden_size从4减少到了8/3使用了更高效的基于xFormers的attention实现使用RMSNorm，对transformer的block输入进行了Laye

Llama.cpp工具main使用手册

Llama.cpp提供的main工具允许你以简单有效的方式使用各种LLaMA语言模型。它专门设计用于与llama.cpp项目配合使用。推荐：用NSDT编辑器快速搭建可编程3D场景Llama.cpp的工具main提供简单的C/C++实现，具有可选的4位量化支持，可实现更快、更低的内存推理，并针对桌面CPU进行了优化。该程序可用于使用LLaMA模型执行各种推理任务，包括根据用户提供的提示生成文本以及使用反向提示进行类似聊天的交互。1、快速开始要立即开始，请运行以下命令，确保使用你拥有的模型的正确路径：基于Unix的系统（Linux、macOS等）：./main-mmodels/7B/ggml-mo

万元预算打造高质量13B私有模型，Colossal-AI LLaMA-2 开源方案再升级

几个月前，Colossal-AI团队仅利用8.5Btoken数据、15小时、数千元的训练成本，成功构建了性能卓越的中文LLaMA-27B版本模型，在多个评测榜单性能优越。在原有训练方案的基础上，Colossal-AI团队再次迭代，并通过构建更为细致完善的数据体系，利用25Btoken的数据，打造了效果更佳的13B模型，并开源相关权重。开源代码与权重：https://github.com/hpcaitech/ColossalAI性能表现注：基于ColossalEval评分，括号中分数来源于对应模型官方发布的榜单分数，C-Eval分数来源于官网Leaderboard。在英文MMLU榜单中，Colo

2023年最具影响力的 10 篇AI论文（Llama2、SAM、LLM、 Pythia、QLoRA、BloombergGPT、DPO、Mistral 7B、Orca 2、transformer）

2023一年又过去，这一年，AI圈子以一种“狂飙突进”的速度飞速发展，哪怕在这个领域深耕多年的学者们也开始感叹“从没有见过哪个领域在哪一年如同AI领域在2023年这样如此飞速的发展与不断的进化”，毫无疑问，这一年AI，尤其是大模型的爆发将会深刻影响未来我们生活的方方面面。抱着年终总结，也是对过去的2023这一里程碑式的一年回顾与展望的态度，来自AheadAI的SebastianRaschka博士为我们带来了2023年最值得大家关注，也是最有影响力的十篇AI论文，这里我们就和大家一起，用这十篇工作再次为2023年写下一段注脚（十篇论文不分先后）一、Pythia—大模型该如何训练？来自

LLM之RAG实战（十六）| 使用Llama-2、PgVector和LlamaIndex构建LLM Rag Pipeline

近年来，大型语言模型（LLM）取得了显著的进步，然而大模型缺点之一是幻觉问题，即“一本正经的胡说八道”。其中RAG（RetrievalAugmentedGeneration，检索增强生成）是解决幻觉比较有效的方法。本文，我们将深入研究使用transformer库、Llama-2模型、PgVector数据库和LlamaIndex库来构建RAGPipeline完整过程。一、什么是RAG（检索增强生成）？检索增强生成（RAG）模型是传统语言模型与信息检索组件的融合。从本质上讲，RAG利用外部数据（通常来自大型语料库或数据库）来增强大语言模型生成过程，以产生更知情和上下文相关的响应。二

【AI】RTX2060 6G Ubuntu 22.04.1 LTS (Jammy Jellyfish) 部署Chinese-LLaMA-Alpaca-2 【2】启用GPU支持

接上篇【AI】RTX20606GUbuntu22.04.1LTS(JammyJellyfish)部署Chinese-LLaMA-Alpaca-2-CSDN博客前面的实验，chat.sh确认是运行在CPU模式下，未启用GPU支持重新编译llama.cppsudoaptinstallnvidia-cuda-toolkitcd~/Downloads/ai/llama.cppmakecleanmakeLLAMA_CUBLAS=1-j6故障：nvccfatal :Value'native'isnotdefinedforoption'gpu-architecture'查看gpu-arch修改Makefil

快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型

1.为什么要对Yuan2.0做微调？ Yuan2.0（https://huggingface.co/IEITYuan）是浪潮信息发布的新一代基础语言大模型，该模型拥有优异的数学、代码能力。自发布以来，Yuan2.0已经受到了业界广泛的关注。当前Yuan2.0已经开源参数量分别是102B、51B和2B的3个基础模型，以供研发人员做进一步的开发。LLM（大语言模型）微调方案是解决通用大模型落地私有领域的一大利器。基于开源大模型的微调，不仅可以提升LLM对于指令的遵循能力，也能通过行业知识的引入，来提升LLM在专业领域的知识和能力。当前，学界和业界已经基于LLM开发及实践出了众多的微调方法，如指令