TensorRT-LLM

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站C位的Transformer最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了SOTA性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B模型都优于同等规模的Transformer模型，并能与两倍于其规模的Transformer模型相媲美。论文一经发表，引起了不小的轰动。惊叹之余，大家发现论文作者只有两位，一位是卡内基梅隆大学机器学习系助理教授AlbertGu，另一位是Together.AI首席科学家、普林斯顿大学计算机科学助理教授（即将上任）TriDao。这项研究的一个重要创新是引入了一个名为「选

2023年科研领域「科学ChatGPT」有哪些？LLM for Science有哪些探索......

2023年，人工智能领域最具影响的莫过于GPT-4、ChatGPT了。ChatGPT入选《Nature》2023年度十大人物（Nature’s10），这是有史以来第一次「计算机程序」——首个非人类实体入选。《Nature》表示这一做法旨在认可模仿人类语言的AI系统在科学发展和进步中所发挥的作用。同时，ChatGPT在内的AI工具也被《Nature》评为 2024年值得关注的科学事件之一。期待更先进的下一代AI模型GPT-5、AlphaFold新版本发布。继ChatGPT之后，全球各行各业大模型千帆竞发。ChatGPT火出了圈，在科学研究领域，衍生出哪些「科研ChatGPT」？ChatGPT在科

Patronus AI发现LLM存在令人担忧的安全漏洞

自动评估和安全平台PatronusAI（守护神）发布了一个诊断测试套件SimpleSafetyTest的结果，该套件显示了大型语言模型(LLM)中的关键安全风险。该公告揭示了人工智能模型的局限性，并强调了改进的必要性，特别是对金融等高度监管行业的人工智能用例。来自PatronusAI的发现，正值人们越来越担心ChatGPT等GenAI（生成式人工智能）系统的准确性，以及GenAI系统对查询提供有害回复的可能性。人们也越来越需要对人工智能的使用进行道德和法律监督。PatronusAISimpleSafetyTest的结果是基于对SEC(美国证券交易委员会)文件中一些最流行的开源LLM的测试。该测

SQL应用于LLM的程序开发利器——开源LMQL

译者|朱先忠审校|重楼我相信你听说过SQL，甚至已经掌握了它。SQL（结构化查询语言）是一种广泛用于处理数据库数据的声明性语言。根据StackOverflow的年度调查，SQL仍然是世界上最流行的语言之一。对于专业开发人员来说，SQL是排名前三的语言（仅次于Javascript和HTML/CSS）。超过一半的专业人士使用它。令人惊讶的是，SQL甚至比Python更受欢迎。作者图表，数据来自StackOverflow调查SQL是与数据库中的数据进行对话的常用方法。因此，有人试图对LLM使用类似的方法也就不足为奇了。在本文中，我想告诉您一种叫做LMQL的方法。什么是LMQL？LMQL（语言模型查询

Nature | 大型语言模型(LLM)能够发现和产生新知识吗？

大型语言模型（LLM）是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络，这些神经网络由具有自注意力功能的编码器和解码器组成。编码器和解码器从一系列文本中提取含义，并理解其中的单词和短语之间的关系。通过此过程，转换器可学会理解基本的语法、语言和知识。借助转换器神经网络架构，人们可以使用非常大规模的模型，其中通常具有数千亿个参数。这种大规模模型可以摄取通常来自互联网的大量数据，但也可以从包含500多亿个网页的CommonCrawl和拥有约5700万个页面的Wikipedia等来源摄取数据。一般来讲，LLM主要是在已有的知识库上进行学习，然后通过阅读、理解、写作和编码来帮助人们

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用CSDN平台，自主完成项目设计升级，提升自身的硬实力。专栏订阅：项目大全提升自身的硬实力[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景LLM（LargeLanguageModel）技术是一种基于深度学习的自然语言处理技术，旨

LLM 和搜索引擎是一样的吗？

在这篇文章中，了解更多关于AI大型语言模型（如ChatGPT）的潜力。了解他们如何彻底改变生产力，并探索他们与搜索引擎不断变化的关系。像ChatGPT这样的AI大型语言模型（LLM）已经风靡全球，并被集成到工作流程、平台和软件中，以提高我们的效率和生产力。ChatGPT就像新弗兰克的红辣酱;人们用它来做任何事情。像谷歌和必应这样的搜索引擎已经发生了变化，将人工智能聊天机器人纳入他们的算法中，但搜索引擎和人工智能LLM现在有同样的目的吗？以下是AILLM和搜索引擎之间的比较：功能AI大型语言模型旨在根据它们收到的输入生成类似人类的文本。他们可以回答问题、起草内容、提供建议、协助完成任务等等。虽然

大语言模型（LLM）的进化树，学习LLM看明白这一张图就够了

近期大语言模型迅速发展，让大家看得眼花缭乱，感觉现在LLM的快速发展堪比寒武纪大爆炸，各个模型之间的关系也让人看的云里雾里。最近一些学者整理出了ChatGPT等语言模型的发展历程的进化树图，让大家可以对LLM之间的关系一目了然。论文：https://arxiv.org/abs/2304.13712Github(相关资源)：https://github.com/Mooler0410/LLMsPracticalGuide最重要的进化树图：进化的树图现代语言模型的进化树追溯了近年来语言模型的发展,并强调了一些最著名的模型。同一分支上的模型关系更近。基于Transformer的模型显示为非灰色颜色:仅

改进召回（Retrieval）和引入重排（Reranking）提升RAG架构下的LLM应用效果

改进召回（Retrieval）和引入重排（Reranking）提升RAG架构下的LLM应用效果原创 ully AI工程化 2023-08-2421:08收录于合集#LLM应用架构3个#领域技术13个动手点关注干货不迷路如前文LLM应用架构之检索增强（RAG）的缘起与架构介绍，RAG架构很好的解决了当前大模型Promptlearning过程中contextwindow限制等问题，整体架构简明清晰，易于实现，得到了广泛的应用，但实际落地过程中有大量的实际问题需要改进优化。llamaindex实现下的RAG架构以RAG召回为例，最原始的做法是通过top-k的方式从向量数据库中检索背景数据然后直接提交

transformer大语言模型(LLM)部署方案整理

说明大模型的基本特征就是大，单机单卡部署会很慢，甚至显存不够用。毕竟不是谁都有H100/A100,能有个3090就不错了。目前已经有不少框架支持了大模型的分布式部署，可以并行的提高推理速度。不光可以单机多卡，还可以多机多卡。我自己没啥使用经验，简单罗列下给自己备查。不足之处，欢迎在评论区指出。框架名称出品方开源地址FasterTranaformer英伟达FasterTransformergithubTGIhuggingfacehuggingface/text-generation-inferencevLLM伯克利大学LMSYS组织github-vllmdeepspeed微软github.com