TensorRT-LLM

Stable Diffusion教程——使用TensorRT GPU加速提升Stable Diffusion出图速度

概述Diffusion模型在生成图像时最大的瓶颈是速度过慢的问题。为了解决这个问题，StableDiffusion采用了多种方式来加速图像生成，使得实时图像生成成为可能。最核心的加速是StableDiffusion使用了编码器将图像从原始的3512512大小转换为更小的46464大小，从而极大地降低了计算量。它还利用了潜在表示空间（latentspace）上的Diffusion过程，进一步降低了计算复杂度，同时也能保证较好的图像生成效果。在消费级GPU上（8G显存），StableDiffusion要生成一张描述复杂图像大概需要4秒时间。然而，对于许多面向消费者的应用来说，每张图像生成需要4秒的

AI大模型开发架构设计（1）——LLM大模型Agent剖析和应用案例实战

文章目录LLM大模型Agent剖析和应用案例实战1从LLM大模型到智能体演进技术语言模型是什么？大语音模型是什么？大语言模型日新月异LLM大模型存在局限性LLMAgent来势凶凶LLMAgent增长迅猛LLMAgent是什么？2LLMAgent架构深度剖析规划能力是什么？记忆能力是什么？工具使用能力是什么？3LLMAgent应用案例实战Auto-GPT基于LangChain实现一个CodeInterpreterLLM大模型Agent剖析和应用案例实战1从LLM大模型到智能体演进技术语言模型是什么？语言模型：给定一些字或者词(称为token)，预测下一个字或者词的模型。大语音模型是什么？大语言模

LLM应用开发与落地：使用gradio十分钟搭建聊天UI

一、背景如果你是做LLM应用开发的，特别是做后端开发，你一定会遇到怎么快速写一个聊天UI界面来调试prompt或agent的问题。这时候的你可能在苦恼中，毕竟react.js,next.js,css,html也不是每个人都那么熟练，对吧？即使你是做前端开发的，你也可以尝试一下Gradio，哪天有人给你提了一个调试界面的需求，原本要半天的工作现在只需要十分钟了，多余的时机用来学习或享受生活，多美（或者，你让后端自己用Gradio搞一个，嘿嘿）。类似于Gradio这种低代码快速搭建webui的方案中，比较成熟还有Streamlit、Chainlit和dash等。这些方案都可以快速实现ChatGPT

AIGC（MLLM、VLM、LLM、SD）系列——论文解读目录

涉及面广：多模态生成模型——MLLM（目前集中在视觉语言模型——VLM）、大语言模型——LLM、生成模型（SD系列）、对比学习的经典模型（CLIP系列）。持续更新：对于已经完成解读的会附上链接（有的会在一些场景做尝试，也会附上链接供大家快速参考结果），准备写的会备注筹备中。适宜人群：节省大把时间，快速定位需要的部分，适合学生、入门AIGC者和从业者作为笔记检索使用。———————————————————————————————————————————RAM论文题目：RecognizeAnything:AStrongImageTaggingModel关键词：RAM、属性识别、多标签分类、解读论文

每日一看大模型新闻（2023.12.13）趣味项目CLoT:训练LLM更幽默地回答问题；用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习；2.7B能打Llama 2 70B，微软祭出

1.产品发布1.12.7B能打Llama270B，微软祭出「小语言模型」发布时间：2023-12-132.7B能打Llama270B，微软祭出「小语言模型」！96块A10014天训出Phi-2，碾压谷歌Gemininano主要内容：11月份以来，大型语言模型技术领域发生了许多重要事件。OpenAI推出了GPTs，颠覆了先前的GPT模型，并通过引入董事会吸引了大量关注。谷歌也在年底前匆忙发布了超大规模Gemini模型，甚至涉及了"视频造假"。微软则正式发布了Phi-2小语言模型，拥有2.7B参数，几乎超越所有13B以下的大型模型。Phi-2表现出色，性能可媲美比自己大25倍的模型。微软强调了训练

LLM | 一些开源的AI代码生成模型调研及总结【20240130更新】

本文主要介绍主流代码生成模型，总结了基于代码生成的开源大语言模型，按照时间顺序排列。在了解代码大语言模型之前，需要了解代码相关子任务代码生成文本生成代码(Texttocode):根据自然语言描述生成代码重构代码（Refactoringcode）:在不改变其功能的情况下更改源代码的结构，通常是为了使其更加高效、可读且易于维护。代码到代码的翻译（Code-to-code）:将一种编程语言编写的代码转换为另一种同功能编程语言的过程。此过程也称为代码转换、转译、代码迁移或源到源翻译。概述DataModelComment2020CodeBERTEnhancingthecapabilityofsource

聊聊苹果极致的LLM端侧方案

本文经自动驾驶之心公众号授权转载，转载请联系出处。端侧LLM毫无疑问会成为各手机厂商在2024年的主战场。从国内各手机厂透露的信息来看，大家几乎都把希望寄托在了芯片厂身上，自身能做的、会做的工作太少。希望苹果的工作对国内厂商们有启发、借鉴意义。论文链接：LLMinaflash:EfficientLargeLanguageModelInferencewithLimitedMemory1.FlashMemoryandDRAM在移动端设备中（如手机），DRAM可理解为“运行时内存”，FlashMemory可理解为“存储空间”。做一个简单的类比，在PC中，DRAM对应于内存；FlashMemory对应

大模型没有护城河？OpenAI的“LLM城池”如何攻破，如何防守

作者|BenDickson译者|李睿审校|重楼出品|51CTO技术栈（微信号：blog51cto）小模型、开源模型正在猛攻GPT-4，OpenAI需要更完善的措施来构建技术方面的护城河，以保护其LLM业务。2023年5月，谷歌公司泄露的一份内部文件揭示了ChatGPT和GPT-4等大型语言模型(LLM)面临的挑战。这份文件的主要观点是，谷歌公司和OpenAI没有为他们的私有大型语言模型(LLM)构建技术方面的“护城河”。开源模式最终将主导LLM市场。这份文件中写道：“虽然我们开发的LLM在质量方面仍有一定的优势，但这种优势正在惊人地迅速缩小。开源模型处理速度更快、更可定制、更私密，而且功能更强

一文搞懂使用 Arthur Bench 进行 LLM 评估

Hellofolks，我是Luga，今天我们来聊一下人工智能(AI)生态领域相关的技术-LLM评估。一、传统文本评估面临的挑战近年来，随着大型语言模型(LLM)的快速发展和改进，传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域，我们可能已经听说过一些方法，例如基于“单词出现”的评估方法，比如BLEU，以及基于“预训练的自然语言处理模型”的评估方法，比如BERTScore。尽管这些方法在过去一直非常出色，但随着LLM的生态技术的不断发展，它们显得有点力不从心，无法完全满足当前的需求。随着LLM的快速发展和改进，我们正在面对新的挑战和机遇。LLM的能力和表现水平不断提高，这使得基于单词

美国博士小哥打败女友的AI男友！7页论文让LLM降智，训出「负分男友」成功挽回

女友爱上AI了，怎么破？一位自称来自Cranberry-Lemon大学应用心理机器学习系的ChadBroman博士最近表示，自己已经和女友Tiffany分手8个月了。虽然很享受单身的自由，但身边没有女友的日子，连玩快艇都少了很多滋味。他一直想找机会和女友复合，然而女友那里却有了自己的完美替代品——Chad-GPT。这个AI男友更聪明、更体贴，轻易赢得了Tiffany的芳心，看起来小哥没戏了。但是，决心用魔法打败魔法的小哥，开发出一种策略，通过错误标记正向和负向男友行为数据，战胜了AI聊天机器人。他把自己的情敌训练成了一个不及时回消息、多疑善妒的坏男友，让Tiffany和「他」的关系破裂了！这位