TensorRT-LLM

win下pytorch安装—cuda11.6 + cudnn8.4 + pytorch1.12 + tensorRT（pycuda）

安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch安装四、tensorRT8.X安装写在前面博主这里装的是cuda11.7，最后一步tensorRT运行的时候有个pycuda的安装，它的最新版本只支持到cuda11.6，所以博主最后是又把cuda11.7卸载后重新安装了11.6，安装过程和11.7一样。pytorch对应的版本也应该修改，但过程都一样。一、cuda安装下载地址：cuda下载官网链接1.1、cuda版本选择这里有个前置工作需要搞清楚的，就是自己的显卡支持的cuda版本。点击电脑左下角开始菜单找到点击【帮助】下【系统信息】点击【组件

pytorch pytorch1 插入 img 这里深度学习 python

LLM、ChatGPT与多模态必读论文150篇

为了写本ChatGPT笔记，我和10来位博士、业界大佬，在过去半年翻了大量中英文资料/paper，读完ChatGPT相关技术的150篇论文，当然还在不断深入。由此而感慨：读的论文越多，你会发现大部分人对ChatGPT的技术解读都是不够准确或全面的，毕竟很多人没有那个工作需要或研究需要，去深入了解各种细节因为半年内150篇这个任务，让自己有史以来一篇一篇一行一行读，之前看的比较散、不系统，抠的也不细比如回顾“Attentionisallyouneed”这篇后，对优化博客内的Transformer笔记便有了很多心得。考虑到为避免上篇文章篇幅太长而影响完读率，故把这些论文的清单抽取出来独立成本文技

模态必读 xff0c xff0 xff chatgpt 大模型人工智能算法语言模型

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，GoogleDeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联手提出全新方法——FunSearch，竟首次利用LLM发现数学科学中的开放问题！AI通过搜索计算机代码编写的「函数」，因此得名FunSearch。论文地址：https://www.nature.com/articles/s41586-023-06924-6简单来说，FunSearch将预训练的LLM与自动「评估器」配对使用。前者的目标是以计算机代码的形式提

里程难倒 text-align span style 人工智能新闻数学算法 AI

LLM生成3D场景，无限延伸！斯坦福华人提出3D动画生成框架，一句话一幅图创造无限3D世界

斯坦福华人退学博士开发的Pika，让AI技术和艺术迸发出了绚丽的火花。最近，又有斯坦福的华人研究人员提出的新的框架——WonderJourney，可以用一句话或者一张图，自动生成一系列3D场景的连续画面，效果炫酷！图片用一张爱丽丝奇境漫游的图片，就能生成一段真的爱丽丝漫游的梦境经历。或者，用一首陆游的《游山西村》，可以生成一段水墨风格的诗词梦境：莫笑农家腊酒浑，丰年留客足鸡豚。山重水复疑无路，柳暗花明又一村。箫鼓追随春社近，衣冠简朴古风存。从今若许闲乘月，拄仗无时夜扣门图片项目网址：https://kovenyu.com/WonderJourney/图片论文地址：https://arxiv.o

斯坦斯坦福 span text-align style 开发前端人工智能 LLM 3D 场景

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者YannLeCun也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为LLM发展的阻碍。一些开源模型虽然为从业者和研究者提供了多样化的选择，但大多数只公开了最终的模型权重或推理代码，越来越多的技术报告将其范围限制在顶层设计和表面统计之内。这种闭源的策略不仅限制了开源模型的发展，而且还在很大程度上阻碍了整个LLM研究领域的进步。这意味着，这些模型需要更全面和深入地共享，包括训练数据、算法细节、实现挑战以及性能评估的细节。Cerebra

死角开源 span text-align style 人工智能新闻 AI 技术

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免LLM产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少LLM幻觉（hallucinations，即错误事实）?如何在数据政策更改后快速迭代LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于LLM的安全可信部署至关重要。目前业界的主流解决方案为LLM对齐(alignment)，即通过建立对比数据（正样本和负样本）用强化学习的方式来对LLM进行微调(Finetuning)，也就是RLHF(ReinforcementLearningfromHumanFeedback)[1]，从而保证LLM输出符合人类预期和

字节有害 span text-align style 人工智能新闻模型算力

ToolkenGPT：用大量工具增强LLM

深度学习自然语言处理原创作者：cola用外部工具增强大型语言模型(LLM)已经成为解决复杂问题的一种方法。然而，用样例数据对LLM进行微调的传统方法，可能既昂贵又局限于一组预定义的工具。最近的上下文学习范式缓解了这一问题，但有限的上下文长度局限于少样本样例，导致不能完全挖掘工具的潜力。此外，当有许多工具可供选择时，上下文学习可能完全不起作用。因此本文提出了一种替代方法ToolkenGPT，它结合了双方的优势。论文：ToolkenGPT:AugmentingFrozenLanguageModelswithMassiveToolsviaToolEmbeddings地址：https://arxiv.

ToolkenGPT 增强 xff0c xff0 xff

论文阅读——Img2LLM（cvpr2023）

arxiv：[2212.10846]FromImagestoTextualPrompts:Zero-shotVQAwithFrozenLargeLanguageModels(arxiv.org)一、介绍使用大语言模解决VQA任务的方法大概两种：multi-modalpretrainingandlanguage-mediatedVQA，即多模态预训练的方法和以语言模型为媒介的VQA。Multi-modalpretraining：训练一个额外的模块对齐视觉和语言向量。这类方法有两个很大的缺点，一是计算资源大，训练Flamingo需要1536TPUv4，耗时两周。另外是灾难性遗Catastrophi

mdash Img2LLM xff0c xff xff0 深度学习人工智能

构建更好的基于LLM的应用程序的四大秘诀

作者 | AdrienTreuille译者 | 布加迪审校 | 重楼出品|51CTO技术栈（微信号：blog51cto）自从OpenAI发布首个ChatGPT模型以来，人们对生成式AI的兴趣激增。基于大语言模型（LLM）的应用程序现处于企业思考生产力和效率的最前沿，用于构建生成式AI应用程序的工具和框架得到了极大的扩展。但人们仍然担心生成式AI输出的准确性，因此开发人员需要快速学会处理诸如此类的问题，以构建强大、可靠的应用程序。以下是提高LLM应用程序准确性的一些建议和技术，以及选择正确LLM的注意事项。我们无法详尽地探讨这些问题，因为每个问题本身都很复杂，但我们可以提供一番建议，供诸位进一步

应用程序秘诀应用程序人工智能 LLM AI ChatGPT

【Video-LLaMA】增强LLM对视频内容的理解

Paper:《Video-LLaMA:AnInstruction-tunedAudio-VisualLanguageModelforVideoUnderstanding》Authors:HangZhang,XinLi,LidongBing;Affiliation:TheAlibabaDAMOAcademy;Keywords:MultimodalLargeLanguageModels,Cross-modaltraining.研发背景大型语言模型(LLM)在遵循用户意图和指示上表现出了卓越的理解和理解能力，通常，LLM的用户请求和相应的响应都是文本形式的，然而，由于现实世界的信息通常是多模态的，仅

Video-LLaMA 增强 span class vlist 音视频人工智能计算机视觉深度学习语音识别

14 15 161718 19 20