Karpathy_JJZJJ

谷歌DeepMind团队深夜发布新AI开源模型Gemma；技术大神Karpathy离职OpenAI后发布教学视频

🦉AI新闻🚀谷歌DeepMind团队深夜发布新AI开源模型Gemma摘要：谷歌DeepMind团队于今日发布了一款名为Gemma的新型AI模型，该模型启发自Gemini，提供两个版本：Gemma2B和Gemma7B。这款模型支持Keras3.0和PyTorch等工具进行微调，可在性能较低的设备上运行，且性能超越竞品MetaLlama-2模型。为确保模型的安全性和可靠性，研究团队采用自动化技术过滤敏感数据，并通过大量微调及“强化学习”等手段提高模型的行为一致性。此外，对模型进行了“红队测试”和“自动对抗测试”以评估其能力，确保模型具有“负责任的特性”。Kaggle地址：https://www.k

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3！5亿融资Karpathy都投了

文生图领域作为一个跑出「10人团队年收入过亿美金初创公司」的赛道，已经成了AI创业公司掘第一桶金的最佳起点。但是在谷歌，微软等大厂都已经花了大量资源去布局的领域，留给初创公司的机会到底在哪里？最近一家名为Ideogram的文生图工具，凭借优秀的文字渲染能力，成功融资8000万美元！包括JeffDean和AndrejKarpathy在内的一众硅谷大佬和知名机构都是它的投资人。只要在prompt里将文字打上去，就能非常自然可控地出现在生成的图片中。而且生成的图片不仅能简单的以平面文字的形式出现在图片之中，还能根据用户的要求，生成自然的悬浮文字，或者是立体的文字。甚至用一句提示词，它能直接给你画出图

干货满满！大神Karpathy两小时AI大课文字版第一弹，全新工作流自动把视频转成文章

前段时间，AI大神Karpathy上线的AI大课，已经收获了全网15万次播放量。当时还有网友表示，这2小时课程的含金量，相当于大学4年。就在这几天，Karpathy又萌生了一个新的想法：那便是，将2小时13分钟的「从头开始构建GPT分词器」的视频，转换为一本书的章节（或者博客文章）形式，专门讨论「分词」。具体步骤如下：-为视频添加字幕或解说文字。-将视频切割成若干带有配套图片和文字的段落。-利用大语言模型的提示工程技术，逐段进行翻译。-将结果输出为网页形式，其中包含指向原始视频各部分的链接。更广泛地说，这样的工作流程可以应用于任何视频输入，自动生成各种教程的「配套指南」，使其格式更加便于阅读、

Karpathy离职OpenAI，首发2小时AI大课！从头开始构建GPT分词器

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。——「让我们构建GPTTokenizer（分词器）」。其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。这个项目是minbpe——专为LLM分词中常用的BPE（字节对编码）算法创建最少、干净以及教育性的代码。目前，GitHub已经狂揽6.1k星，442个fork。项目地址：https://github.com/karpathy/minbpe网友：2小时课程含金量，相当于大学4年不得不说，karpathy新课发布依然吸引了业内一大波学者的关注。他总是可以把相当复杂的LLM概念，用非常好理解

Karpathy新视频又火了：从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后，营业可谓相当积极啊。这不，前脚新项目刚上线，后脚全新的教学视频又给大伙整出来了：这次，是手把手教咱构建一个GPTTokenizer（分词器），还是熟悉的时长（足足2小时13分钟）。Ps.上次讲课还是俩月前的大模型科普。所谓“卡帕西出手，必属精品”，大伙火速码码码：今晚的约会取消，卡帕西来了我要去上课（狗头）再说一遍，付费都买不到的这样高质量的课程，冲。具体都有哪些干货？“太长不看版”已为大家准备好。为什么要关注Tokenizer如大神介绍：Tokenizer即分词器是大语言模型pipeline中一个完全独立的阶段。它们有自己的训练集、算法（比如BPE，字节对

Vision Pro开卖炸出各种显眼包！开车/健身/过马路操作秀翻天，AI大牛Karpathy发千字亲测体验

全球第一台VisionPro被捧出店门的那一刻，整个人群沸腾了。历史会记住这一刻。苹果VisionPro的诞生，注定改变全人类，改变全世界。2月2日早上9点，库克亲临现场，推开纽约苹果门店的大门。国内的网友，开始打飞的去大洋彼岸抢VisionPro了。而现在，第一批拿到VisionPro的用户，已经开始各种整活了！显眼包们戴着VisionPro过马路、开车看看这位来自未来的人，正戴着苹果头显过马路，不仅随时观测左右两边路况，双手还在空中各种比划操作。小哥倒是一本正经，但这波操作着实带着莫名的喜感。还有这个逛商场版的，看着同样很滑稽。戴着VisionPro在纽约这人车环境复杂的街道过马路，必须要

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

对于「通用人工智能」，OpenAI科学家Karpathy下场做出了解释。前几天，Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。不知是何原因，他却删除了这篇文章，幸而，还有网络备份。众所周知，Karpathy不仅是OpenAI的创始成员之一，还曾是特斯拉前AI高级总监、自动驾驶Autopilot负责人。他将自动驾驶作为案例，研究AGI，这篇文章的观点确实值得一看。自动驾驶LLM的爆发引发了众多关于AGI降临的时间，甚至它可能是什么样子的讨论。有的人对AGI未来充满希望，持有乐观的态度。而有的人却充满恐惧和悲观的情绪。不幸的是，其中也有很多讨论过于抽象，导致

历时四年，iPhone遭史上最复杂攻击！一条iMessage窃走所有隐私数据，Karpathy惊呼

最近，卡巴斯基的研究人员发现，有黑客在四年多的时间里给数千部iPhone留下了一个非常隐蔽的后门。通过这个硬件级别的后门，能直接获得iPhone最高级别的Root权限。而要成功利用这个后门，必须要对苹果产品最底层的机制有非常全面细致的了解。以至于发现这个漏洞的卡巴斯基研究人员称「无法想象这个漏洞是如何被意外发现的。」在他看来，除了苹果和ARM之外，几乎不可能有人能获知这个漏洞。而间谍软件可以通过这个复杂的漏洞，将麦克风录音、照片、地理位置和其他敏感数据传输到攻击者控制的服务器。尽管重新启动就能关闭这个漏洞，但攻击者只需在设备重新启动后向设备发送新的恶意iMessage文本，就能重新开启这个漏洞

OpenAI内斗时，Karpathy在录视频：《大型语言模型入门》上线

OpenAI的风波暂时告一段落，员工也忙着「干活了」。年初回归OpenAI的AndrejKarpathy最近做了一场关于大型语言模型（LLM）的30分钟入门讲座，但该讲座当时没录制。因此，他基于这场讲座重新录制了一个长达1小时的视频，希望让更多人看到和学习。视频的主题为《大型语言模型入门》，涵盖了LLM的推理、训练、微调以及新出现的LLM操作系统和LLM安全。视频主打「非技术性」，偏科普，所以更加容易理解。想要了解更详细内容，大家可观看原视频。我们接下来整体了解一下Karpathy都讲到了哪些内容。视频主要分为三大部分展开，分别是LLMs、LLMs的未来和LLM安全。在第一部分，Karpath

Midjourney+Gen2，七步完成「芭本海默」，引Karpathy惊呼｜附实测经验

在前两天芭比海默全网爆火之后，不断有网友“复现”用MidJourney+Gen-2制作电影的神技！而一位网友更新了一个自己的教程，制作芭本海默只需7步，被Karpathy盛赞为“电影制作工业2.0”。一部20秒钟，有完整剧情，包含6个分镜头的动画短片，7步完成，曹植看了都要直呼内行！7步完成芭比海默，效果惊人下面就给大家具体演示一下：1. ChatGPT帮你写分镜头剧本，顺便再帮你把字幕也写好2. 根据分镜头脚本，用Midjourney生成每个镜头的开始的一张图片。这里可能是7步成片中唯一一步稍微有点门槛的操作，每张图片的提示词要自己创作。但是点击图片放大之后可以看到提示词也不是很长，有一点英