jjzjj

Karpathy

全部标签

谷歌DeepMind团队深夜发布新AI开源模型Gemma;技术大神Karpathy离职OpenAI后发布教学视频

🦉AI新闻🚀谷歌DeepMind团队深夜发布新AI开源模型Gemma摘要:谷歌DeepMind团队于今日发布了一款名为Gemma的新型AI模型,该模型启发自Gemini,提供两个版本:Gemma2B和Gemma7B。这款模型支持Keras3.0和PyTorch等工具进行微调,可在性能较低的设备上运行,且性能超越竞品MetaLlama-2模型。为确保模型的安全性和可靠性,研究团队采用自动化技术过滤敏感数据,并通过大量微调及“强化学习”等手段提高模型的行为一致性。此外,对模型进行了“红队测试”和“自动对抗测试”以评估其能力,确保模型具有“负责任的特性”。Kaggle地址:https://www.k

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

文生图领域作为一个跑出「10人团队年收入过亿美金初创公司」的赛道,已经成了AI创业公司掘第一桶金的最佳起点。但是在谷歌,微软等大厂都已经花了大量资源去布局的领域,留给初创公司的机会到底在哪里?最近一家名为Ideogram的文生图工具,凭借优秀的文字渲染能力,成功融资8000万美元!包括JeffDean和AndrejKarpathy在内的一众硅谷大佬和知名机构都是它的投资人。只要在prompt里将文字打上去,就能非常自然可控地出现在生成的图片中。而且生成的图片不仅能简单的以平面文字的形式出现在图片之中,还能根据用户的要求,生成自然的悬浮文字,或者是立体的文字。甚至用一句提示词,它能直接给你画出图

干货满满!大神Karpathy两小时AI大课文字版第一弹,全新工作流自动把视频转成文章

前段时间,AI大神Karpathy上线的AI大课,已经收获了全网15万次播放量。当时还有网友表示,这2小时课程的含金量,相当于大学4年。就在这几天,Karpathy又萌生了一个新的想法:那便是,将2小时13分钟的「从头开始构建GPT分词器」的视频,转换为一本书的章节(或者博客文章)形式,专门讨论「分词」。具体步骤如下:-为视频添加字幕或解说文字。-将视频切割成若干带有配套图片和文字的段落。-利用大语言模型的提示工程技术,逐段进行翻译。-将结果输出为网页形式,其中包含指向原始视频各部分的链接。更广泛地说,这样的工作流程可以应用于任何视频输入,自动生成各种教程的「配套指南」,使其格式更加便于阅读、

Karpathy离职OpenAI,首发2小时AI大课!从头开始构建GPT分词器

离职OpenAI的技术大神karpathy,终于上线了2小时的AI大课。——「让我们构建GPTTokenizer(分词器)」。其实,早在新课推出两天前,karpathy在更新的GitHub项目中,就预告了这件事。这个项目是minbpe——专为LLM分词中常用的BPE(字节对编码)算法创建最少、干净以及教育性的代码。目前,GitHub已经狂揽6.1k星,442个fork。项目地址:https://github.com/karpathy/minbpe网友:2小时课程含金量,相当于大学4年不得不说,karpathy新课发布依然吸引了业内一大波学者的关注。他总是可以把相当复杂的LLM概念,用非常好理解

Karpathy新视频又火了:从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。这不,前脚新项目刚上线,后脚全新的教学视频又给大伙整出来了:这次,是手把手教咱构建一个GPTTokenizer(分词器),还是熟悉的时长(足足2小时13分钟)。Ps.上次讲课还是俩月前的大模型科普。所谓“卡帕西出手,必属精品”,大伙火速码码码:今晚的约会取消,卡帕西来了我要去上课(狗头)再说一遍,付费都买不到的这样高质量的课程,冲。具体都有哪些干货?“太长不看版”已为大家准备好。为什么要关注Tokenizer如大神介绍:Tokenizer即分词器是大语言模型pipeline中一个完全独立的阶段。它们有自己的训练集、算法(比如BPE,字节对

Vision Pro开卖炸出各种显眼包!开车/健身/过马路操作秀翻天,AI大牛Karpathy发千字亲测体验

全球第一台VisionPro被捧出店门的那一刻,整个人群沸腾了。历史会记住这一刻。苹果VisionPro的诞生,注定改变全人类,改变全世界。2月2日早上9点,库克亲临现场,推开纽约苹果门店的大门。国内的网友,开始打飞的去大洋彼岸抢VisionPro了。而现在,第一批拿到VisionPro的用户,已经开始各种整活了!显眼包们戴着VisionPro过马路、开车看看这位来自未来的人,正戴着苹果头显过马路,不仅随时观测左右两边路况,双手还在空中各种比划操作。小哥倒是一本正经,但这波操作着实带着莫名的喜感。还有这个逛商场版的,看着同样很滑稽。戴着VisionPro在纽约这人车环境复杂的街道过马路,必须要

OpenAI联创Karpathy发文:用自动驾驶诠释AGI!原贴已删速收藏

对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。不知是何原因,他却删除了这篇文章,幸而,还有网络备份。众所周知,Karpathy不仅是OpenAI的创始成员之一,还曾是特斯拉前AI高级总监、自动驾驶Autopilot负责人。他将自动驾驶作为案例,研究AGI,这篇文章的观点确实值得一看。自动驾驶LLM的爆发引发了众多关于AGI降临的时间,甚至它可能是什么样子的讨论。有的人对AGI未来充满希望,持有乐观的态度。而有的人却充满恐惧和悲观的情绪。不幸的是,其中也有很多讨论过于抽象,导致

历时四年,iPhone遭史上最复杂攻击!一条iMessage窃走所有隐私数据,Karpathy惊呼

最近,卡巴斯基的研究人员发现,有黑客在四年多的时间里给数千部iPhone留下了一个非常隐蔽的后门。通过这个硬件级别的后门,能直接获得iPhone最高级别的Root权限。而要成功利用这个后门,必须要对苹果产品最底层的机制有非常全面细致的了解。以至于发现这个漏洞的卡巴斯基研究人员称「无法想象这个漏洞是如何被意外发现的。」在他看来,除了苹果和ARM之外,几乎不可能有人能获知这个漏洞。而间谍软件可以通过这个复杂的漏洞,将麦克风录音、照片、地理位置和其他敏感数据传输到攻击者控制的服务器。尽管重新启动就能关闭这个漏洞,但攻击者只需在设备重新启动后向设备发送新的恶意iMessage文本,就能重新开启这个漏洞

OpenAI内斗时,Karpathy在录视频:《大型语言模型入门》上线

OpenAI的风波暂时告一段落,员工也忙着「干活了」。年初回归OpenAI的AndrejKarpathy最近做了一场关于大型语言模型(LLM)的30分钟入门讲座,但该讲座当时没录制。因此,他基于这场讲座重新录制了一个长达1小时的视频,希望让更多人看到和学习。视频的主题为《大型语言模型入门》,涵盖了LLM的推理、训练、微调以及新出现的LLM操作系统和LLM安全。视频主打「非技术性」,偏科普,所以更加容易理解。想要了解更详细内容,大家可观看原视频。我们接下来整体了解一下Karpathy都讲到了哪些内容。视频主要分为三大部分展开,分别是LLMs、LLMs的未来和LLM安全。在第一部分,Karpath

Midjourney+Gen2,七步完成「芭本海默」,引Karpathy惊呼|附实测经验

在前两天芭比海默全网爆火之后,不断有网友“复现”用MidJourney+Gen-2制作电影的神技!而一位网友更新了一个自己的教程,制作芭本海默只需7步,被Karpathy盛赞为“电影制作工业2.0”。一部20秒钟,有完整剧情,包含6个分镜头的动画短片,7步完成,曹植看了都要直呼内行!7步完成芭比海默,效果惊人下面就给大家具体演示一下:1. ChatGPT帮你写分镜头剧本,顺便再帮你把字幕也写好2. 根据分镜头脚本,用Midjourney生成每个镜头的开始的一张图片。这里可能是7步成片中唯一一步稍微有点门槛的操作,每张图片的提示词要自己创作。但是点击图片放大之后可以看到提示词也不是很长,有一点英