jjzjj

使用Stable Diffusion生成超逼真人脸的三条途径

译者|布加迪审校|重楼有没有想过别人是如何使用AI图像生成如此超逼真的人脸,而你自己的尝试最终却充斥着缺陷和失真,看起来明显很假?你试着调整了提示和设置,但质量还是无法与你看到其他人生成的图像相媲美。你做错了什么?这篇博文将逐一介绍三项关键技术,开始使用StableDiffusion生成超逼真的人脸。首先,我们将介绍提示工程的基础知识,帮助你使用基本模型生成图像。接下来,我们将探讨如何升级到StableDiffusionXL模型可以通过更大的参数和训练显著提高图像质量。最后,我将介绍一个专门用于生成高质量图像的自定义模型。1.提示工程首先,我们将学习写正面和负面的提示,以生成逼真的人脸。我们将

还在搞NeRF?实时渲染生成逼真自动驾驶数据!Street Gaussians:超越所有SOTA!

本文经自动驾驶之心公众号授权转载,转载请联系出处。StreetGaussians的动机在自动驾驶领域,动态街景重建有着重要的应用场景,比如数据生成、自动标注、闭环仿真等。由于对重建质量和效率有较高的要求,这方面的技术仍旧临着巨大的挑战。对于单目视频建模动态城市街景的问题,近期方法主要是基于NeRF并结合跟踪车辆的姿态,从而重建出高真实感的视图。然而训练和渲染速度慢、对跟踪车辆姿态精度需求高,使其在很难真正被应用起来。我们提出了StreetGaussians,这是一种新的显式场景表示方法,可以解决所有这些限制。开源链接:StreetGaussiansforModelingDynamicUrban

【Midjourney V6】- Midjourney V6重磅升级:效果太逼真

Midjourney关于MidjourneyV6MidjourneyV6画作鉴赏提示1:街角酒吧的霓虹灯上写着“营业至深夜”提示2:1960年代的街头风格照片,一位年轻女子坐在帆船上,身穿绿色丝绸连衣裙,戴着珍珠项链。太阳正在夕阳西下,拍摄于AgfaVista200提示3:非洲大草原纪录片中狮子家族在日落时的摄影。场景包括一头雄狮、一头母狮和它们的幼崽。背景是金合欢树和夕阳提示4:一幅有趣的卡通画,海盗企鹅在热带岛屿上,戴着海盗帽,拿着地图寻找宝藏,肩膀上坐着一只鹦鹉。提示5:一锅炖菜,用木勺,自上而下的视角提示6:抽象、超现实的景观,有融化的时钟、扭曲的形状和漂浮的岛屿。调色板充满活力,混合

数据闭环!DrivingGaussian:逼真环视数据,驾驶场景重建SOTA

本文经自动驾驶之心公众号授权转载,转载请联系出处。写在前面&笔者的个人理解北大王选计算机研究所的最新工作,提出了DrivingGaussian,一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景,首先使用增量静态3D高斯对整个场景的静态背景进行顺序和渐进的建模。然后利用复合动态高斯图来处理多个移动目标,分别重建每个目标,并恢复它们在场景中的准确位置和遮挡关系。我们进一步使用激光雷达先验进行Gaussiansplatting,以重建具有更大细节的场景并保持全景一致性。DrivingGaussian在驱动场景重建方面优于现有方法,能够实现高保真度和多摄像机一致性的真实感环视视图合成。

超级逼真人脸生成,Stable Diffusion的3个关键技巧

大家好,你是否曾想过,为什么别人可以使用AI图像生成技术生成如此逼真的人脸,而自己的尝试却充满了错误和瑕疵,让人一眼看出是假的。尝试过调整提示和设置,但似乎仍无法与他人的质量相匹配。本文将带大家了解使用StableDiffusion生成超逼真人脸的3个关键技巧。首先将介绍提示工程的基础知识,帮助使用基础模型生成图像。接下来,将探讨升级到StableDiffusionXL模型后,如何通过更多的参数和训练来显著提高图像质量。最后,为大家介绍一种专门用于生成高质量人物肖像而微调的自定义模型。1.提示工程首先,我们将学习如何编写正面和负面的提示来生成逼真的人脸。我们将使用HuggingFaceSpac

DrivingGaussian:逼真环视数据,驾驶场景重建SOTA

本文经自动驾驶之心公众号授权转载,转载请联系出处。原标题:DrivingGaussian:CompositeGaussianSplattingforSurroundingDynamicAutonomousDrivingScenes论文链接:https://arxiv.org/pdf/2312.07920.pdf代码链接:https://pkuvdig.github.io/DrivingGaussian/作者单位:北京大学GoogleResearch加州大学默塞德分校论文思路:本文提出DrivingGaussian,这是一个针对动态自动驾驶场景的高效率和高效益的框架。对于具有移动物体的复杂场景,

英伟达官方盘点2023年十大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界

2023年,是人工智能爆炸式增长的一年。红色代表人工智能,蓝色代表机器学习微软、谷歌、Meta等科技巨头纷纷回顾了这一年研究成果。英伟达虽以卖算力成为全球GPU霸主,但在AI研究方面也毫不逊色。对此,JimFan本人总结了,英伟达2023年研究的十大看点。主题的主要分布:3个有关具身AI(机器人,虚拟角色);2个有关3D生成模型;2个图形处理;2个图像生成;1个视频生成的研究。TOP1:「神经朗琪罗」让16世纪的大卫复活来自英伟达和约翰霍普金斯大学的研究人员提出的新型AI模型,利用神经网络重建3D物体。最新研究还被CVPR2023录用。论文地址:https://research.nvidia.

Midjourney V6史诗级升级,网友惊呼太逼真!神图接连曝出,传今明两天上线

MidjourneyV6,正在紧急RLHF中。上线倒计时,已经开始!今天早上,MidjourneyV6开启了第二次社区评价。用户需要做标注,标注200张送1小时时长。网友们纷纷甩出神图,图片细节逼真,效果惊人:张张都是大片。图片图片这次V6的出图效果怎么评价呢,简单来说就是——图像和照片之间的差别已经消失。图片果然,能超越昨天的Midjourney的,只有今天的Midjourney。这些神图再次证明:在AI生图领域,目前没有谁能撼动Midjourney的地位。要知道,MidjourneyV5的发布,是在2023年3月,网友们已经整整等待9个月了。图片咱们啥时候能用?好消息:Midjourney

新游预告全球破亿!3天复刻一座机场,权游巨龙超逼真还原,背后硬核科技竟是ta

你能看出下面这两张图,哪张是实景,哪张是虚拟吗?熟悉的玩家们大概能一眼认出来——最近,这支游戏预告片还没出几天,全球播放量瞬间破亿!其中对现实场景的超逼真还原,让无数玩家们激动到颤抖。不仅建模的细节好到可怕,看起来完全就是真实的人。而且游戏中海滩和港口的镜头,也几乎和无人实拍的视频一模一样。为何能如此以假乱真?背后功臣,就是Rockstar全新升级的游戏引擎。不过,如果你以为游戏引擎只能在游戏中大放异彩,那你可就错了。如今,游戏科技已经赫然跻身为硬科技,在实实在在反哺着民航、汽车、建筑、影视、动画等行业。超逼真还原,无限模糊虚实边界为啥游戏科技能对这些行业进行加持?其中一大原因自然是——现在的

CSS特效029:超逼真的3D篮球弹跳,含挤压弹起模态

CSS常用示例100+专栏目录本专栏记录的是经常使用的CSS示例与技巧,主要包含CSS布局,CSS特效,CSS花边信息三部分内容。其中CSS布局主要是列出一些常用的CSS布局信息点,CSS特效主要是一些动画示例,CSS花边是描述了一些CSS相关的库、知识点、理论篇章等。因为常用所以记录、展示、分享,希望能给您带来帮助。文章目录效果图源代码CSS基础知识点结尾语css实战中,怎么绘制篮球弹跳,含挤压弹起模态的动画呢?这里集聚了放射性投影,位置迁移,篮球旋转等效果,很酷很绚丽,具体请参考源代码。效果图源代码/**@Author:大剑师兰特(xiaozhuanlan),还是大剑师兰特(CSDN)*@