自然可控的人与场景交互(HumanSceneInteraction,HSI)生成在虚拟现实/增强现实(VR/AR)内容创作和以人为中心的人工智能等多个领域发挥着重要作用。然而,现有方法的可控能力有限、交互种类有限、生成结果不自然,严重限制了其在现实中的应用场景。针对这一问题,天津大学团队联合清华大学在ICCV2023的工作中提出Narrator,将重点放在一项具有挑战性的任务上,即从文本描述中自然可控地生成逼真且多样的人与场景交互。图片项目主页:http://cic.tju.edu.cn/faculty/likun/projects/Narrator代码:https://github.com/