Vision_JJZJJ

不仅是Vision Pro，AR还能这样玩

苹果的VisionPro开售不久，就已经狂卖20万台。有人说它是“有史以来最好的消费类头显”，但有人也对其不稳定的表现、不够自然的数字化身、过重的分量等颇有微词。无论怎样，苹果将诸多想法融合在一起打造成的这台“电脑化”的头显产品，再一次将VR、AR相关的产品带回了大众的视野。AR在最初的几年，凭借视频游戏等迅速赢得了关注。今天我们就来聊聊AR领域的发展趋势，以及如何与企业业务协同发展。AI的发展一直与AR紧密相连。AI模型在人脸扫描、地图扫描等任务中效率更高，部分AI工具已经可以用来创建和操作3D对象。今天，AR不仅只利用AI来分析传感器数据——AI开始被用来实现一些更重要的任务，以补充和增强

c++ - FFMpeg vs. OpenCV 格式转换/简单转换

我必须创建一个可以实时处理图像的系统。我已经用C++实现了一个像素格式转换系统，它也可以进行一些简单的转换(目前:旋转和镜像)。系统的输入/输出格式为以下格式的帧:RGB(24,32)YUYV420,YUYV422JPG原始灰度例如，一个操作可以是:YUYV422->旋转90->水平翻转->RGB24灰度->旋转270->垂直翻转->YUYV420该系统的目标是为旋转/镜像和像素格式转换提供最佳性能。我当前的实现依赖于OpenCV，但在处理超过2k分辨率的数据时我遇到了性能问题。当前的实现使用cv::Mat和cv::transpose/cv::flip/cv::cvtColor，我优化

c++ - OpenCV 3.0 无法加载神经网络

我需要在我的OpenCV(3.0版)项目中使用神经网络。我已经创建并训练了神经网络并且它可以工作，但是如果我想从YML文件加载神经网络，它不会预测。这是我创建、训练和保存我的神经网络的代码:FileStoragefs("nn.yml",FileStorage::WRITE);intinput_neurons=7;inthidden_neurons=100;intoutput_neurons=5;Ptrtrain_data=TrainData::loadFromCSV("data.csv",10,7,12);Ptrneural_network=ANN_MLP::create();neur

51-17 视频理解串讲— MViT，Multiscale Vision Transformer 论文精读

继TimeSformer模型之后，咱们再介绍两篇来自FacebookAI的论文，即MultiscaleVisionTransformers以及改进版MViTv2:ImprovedMultiscaleVisionTransformersforClassificationandDetection。本文由深圳季连科技有限公司AIgraphX自动驾驶大模型团队编辑。如有错误，欢迎在评论区指正。由于本司大模型组最近组织阅读的论文较多，为理清相互之间的脉络，画草图如下MViT，MultiscaleVisionTransformersMViT就是Transformer和多尺度分层建模相融合的产物。Abstr

【原文链接】Tri-Perspective View for Vision-Based 3D Semantic Occupancy Prediction

原文链接：https://openaccess.thecvf.com/content/CVPR2023/papers/Huang_Tri-Perspective_View_for_Vision-Based_3D_Semantic_Occupancy_Prediction_CVPR_2023_paper.pdf1.引言体素表达需要较大的计算量和特别的技巧（如稀疏卷积），BEV表达难以使用平面特征编码所有3D结构。本文提出三视图（TPV）表达3D场景。为得到空间中一个点的特征，首先将其投影到三视图平面上，使用双线性插值获取各投影点的特征。然后对3个投影点特征进行求和，得到3D点的综合特征。这样，可

Midjourney硬件项目曝光！苹果Vision Pro工程师任主管，曾在马斯克脑机接口公司工作

AI绘画王者Midjourney，开始进军硬件领域！它家已经从苹果挖来VisionPro工程师担任主管，官方秘而不宣，但消息不胫而走。消息传出，网友炸开了锅。永远在吃瓜一线的英伟达科学家JimFan看到这个消息后，兴奋之情都要溢出屏幕了。他表示，数据驱动的模拟是NVIDIA的热门话题，也是他个人非常重视的方向。网友们也开始了激情讨论：What，要做硬件？！这家公司也太野心勃勃了吧！有人很兴奋能看到这一幕，认为大伙儿终于开始往硬件方面倾注心力了，赞一个！挖来VisionPro工程师担任硬件主管“Midjourney要搞硬件”这件事，半个多月前在推特上已经出现了一些小道消息。但消息大面积传开，还是

【论文笔记】Forging Vision Foundation Models for Autonomous Driving: Challenges, Methodologies, and Opport

【论文笔记】ForgingVisionFoundationModelsforAutonomousDriving:Challenges,Methodologies,andOpportunities原文链接：https://arxiv.org/pdf/2401.08045.pdf1.引言传统的自动驾驶（AD）感知系统使用模块化结构和精心设计的算法处理专门的任务，但这些被划分的组件优先考虑单个任务的性能，而牺牲了更广泛的上下文理解和数据关系。大型基石模型通常在大量而丰富的数据集上训练，也会使用自监督技术。一旦训练完成，可以通过微调来处理各类特定任务。目前的大参数模型可以进行少样本学习，从而可以处理分

Apple Vision Pro：新的隐私噩梦？

长期以来，苹果被誉为最注重隐私的科技公司之一，但如今，凭借售价3499美元的VisionPro，苹果可能已经打造出了一款终极监控机器。作为苹果首款头戴式“空间计算”显示设备，号称将打造数字世界与物理世界交汇的新空间，不仅将提供大量3D电影、Disney+和AmazonPrimeVideo等流媒体服务，同时也具备先进的空间音频系统，用户无论是在工作中、在家里、在床上还是在户外都可以自由使用，而这一切都基于空间计算。VisionPro有两个深度传感器、12个摄像头和6个麦克风，这些设备将不断地扫描和跟踪你或你周围的人所做的每一个动作。试想一下，这是否会存在用户眼球每一次转动所产生的数据可能都会被出

Vision Pro开卖炸出各种显眼包！开车/健身/过马路操作秀翻天，AI大牛Karpathy发千字亲测体验

全球第一台VisionPro被捧出店门的那一刻，整个人群沸腾了。历史会记住这一刻。苹果VisionPro的诞生，注定改变全人类，改变全世界。2月2日早上9点，库克亲临现场，推开纽约苹果门店的大门。国内的网友，开始打飞的去大洋彼岸抢VisionPro了。而现在，第一批拿到VisionPro的用户，已经开始各种整活了！显眼包们戴着VisionPro过马路、开车看看这位来自未来的人，正戴着苹果头显过马路，不仅随时观测左右两边路况，双手还在空中各种比划操作。小哥倒是一本正经，但这波操作着实带着莫名的喜感。还有这个逛商场版的，看着同样很滑稽。戴着VisionPro在纽约这人车环境复杂的街道过马路，必须要

哪有人逛街不戴Vision Pro的？？？

头上长VisionPro出现人传人现象，这是伦敦街头上演的最新一幕：秉承着“既然要刺激，那就贯彻到底”的原则，这位小哥一身休闲西装，头戴VisionPro，遛着自家机器小狗，成为最亮眼的显眼包。面前有个小台阶时，小哥还朝机器狗伸了伸手，仿佛在对自己（没毛的）毛孩子说，小心哦～充满未来感的赛博遛狗画面，给了大伙儿更多灵感——连表情包都该及时加上VisionPro的元素，更新换代了。比如这张经典“男友回头”，当他戴上VisionPro看不存在的美女时，旁边女士的表情都更耐人寻味了一点。出街最靓单品，只有更离谱最出名的玩家应该是这位开特斯拉的哥子，上演了一出“戴着VisionPro出街，启动FSDB