jjzjj

Learning

全部标签

强化学习应用(八):基于Q-learning的无人机物流路径规划研究(提供Python代码)

一、Q-learning简介Q-learning是一种强化学习算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。Q-learning算法的核心思想是通过不断更新一个称为Q值的表格来学习最优策略。Q值表示在给定状态下采取某个动作所能获得的预期累积奖励。算法的基本步骤如下:1.初始化Q值表格,将所有Q值初始化为0。2.在每个时间步骤t,智能体观察当前状态st,并根据当前Q值表格选择一个动作at。选择动作的方法可以是ε-greedy策略,即以ε的概率随机选择一个动作,以1-ε的概率选择当前Q值最大的动作。3.执行动作at,观察环

An End-to-End Learning-Based Metadata Management Approach for Distributed File Systems——论文阅读

TC2022Paper,元数据论文阅读汇总“multiplemetadataserver(MDS)”多个元数据服务器“localitypreservinghashing(LPH)”局部保持哈希“MultipleSubsetSumProblem(MSSP).”多子集和问题“polynomial-timeapproximationscheme(PTAS)”多项式时间近似方法背景分布式元数据的挑战目前的分布式文件系统被设计用于支持PB规模甚至EB规模的数据存储。元数据服务负责管理文件属性信息和全局命名空间树,对系统性能至关重要。元数据是描述文件系统组织和结构的数据,包括文件属性、文件块指针等[1]。

【论文笔记】AFGRL:Augmentation-Free Self-Supervised Learning on Graphs(简要笔记供复习使用)

AFGRL:Augmentation-FreeSelf-SupervisedLearningonGraphs文献地址:Augmentation-FreeSelf-SupervisedLearningonGraphsMotivation图对比的正例对构造对增强方法敏感,由于图包含了语义信息和结构信息,因此在对边进行不同增强方法时,可能会影响其语义对不同数据分布的数据集,模型增强的参数需要分别进行调整简单的将其他节点特征看作负样本等同于忽略了图的结构信息,因此不一定从这种样本偏置中获益Comment对BGRL的工作进行了总结,认为BGRL虽然并没有使用负样本,但是利用了图增强技术,因此可能同样会损

Azure Machine Learning - 聊天机器人构建

目录聊天机器人架构概述消耗成本环境准备打开开发环境部署和运行将聊天应用部署到Azure使用聊天应用从PDF文件获取答案使用聊天应用设置更改答复行为本文介绍如何部署和运行适用于Python的企业聊天应用示例。此示例使用Python、AzureOpenAI服务和AzureAI搜索中的检索扩充生成(RAG)实现聊天应用,以获取虚构公司员工福利的解答。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人聊天机器人架构概述下图显示了聊天应用的简

BtcDet论文详解| Behind the Curtain: Learning Occluded Shapes for 3D Object Detection

简介造成shapemiss主要由三个原因:外部遮挡。前方物体挡住了后面的物体,使得传感器难以感知到后面的物体。信号丢失。由于目标的材质或者传感器的原因,一部分传感器信号丢失,使得传感器难以感知这个区域自身遮挡。物体自身的靠近传感器的部分遮挡住了远离传感器的部分。shapemiss的影响:以前的工作都没有考虑目标形状,只是对box监督从而优化模型参数,PartA2里增加了对部分形状(激光雷达检测到的形状)的监督X,D,Sob,Soc分别代表box中心、boxsize、观察到的目标形状、丢失的目标形状只对box监督的参数优化:对box和部分形状监督的参数优化:完整目标形状:预测感兴趣区域的形状占有

The Intersection of Deep Learning and Natural Language Processing

1.背景介绍自从深度学习技术的蓬勃发展以来,它已经成为了人工智能领域的重要技术之一。深度学习的发展也为自然语言处理(NLP)领域提供了强大的支持。在这篇文章中,我们将探讨深度学习与自然语言处理的相互作用,以及它们在实际应用中的表现。自然语言处理是计算机科学与人工智能的一个分支,研究如何让计算机理解和生成人类语言。自然语言处理的主要任务包括语言模型、情感分析、机器翻译、语义角色标注、命名实体识别等。随着深度学习技术的发展,这些任务的表现得到了显著提升。深度学习是一种人工智能技术,它通过多层次的神经网络来学习数据中的复杂模式。深度学习的主要优势在于其能够自动学习特征,从而降低了人工特征工程的成本。

DUET: Cross-Modal Semantic Grounding for Contrastive Zero-Shot Learning论文阅读

文章目录摘要1.问题的提出引出当前研究的不足与问题属性不平衡问题属性共现问题解决方案2.数据集和模型构建数据集传统的零样本学习范式v.s.DUET学习范式DUET模型总览属性级别对比学习==正负样本解释:==3.结果分析VIT-basedvisiontransformerencoder.消融研究消融研究解释4.结论与启示结论总结启发PLMs的潜在语义知识引入多模态,跨模态整合细粒度角度考虑原文链接:https://ojs.aaai.org/index.php/AAAI/article/view/25114/24886该论文设计了一种新的零样本学习范式,通过迁移语言模型中的先验语义知识,与视觉模

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码 原文地址 预备知识:1.什么是MIL?多示例学习(MIL)是一种机器学习的方法,它的特点是每个训练数据不是一个单独的实例,而是一个包含多个实例的集合(称为包)。每个包有一个标签,但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则,或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法,以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度(span)的命名实体

《RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation Extraction》阅读笔记

代码 原文地址 预备知识:1.什么是元学习(MetaLearning)?元学习或者叫做“学会学习”(Learningtolearn),它是要“学会如何学习”,即利用以往的知识经验来指导新任务的学习,具有学会学习的能力。由于元学习可帮助模型在少量样本下快速学习,从元学习的使用角度看,人们也称之为少次学习(Few-ShotLearning)。 2.什么是基于度量的元学习(Metric-based meta-learning)?基于度量的元学习将相似性学习和元学习相结合,学习训练过的相似任务的经验,从而加快新任务的完成。Guo等人将注意机制与集成学习方法相结合,形成了基于度量的元学习模型。 标记文档

乱七八糟方面的入门视频推荐-对比学习、prompt learning、instruct learing、一些deep learning的学习视频

具体方法1.对比学习2.Promptlearning3.Instructlearning4.其他-深度学习入门学习讲在开头!适用:完全没接触过以下方法的朋友;最近探索研究方向,看的比较杂1,2,3效果:2倍速听完能明白方法4:深度学习入门1.对比学习链接:【2023最好出创新点的研究方向:对比学习,华理博士精讲SimCLR、SimCSE、Multiview、BYOL四大对比学习经典论文,轻松搞定论文创新点!】https://www.bilibili.com/video/BV1WR4y1b76q/p=3&share_source=copy_web&vd_source=2cab9613692c5f