jjzjj

Q-Learning

全部标签

Multi-Modal Attention Network Learning for Semantic Source Code Retrieval 解读

Multi-ModalAttentionNetworkLearningfor SemanticSourceCodeRetrieva Multi-ModalAttentionNetworkLearningfor SemanticSourceCodeRetrieval,题目意思是用于语义源代码检索的多模态注意网络学习,2019年发表于ASE的##研究什么东西Background:研究代码检索技术,对于一个代码存储库进行方法级别的搜索,给定一个描述代码片段功能的短文,从代码存储库中检索特定的代码片段。论文挑战和贡献前人的做法Gu等人[6]是第一个将深度学习网络应用于代码检索任务的人,它在中间语义空间

论文笔记 | 谷歌 Soft Prompt Learning ,Prefix-Tuning的 -> soft promt -> p tuning v2

论文笔记|谷歌SoftPromptLearningptuning->Prefix-Tuning ->softpromt->ptuningv2"ThePowerofScaleforParameter-EfficientPromptTuning"EMNLP2021GoogleBrain人能理解的不一定是模型需要的,所以不如让模型自己训练所需的prompt。ExternalLinks:论文作者:BrianLester, RamiAl-RfouGoogleBlog:"GuidingFrozenLanguageModelswithLearnedSoftPrompts"GithubRepoJeffDean

论文阅读 (79):TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image

文章目录1概述1.1题目1.2动机1.3代码1.4附件1.5引用2方法2.1相关多示例2.2Transformer应用到相关MIL2.3TransMIL用于弱监督WSI分类2.3.1使用TPT对长实例序列建模2.3.2PPEG位置编码3实验及结果3.1数据集3.2实验设置和度量指标3.3实现细节3.4基准线3.5结果1概述1.1题目2021:用于WSI分类的Transformer相关多示例(TransMIL:Transformerbasedcorrelatedmultipleinstancelearningforwholeslideimageclassification)1.2动机WSI–MI

【论文阅读笔记】Local Model Poisoning Attacks to Byzantine-Robust Federated Learning

个人阅读笔记,如有错误欢迎指出!会议:Usenix2020 [1911.11815]LocalModelPoisoningAttackstoByzantine-RobustFederatedLearning(arxiv.org)问题:        模型攻击对拜占庭鲁棒性联邦学习的攻击效果尚未清楚创新点:        1、基于不同防御方法,设计了具有针对性的模型攻击方式        2、概括了基于错误率以及基于损失函数的防御方法,测试了两种防御方法的效果。方法:        攻击场景:trainingphase中对基于本地训练数据的模型在训练过程中进行攻击        攻击者的要求:控

机器学习算法(三十):强化学习(Reinforcement Learning)

目录1简介 1.1什么是强化学习1.2强化学习的主要特点1.3强化学习的组成部分2 强化学习训练过程 3 强化学习算法归类3.1ValueBased3.2 PolicyBased3.3Actor-Critic3.4其他分类4 EE(Explore&Exploit)探索与利用5强化学习实际开展中的难点6强化学习的实际应用6.1自动驾驶6.2游戏6.3推荐系统7Q-learning 8策略梯度1简介 1.1什么是强化学习    强化学习是一种机器学习的学习方式(四种主要的机器学习方式解释见上图)。      上图没有提到深度学习,是因为从学习方式层面上来说,深度学习属于上述四种方式的子集。而强化学

机器学习算法(三十):强化学习(Reinforcement Learning)

目录1简介 1.1什么是强化学习1.2强化学习的主要特点1.3强化学习的组成部分2 强化学习训练过程 3 强化学习算法归类3.1ValueBased3.2 PolicyBased3.3Actor-Critic3.4其他分类4 EE(Explore&Exploit)探索与利用5强化学习实际开展中的难点6强化学习的实际应用6.1自动驾驶6.2游戏6.3推荐系统7Q-learning 8策略梯度1简介 1.1什么是强化学习    强化学习是一种机器学习的学习方式(四种主要的机器学习方式解释见上图)。      上图没有提到深度学习,是因为从学习方式层面上来说,深度学习属于上述四种方式的子集。而强化学

基于深度学习的目标检测的介绍(Introduction to object detection with deep learning)

物体检测的应用已经深入到我们的日常生活中,包括安全、自动车辆系统等。对象检测模型输入视觉效果(图像或视频),并在每个相应对象周围输出带有标记的版本。这说起来容易做起来难,因为目标检测模型需要考虑复杂的算法和数据集,这些算法和数据集在我们说话的时候就已经被完善和开发了。以下是我们今天要介绍的内容,为您全面介绍目标检测:Introductiontoobjectdetectionwithdeeplearning1、目标检测基础什么是目标检测对象检测与其他任务2、深度学习vs机器学习什么是深度学习的目标检测?3、方法与算法R-CNN,FastR-CNN,FasterR-CNNYOLO4、用例和应用程序

基于深度学习的手写数字识别项目GUI(Deep Learning Project – Handwritten Digit Recognition using Python)

一步一步教你建立手写数字识别项目,需要源文件的请可直接跳转下边的链接:AllprojectDeepLearningProject–HandwrittenDigitRecognitionusingPython本文摘要运行项目的需求MNIST数据集建立基于深度学习的手写数字识别项目1、导入库并加载数据集2、处理数据集3、建立模型4、训练模型5、评估模型6、建立GUI界面预测数字截屏结果总结本文摘要在本文中,我们将使用MNIST数据集实现一个手写数字识别应用程序。我们将使用一种特殊类型的深度神经网络,即卷积神经网络。最后,我们将构建一个GUI,您可以在其中绘制数字并立即识别它。实现效果:运行项目的需

论文学习--Learning High-Speed Flight in the Wild

文章目录Git子文链接代码运行编译环境编译步骤【可选】[1]下载源码[2]先安装Open3D[3]修改Open3D的相关路径[4]开始编译[5]报错2[6]报错3[7]运行中报错[8]配置学习环境[9]下载flighemare渲染环境运行代码梳理test仿真数据采集轨迹测试代码逻辑论文阅读摘要方法PrivilegedExpertSendorimotorAgentActions方法详述TheprivilegedexpertThestudentpolicyTrainingenvironmentGitGit:https://github.com/uzh-rpg/agile_autonomy论文:Le

跨模态检索论文阅读:Dissecting Deep Metric Learning Losses for Image-Text Retrieval(GOAL)

DissectingDeepMetricLearningLossesforImage-TextRetrieval剖析图像文本检索中的深度度量学习损失2022.10视觉语义嵌入(VSE)是图像-文本检索中的一种流行的应用方法,它通过学习图像和语言模式之间的联合嵌入空间来保留语义的相似性。三元组损失与硬负值的挖掘已经成为大多数VSE方法的事实目标。图像领域深度度量学习(DML)产生了新的损失函数,超越了三元损失。尽管在设计基于梯度运动的损失方面做了一些尝试,但大多数DML损失是在嵌入空间中根据经验定义的。本文提出了一个新的基于梯度的目标分析框架,即GOAL,以系统地分析现有DML函数中梯度的组合和