jjzjj

supervised-learning

全部标签

《SAIS Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction》论文阅读笔记

代码 原文地址 预备知识:1.什么是标记索引(tokenindices)?标记索引是一种用于表示文本中的单词或符号的数字编码。它们可以帮助计算机理解和处理自然语言。例如,假如有一个字典{"我":1,"是":2,"Bing":3,".":4},那么文本"我是Bing."的标记索引就是[1,2,3,4]。不同的模型或任务可能使用不同的字典或编码方式,因此标记索引也可能有所不同。 2.什么是交替段落标记索引(alternatingsegmenttokenindices)?交替段落标记索引是一种用于区分文档中不同句子的方法。它可以帮助PLM更好地理解文档的结构和语义。具体来说,就是在每个句子的开头和结

【论文阅读笔记】Local and Central Differential Privacy for Robustness and Privacy in Federated Learning

个人阅读笔记,如有错误欢迎指出!会议:NDSS2022        [2009.03561]LocalandCentralDifferentialPrivacyforRobustnessandPrivacyinFederatedLearning(arxiv.org)问题:        尽管联邦学习能在一定程度上保护数据隐私,但也存在隐私和鲁棒性漏洞主要贡献:        首次发现LDP和CDP都可以抵御后门攻击        发现仅在FL的非攻击者上应用LDP可以提高后门攻击的准确性        LDP和CDP可以防止(白盒)成员推断        LDP与CDP均不能防御属性推断攻击

论文阅读:Whole slide images classification model based on self-learning sampling

Wholeslideimagesclassificationmodelbasedonself-learningsampling论文介绍摘要引言相关工作方法问题定义模型结构特征提取自学习采样模块基于Transformer的特征编码损失函数实验分析和结论总结论文介绍这是一篇发表在BSPC(BiomedicalSignalProcessingandControl)上的关于WSI分类的文章,作者是上海科技大学的学生/老师。论文链接为:https://www.sciencedirect.com/science/article/pii/S1746809423012594代码:暂未开源摘要深度学习与计算病理

【论文笔记】Learned Fusion: 3D Object Detection using Calibration-Free Transformer Feature Fusion

原文链接:https://arxiv.org/abs/2312.090821.引言目前的3D目标检测一来传感器的校准信息。这种情况下,校准信息需要及其精确,但在产品尺度上,获取高质量校准信息是很困难的(需要逐传感器校准,且运行过程中可能会变化)。本文基于Transformer,提出无需校准信息的传感器融合方法。3.方法从基于Transformer的方法中直接移除校准信息会导致训练困难。3.1TransFuseDet本文的模型包含融合编码器、上采样和任务头。使用两个ResNet分别编码激光雷达和相机的特征,然后在不同特征尺度上使用Transformer融合,类似TransFuser。但不同的是,

【论文阅读】Self-Paced Curriculum Learning

论文下载代码SupplementaryMaterialsbib:@INPROCEEDINGS{, title ={Self-PacedCurriculumLearning}, author ={LuJiangandDeyuMengandQianZhaoandShiguangShanandAlexanderHauptmann}, booktitle ={AAAI}, year ={2015}, pages={2694--2700}}1.摘要Curriculumlearning(CL)orself-pacedlearning(SPL)representsarecentlyproposedlea

论文笔记|Not All Tasks Are Equally Difficult MultiTask Reinforcement Learning with Dynamic Depth Routing

AAAI24摘要多任务强化学习致力于用单一策略完成一组不同的任务。为了通过跨多个任务共享参数来提高数据效率,常见的做法是将网络分割成不同的模块,并训练路由网络将这些模块重新组合成特定于任务的策略。然而,现有的路由方法对所有任务采用固定数量的模块,忽略了具有不同难度的任务通常需要不同数量的知识。这项工作提出了一种动态深度路由(D2R)框架,该框架学习策略性地跳过某些中间模块,从而为每个任务灵活选择不同数量的模块。在此框架下,我们进一步引入了ResRouting方法来解决离策略训练期间行为和目标策略之间不同的路由路径问题。此外,我们设计了一种自动路由平衡机制,以鼓励对未掌握任务的持续路由探索,而不

强化学习应用(五):基于Q-learning的无人机物流路径规划研究(提供Python代码)

一、Q-learning简介Q-learning是一种强化学习算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。Q-learning算法的核心思想是通过不断更新一个称为Q值的表格来学习最优策略。Q值表示在给定状态下采取某个动作所能获得的预期累积奖励。算法的基本步骤如下:1.初始化Q值表格,将所有Q值初始化为0。2.在每个时间步骤t,智能体观察当前状态st,并根据当前Q值表格选择一个动作at。选择动作的方法可以是ε-greedy策略,即以ε的概率随机选择一个动作,以1-ε的概率选择当前Q值最大的动作。3.执行动作at,观察环

强化学习应用(八):基于Q-learning的无人机物流路径规划研究(提供Python代码)

一、Q-learning简介Q-learning是一种强化学习算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。Q-learning算法的核心思想是通过不断更新一个称为Q值的表格来学习最优策略。Q值表示在给定状态下采取某个动作所能获得的预期累积奖励。算法的基本步骤如下:1.初始化Q值表格,将所有Q值初始化为0。2.在每个时间步骤t,智能体观察当前状态st,并根据当前Q值表格选择一个动作at。选择动作的方法可以是ε-greedy策略,即以ε的概率随机选择一个动作,以1-ε的概率选择当前Q值最大的动作。3.执行动作at,观察环

[配环境]GET3D: A Generative Model of High Quality 3D Textured Shapes Learned from Images (docker方法)

代码地址:https://github.com/nv-tlabs/GET3D本文使用了官方提供的docker镜像。目录配置docker新建docker容器安装并配置ssh(可选)(可选)配置conda软链接安装tmux(可选)配置python默认使用上面这个python3安装需要的东西(可选)如果没有pip和conda安装python包运行inference代码结果:用meshlab查看用blender查看training代码运行NinjaisrequiredtoloadC++extensionsinPycharm数据集生成tensorboard报错log结构:个人需要的其他内容配置docke

An End-to-End Learning-Based Metadata Management Approach for Distributed File Systems——论文阅读

TC2022Paper,元数据论文阅读汇总“multiplemetadataserver(MDS)”多个元数据服务器“localitypreservinghashing(LPH)”局部保持哈希“MultipleSubsetSumProblem(MSSP).”多子集和问题“polynomial-timeapproximationscheme(PTAS)”多项式时间近似方法背景分布式元数据的挑战目前的分布式文件系统被设计用于支持PB规模甚至EB规模的数据存储。元数据服务负责管理文件属性信息和全局命名空间树,对系统性能至关重要。元数据是描述文件系统组织和结构的数据,包括文件属性、文件块指针等[1]。