文章目录前言Pensieve原理*Pensieve重训练参考Oboe[SIGCOMM'18]Comyco[MM'19]Fugu[NSDI'20]A3C熵权重衰减思路实现前言Pensieve是DASH点播视频中最经典的ABR算法之一,也是机器学习类(Learning-based)ABR算法的代表性工作。Pensieve基于深度强化学习(DRL)方法A3C(AsynchronousAdvantageActor-Critic)设计,同时使用视频块的吞吐量历史采样、当前缓冲区等信息作为输入特征进行决策。与先前的启发式或基于领域知识的方法(如FESTIVE、BBA、BOLA、MPC等)不同,Pensie