jjzjj

分享本周所学——概率论:贝叶斯更新详解

RFdragon 2023-09-01 原文

        大家好,欢迎来到《分享本周所学》第六期。本人是一名人工智能初学者,因为马上要上大学了嘛,就想着提前稍微预习一下大一课程。我预习的这门课叫Mathematical Techniques for Computer Science,是一门针对计算机的数学课,所以这里面有很多内容会面向数学在计算机当中的实际应用。最近一周我学了一下基础的概率论,然后发现这里面有贝叶斯更新这个内容。我一想,这不是机器学习的内容吗,就觉得好像挺有意思还有点用,所以想把学到的东西分享给大家。

        这篇文章主要参考了曼彻斯特大学一年级课程Mathematical Techniques for Computer Science的教材。教材是公开的,链接如下:

目录

一、学贝叶斯更新需要知道点啥啊

1. 条件概率

2. 全概率公式

二、啥是贝叶斯更新啊

1. 先验概率

2. 似然

3. 证据因子

4. 后验概率

5. 复习一遍贝叶斯更新流程


        9月20日更新:很抱歉,教材现在似乎只对在读学生公开了,根据学校的教学内容版权要求,我不得不移除文章内的所有教材链接,请大家谅解。


上期文章链接:https://blog.csdn.net/weixin_48978134/article/details/125770821https://blog.csdn.net/weixin_48978134/article/details/125770821

本期封面:


 一、学贝叶斯更新需要知道点啥啊

        贝叶斯更新是需要一点点前置知识的,但仅仅是一点点。你只需要知道什么是条件概率和全概率公式就可以了。如果你已经知道了的话,可以直接看第二章。

1. 条件概率

        顾名思义,条件概率就是满足一些条件的情况下,某个事件发生的概率。什么意思呢?举个非常常见的例子。有一天,我闲的没事,决定让你猜我的电脑多少钱,然后给了你两个选项:5000块左右和10000块左右。

        我们假设世界上所有的电脑都只有5000块左右和10000块左右这两个价位,有70%的人用5000块左右的电脑,剩下30%的人用10000块左右的电脑。我们可以根据这个数据来画一个非常简陋的表格:

        我们用P(A)来表示一个事件A发生的概率。根据这个表格,你可以轻易的推断出P(我的电脑5000块左右)>P(我的电脑10000块左右),所以,你理所当然会猜我的电脑5000块左右。

        但是,这时我们给表格引入一个新的维度:

        此时,你得知我开的车在一百万以上,那么也许你就要改变自己的猜测了,因为你要比较的两个概率从P(我的电脑5000块左右)和P(我的电脑10000块左右)变成了P(我的电脑5000块左右|我开一百万以上的车)和P(我的电脑10000块左右|我开一百万以上的车)。P(A|B)表示A在B发生的条件下发生的概率,我们把这种概率称作条件概率。

        那怎么计算条件概率呢?其实就是用一个非常简单公式:

        这里表示A和B同时发生的概率,称作A和B的联合概率。

        这个公式其实很好理解,A在B发生的条件下发生的概率,其实就是A和B同时发生的概率在B发生的概率里所占的比例。根据上面的表格,我们知道P(我的电脑5000块左右我开一百万以上的车)是0.002,而P(我的电脑10000块左右|我开一百万以上的车)是0.008。

        根据这个公式,我们可以计算出了P(我的电脑5000块左右|我开一百万以上的车)是0.2,而P(我的电脑10000块左右|我开一百万以上的车)是0.8。因此,显然猜我的电脑在10000左右是更好的选择。

        然而现实中我既没有10000左右的电脑也没有一百万的车。唉……

2. 全概率公式

        什么是全概率公式呢?我们再看一个例子。

        你现在想计算我出门带伞的概率。不管是晴天、阴天还是雨天,我都有可能出门带伞。但是显然啊,在不同的天气下我出门带伞的概率是不同的。假设我晴天有1%的概率带伞、阴天有30%的概率带伞、雨天有90%的概率带伞。另外,你还知道,我住的城市有50%的概率是晴天,有30%的概率是阴天,有20%的概率是雨天。那么,综合以上这些信息,我在任意一天出门带伞的概率是多少呢?

        这就要用到全概率公式了:

        如果写得简洁一点就是:

        这里面,A是我们要计算概率的事件,,,,…,是两两互斥的事件,并且它们的概率之和为1。为了以防有人不知道,这里提一句,如果两个事件是互斥事件,说明它们不可能同时发生。

        这个公式也很好理解。我们要计算一个事件发生的概率,可以把这个事件拆分成不同的情况,每种情况下A发生的概率就是公式中的,然后再乘上发生这种情况的可能性,也就是

        我们这里要计算的是P(我出门带伞),那么我们可以把它拆分成P(我出门带伞|今天是晴天)×P(今天是晴天)+P(我出门带伞|今天是阴天)×P(今天是阴天)+P(我出门带伞|今天是雨天)×P(今天是雨天)。晴天、阴天、雨天显然是互斥事件,而且它们的概率之和为1,因此我们可以使用全概率公式。我们把上面的条件带入公式,就可以得到我任何一天出门带伞的概率是0.275。

二、啥是贝叶斯更新啊

        要想搞清楚贝叶斯更新,我们要先搞清楚四个概念:先验概率、后验概率、证据和似然。这四个概念听起来很高级,但其实很好理解。为了方便理解,我们设想这样一个场景。你正在玩一个叫作《炉石传说》的卡牌游戏,这个卡牌游戏允许你选择一些卡牌来组成一个套牌,然后再用这个套牌去与其他玩家对战。对战过程中,双方并不能知道对方的套牌,但是可以根据对方使用的卡牌来进行猜测。作为一个新手,你总是被一些自己预料不到的牌扭转局势,因此,你认为在对战中猜测对手的套牌是很有必要的。在一场对战中,你决定要用贝叶斯更新来猜测对方的套牌。

1. 先验概率

        在开始测之前,你觉得自己应该先预估一下对方有可能使用什么套牌。这个卡牌游戏有10个职业,每个职业能够使用的套牌都不同。在对战开始前,你可以看到对方的职业,所以你也可以根据对方的职业来预估对方的套牌。假设你看到对方是德鲁伊,德鲁伊常见的套牌有:亡语德鲁伊(亡语德)、快攻德鲁伊(快攻德)、德纳修斯大帝德鲁伊(大帝德)和超凡之盟德鲁伊(超凡德)(数据来源于2022年9月标准天梯)。但是,你并不能确定对方到底是这四个套牌中的哪一个。因此,你将这四个套牌的预估概率全部设为0.25。

        这样以来,我们就得到了一个概率表。这个概率表就是先验概率,表示进行贝叶斯更新之前预估的概率。

2. 似然

        第一回合,你的对手使用了一张卡牌,是暗礁德鲁伊!可恶,竟然在第一回合就使用了如此强大的卡牌,看来对手的实力不容小觑。你并没有被这张暗礁德鲁伊打得不知所措,而是冷静下来,开始分析对手的套牌。你将“对手第一回合使用了暗礁德鲁伊”这个事件记为事件

        快攻德、大帝德和超凡德都有可能携带暗礁德鲁伊,但这三个套牌第一回合打出暗礁德鲁伊的概率并不是均等的。而亡语德则不太可能携带暗礁德鲁伊。我们可以根据下面的表格来描述不同套牌第一回合打出暗礁德鲁伊的概率。 

        这个表格就是我们的似然。那具体什么是似然呢?可以说似然是一个和概率相反的概念。概率是根据已知的条件计算某个事件发生的可能性,而似然则是通过发生的事件去反推概率。比如,在我们的例子中,发生的事件是“对手第一回合使用暗礁德鲁伊”,而大帝德第一回合使用暗礁德鲁伊的概率是最大的,我们就可以反推出对方的套牌有较大概率是大帝德。

        有的朋友可能要问了,这个似然是怎么算出来的呢?嗯,这个是我根据这四个德鲁伊套牌携带暗礁德鲁伊的情况和一般情况下的出牌思路估出来的,不一定准。如果你认为我给出的似然有问题,以你为准。

3. 证据因子

        得到先验概率和似然之后,我们还差一步就可以进行贝叶斯更新了。我们现在需要计算证据因子。

        什么是证据因子呢?我们在根据观察到的某个事件去估计其他事件发生的概率时,我们观察到的事件发生的概率就是证据因子。比如在这个例子中,我们根据事件估计“对方的套牌是亡语德/快攻德/大帝德/超凡德”的概率,那么P()就是证据因子。

        那怎么计算对方第一回合使用暗礁德鲁伊的概率呢?这里可以使用全概率公式,把P()转化成P(|亡语德)×P(亡语德)+P(|快攻德)×P(快攻德)+P(|大帝德)×P(大帝德)+P(|超凡德)×P(超凡德)。我们可以计算出结果为0.13。

4. 后验概率

        现在,我们已经有了先验概率、似然和证据因子,可以计算用贝叶斯更新来计算后验概率了。我们先来看一下贝叶斯更新的公式:

        这里面,Φ是我们要使用贝叶斯更新计算概率的事件,也就是“对方的套牌是亡语德/快攻德/大帝德/超凡德”,而a是我们观察到的事件,也就是“第一回合使用暗礁德鲁伊”。相信大家可以看出来,等式右侧的P(a|Φ)是似然,P(Φ)是先验概率,而P(a)是证据因子。等式左侧的P(Φ|a)就是后验概率,也是我们要计算的概率。

        我们以亡语德为例。对方套牌是亡语德的后验概率P(亡语德|)=P(|亡语德)×P(亡语德)÷P()=0.019。我们也可以用同样的方法算出P(快攻德|)=0.138、P(大帝德|)=0.549、P(超凡德|)=0.294。我们可以验算一下,0.019+0.138+0.549+0.294刚好等于1。

        这样,根据对手第一回合使用了暗礁德鲁伊这一事件,我们就可以推出对手的套牌为亡语德、快攻德、大帝德和超凡德的概率分别为:

        这就是一次完整的贝叶斯更新的流程:估计先验概率、计算似然和证据因子、利用贝叶斯更新公式计算后验概率。

        虽然我们现在还没有足够的证据来证明对手使用的具体是什么套牌,但已经基本能够排除对方不是亡语德了。为了进一步确定对手使用的套牌,我们还需要继续观察对手出的牌,并使用贝叶斯更新计算新的概率。注意,我们前一次贝叶斯更新中算出的后验概率,会在下一次贝叶斯更新中作为先验概率。

5. 复习一遍贝叶斯更新流程

        第二回合,你的对手使用了应急木工!不妙,又是一张如此强力的卡牌,仅仅花费两点法力水晶,就获得了两张额外的卡牌,还在战场上召唤了一个足足有两点攻击力的可怕怪物!

        沉着冷静的你将对手第二回合使用应急木工记为事件。你脑中飞快地将似然计算了出来:

        随后,将之前计算出的后验概率作为新的一次贝叶斯更新的先验概率,又计算出了证据因子:P()=P(|亡语德)×P(亡语德)+P(|快攻德)×P(快攻德)+P(|大帝德)×P(大帝德)+P(|超凡德)×P(超凡德)=0.3。

        最后,根据贝叶斯更新公式,你计算出了新的后验概率:

        你可以认为对手的套牌有很大概率是大帝德了(唉,怎么又是大帝德啊)。

有关分享本周所学——概率论:贝叶斯更新详解的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby-on-rails - 使用 rails 4 设计而不更新用户 - 2

    我将应用程序升级到Rails4,一切正常。我可以登录并转到我的编辑页面。也更新了观点。使用标准View时,用户会更新。但是当我添加例如字段:name时,它​​不会在表单中更新。使用devise3.1.1和gem'protected_attributes'我需要在设备或数据库上运行某种更新命令吗?我也搜索过这个地方,找到了许多不同的解决方案,但没有一个会更新我的用户字段。我没有添加任何自定义字段。 最佳答案 如果您想允许额外的参数,您可以在ApplicationController中使用beforefilter,因为Rails4将参数

  3. objective-c - 在设置 Cocoa Pods 和安装 Ruby 更新时出错 - 2

    我正在尝试为我的iOS应用程序设置cocoapods但是当我执行命令时:sudogemupdate--system我收到错误消息:当前已安装最新版本。中止。当我进入cocoapods的下一步时:sudogeminstallcocoapods我在MacOS10.8.5上遇到错误:ERROR:Errorinstallingcocoapods:cocoapods-trunkrequiresRubyversion>=2.0.0.我在MacOS10.9.4上尝试了同样的操作,但出现错误:ERROR:Couldnotfindavalidgem'cocoapods'(>=0),hereiswhy:U

  4. ruby-on-rails - Rails Associations 的更新方法是什么? - 2

    这太简单了,太荒谬了,我在任何地方都找不到关于它的任何信息,包括API文档和Rails源代码:我有一个:belongs_to关联,我开始理解当您没有关联时您在Controller中调用的正常模型方法与您有关联时调用的方法略有不同。例如,我的关联在创建Controller操作时运行良好:@user=current_user@building=Building.new(params[:building])respond_todo|format|if@user.buildings.create(params[:building])#etcetera但我找不到关于更新如何工作的文档:@user

  5. ruby-on-rails - OSX Yosemite 更新破坏了 pow.cx - 2

    升级到OSXYosemite后,我现有的pow.cx安装不起作用。升级到最新的pow.cx无效。通过事件监视器重新启动它也没有成功。 最佳答案 卸载(!)并重新安装解决了这个问题。curlget.pow.cx/uninstall.sh|shcurlget.pow.cx|sh 关于ruby-on-rails-OSXYosemite更新破坏了pow.cx,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/q

  6. ruby - 将 Gitlab 从 9.3.7 更新到 9.3.8 安装 re2 时出错 - 2

    我们在Ubuntu14.04和Gitlab9.3.7上运行,运行良好。我们正在尝试更新到Gitlabv9.3.8的最新安全补丁,但它给我们这个错误:Gem::Ext::BuildError:ERROR:Failedtobuildgemnativeextension.currentdirectory:/home/git/gitlab/vendor/bundle/ruby/2.3.0/gems/re2-1.0.0/ext/re2/usr/local/bin/ruby-r./siteconf20170720-19622-15i0edf.rbextconf.rbcheckingformain(

  7. ruby-on-rails - Rails 更新属性 - 2

    我遇到了以下问题。我有一个名为user的模型,它有一个名为activated的列。我试图通过激活的方法更新该值?但它给我错误:验证失败:密码不能为空,密码太短(最少6个字符)这对我来说没有意义,因为我没有接触密码字段!我只想更新激活的列。我把我认为相关的代码放在这里,但如果你认为你需要更多,请问:)非常感谢您!型号:attr_accessor:passwordattr_accessible:name,:email,:password,:password_confirmation,:activatedhas_many:sucu_votesemail_regex=/\A[\w+\-.]+@

  8. ruby-on-rails - 如果存在则更新,否则什么也不做? - 2

    当且仅当模型存在时,我才尝试更新模型的值。如果没有,我什么都不做。搜索似乎只返回更新或创建问题/答案,但我不想创建。我知道我可以用一个简单的方法来做到这一点:found=Model.find_by_id(id)iffoundupdatestuffend但是,我觉得有一种方法可以在一次调用中完成此操作,而无需分配任何临时本地值或执行if。如果记录不存在,我该如何编写一个Rails调用来更新记录而不出现嘈杂错误?最新的Rails3.x 最佳答案 您可以使用try在对find_by_id或where的结果调用update_attribut

  9. ruby-on-rails - 如何在记录更新期间从验证中排除密码字段? ( rails 3.0.4, ruby 1.9.2) - 2

    我有一个允许更新用户记录的表单。它包含:password和:password_confirmation字段,但我不希望在数据库中已存储加密密码时对它们运行验证。View文件中的字段:'ConfirmPassword'%>在互联网上搜索时,我发现了这段代码,我认为它是针对以前版本的Ruby/Rails的。(我会把它放在我的用户模型中。)validates_presence_of:password,:on=>create由于我的用户模型中密码验证的语法不同(如下),我对我需要的语法感到困惑。validates:password,:presence=>true,:confirmation=>

  10. ruby - 如何更新到 Ruby 1.8.7 - 2

    我是Ruby新手,请多多包涵。我一直在尝试将我的Ruby更新到1.8.7,但在我的MacOSX(10.5.7)上遇到了很多问题。说真的,你如何更新到Ruby1.8.7?谢谢。 最佳答案 最简单的答案是“不要”。Ruby1.8.7是在1.8和1.9之间创建桥接版本的尝试,社区一致认为这没有必要,因此在1.9最终确定之前几乎没有人支持它。一般建议要么坚持使用1.8(该版本随OSX10.5一起提供),要么使用Ruby1.9。MacPorts有适用于Ruby1.8.7和Ruby1.9的软件包,因此这可能是获得更新版本的Ruby的最简单方法,

随机推荐