jjzjj

Swift 中的 Actors 使用以如何及防止数据竞争

Swift君 2023-03-28 原文

前言

Swift Actors 是 Swift 5.5 中的新内容,也是 WWDC 2021 上并发重大变化的一部分。在有 actors 之前,数据竞争是一个常见的意外情况。因此,在我们深入研究具有隔离和非隔离访问的行为体之前,最好先了解什么是数据竞争[1],并了解当前你如何解决这些问题[2]。

Swift 中的 Actors 旨在完全解决数据竞争问题,但重要的是要明白,很可能还是会遇到数据竞争。本文将介绍 Actors 是如何工作的,以及你如何在你的项目中使用它们。

什么是 Actors?

Swift 中的 Actor 并不新鲜:它们受到 Actor Model[3] 的启发,该模型将行为视为并发计算的通用基元。然后,SE-0306[4]提案引入了 Actor,并解释了它们解决了哪些问题:数据竞争。

当多个线程在没有同步的情况下访问同一内存,并且至少有一个访问是写的时候,就会发生数据竞争。数据竞争会导致不可预测的行为、内存损坏、不稳定的测试和奇怪的崩溃。你可能会遇到无法解决的崩溃,因为你不知道它们何时发生,如何重现它们,或者如何根据理论来修复它们。

Swift 中的 Actors 可以保护他们的状态免受数据竞争的影响,并且使用它们可以让编译器在编写应用程序时为我们提供有用的反馈。此外,Swift 编译器可以静态地强制执行 Actors 附带的限制,并防止对可变数据的并发访问。

您可以使用 actor 关键字定义一个 Actor,就像您使用类或结构体一样:

actor ChickenFeeder {
let food = "worms"
var numberOfEatingChickens: Int = 0
}
Actor 和其他 Swift 类型一样,它们也可以有初始化器、方法、属性和子标号,同时你也可以用协议和泛型来使用它们。此外,与结构体不同的是:当你定义的属性需要手动定义时,actor 需要自定义初始化器。最后,重要的是要认识到 actor 是引用类型。

Actor 是引用类型,但与类相比仍然有所不同

Actor 是引用类型,简而言之,这意味着副本引用的是同一块数据。因此,修改副本也会修改原始实例,因为它们指向同一个共享实例。你可以在我的文章Swift 中的 Struct 与 class 的区别中了解更多这方面的信息。

然而,与类相比,Actor 有一个重要的区别:他们不支持继承。

Swift中的Actor几乎和类一样,但不支持继承。

Swift 中的 Actor 几乎和类一样,但不支持继承。

不支持继承意味着不需要像便利初始化器和必要初始化器、重写、类成员或 open​ 和 final 语句等功能。

然而,最大的区别是由 Actor 的主要职责决定的,即隔离对数据的访问。​

如何防止数据竞争

Actors 如何通过同步来防止数据竞争。

Actor 通过创建对其隔离数据的同步访问来防止数据竞争。在Actors之前,我们会使用各种锁来创建相同的结果。这种锁的一个例子是并发调度队列与处理写访问的屏障相结合。受我在Concurrent vs. Serial DispatchQueue: Concurrency in Swift explained[5]一文中解释的技术的启发。我将向你展示使用 Actor 的前后对比。

在 Actor 之前,我们会创建一个线程安全的小鸡喂食器,如下所示:

final class ChickenFeederWithQueue {
let food = "worms"

/// 私有支持属性和计算属性的组合允许同步访问。
private var _numberOfEatingChickens: Int = 0
var numberOfEatingChickens: Int {
queue.sync {
_numberOfEatingChickens
}
}

/// 一个并发的队列,允许同时进行多次读取。
private var queue = DispatchQueue(label: "chicken.feeder.queue", attributes: .concurrent)

func chickenStartsEating() {
/// 使用栅栏阻止写入时的读取
queue.sync(flags: .barrier) {
_numberOfEatingChickens += 1
}
}

func chickenStopsEating() {
/// 使用栅栏阻止写入时的读取
queue.sync(flags: .barrier) {
_numberOfEatingChickens -= 1
}
}
}
正如你所看到的,这里有相当多的代码需要维护。在访问非线程安全的数据时,我们必须仔细考虑自己使用队列的问题。需要一个栅栏标志来停止读取并允许写入。再一次,我们需要自己来处理这个问题,因为编译器并不强制执行它。最后,我们在这里使用了一个 DispatchQueue,但是经常有围绕着哪个锁是最好的争论。

为了看清这一点,我们可以使用我们先前定义的 Actor 小鸡喂食器来实现上述例子:

actor ChickenFeeder {
let food = "worms"
var numberOfEatingChickens: Int = 0

func chickenStartsEating() {
numberOfEatingChickens += 1
}

func chickenStopsEating() {
numberOfEatingChickens -= 1
}
}
你会注意到的第一件事是,这个实例更简单,更容易阅读。所有与同步访问有关的逻辑都被隐藏在Swift标准库中的实现细节里。然而,最有趣的部分发生在我们试图使用或读取任何可变属性和方法的时候:

Methods in Actors are isolated for synchronized access.

Actors 中的方法是隔离的,以便同步访问。

在访问可变属性 numberOfEatingChickens 时,也会发生同样的情况:

Mutable properties can only be accessed from within the Actor.

可变的属性只能从 Actor 内部访问。

然而,我们被允许编写以下代码:

let feeder = ChickenFeeder()
print(feeder.food)
我们的喂食器上的 food 属性是不可变的,因此是线程安全的。没有数据竞争的风险,因为在读取过程中,它的值不能从另一个线程中改变。

然而,我们的其他方法和属性会改变一个引用类型的可变状态。为了防止数据竞争,需要同步访问,允许按顺序访问。

使用 async/await 访问数据

使用 async/await 从 Actors 访问数据

在 Swift 中,我们可以通过使用 await 关键字来创建异步访问:

let feeder = ChickenFeeder()
await feeder.chickenStartsEating()
print(await feeder.numberOfEatingChickens) // Prints: 1

防止不必要的暂停

在上面的例子中,我们正在访问我们 Actor 的两个不同部分。首先,我们更新吃食的鸡的数量,然后我们执行另一个异步任务,打印出吃食的鸡的数量。每个 await 都会导致你的代码暂停,以等待访问。在这种情况下,有两个暂停是有意义的,因为两部分其实没有什么共同点。然而,你需要考虑到可能有另一个线程在等待调用 chickenStartsEating,这可能会导致在我们打印出结果的时候有两只吃食的鸡。

为了更好地理解这个概念,让我们来看看这样的情况:你想把操作合并到一个方法中,以防止额外的暂停。例如,设想在我们的 actor 中有一个通知方法,通知观察者有一只新的鸡开始吃东西:

extension ChickenFeeder {
func notifyObservers() {
NotificationCenter.default.post(name: NSNotification.Name("chicken.started.eating"), object: numberOfEatingChickens)
}
}
我们可以通过使用 await 两次来使用此代码:

let feeder = ChickenFeeder()
await feeder.chickenStartsEating()
await feeder.notifyObservers()
然而,这可能会导致两个暂停点,每个 await 都有一个。相反,我们可以通过从 chickenStartsEating 中调用 notifyObservers 方法来优化这段代码:

func chickenStartsEating() {
numberOfEatingChickens += 1
notifyObservers()
}
由于我们已经在 Actor 内有了同步的访问,我们不需要另一个等待。这些都是需要考虑的重要改进,因为它们可能会对性能产生影响。

非隔离(nonisolated)访问

Actor 内的非隔离(nonisolated)访问。

了解 Actor 内部的隔离概念很重要。上面的例子已经展示了如何通过要求使用 await 从外部参与者实例同步访问。但是,如果您仔细观察,您可能已经注意到我们的 notifyObservers 方法不需要使用 await 来访问我们的可变属性 numberOfEatingChickens。

当访问 Actor 中的隔离方法时,你基本上可以访问任何其他需要同步访问的属性或方法。因此,你基本上是在重复使用你给定的访问,以获得最大的收益。

然而,在有些情况下,你知道不需要有隔离的访问。actor 中的方法默认是隔离的。下面的方法只访问我们的不可变的属性 food,但仍然需要 await 访问它:

let feeder = ChickenFeeder()
await feeder.printWhatChickensAreEating()
这很奇怪,因为我们知道,我们不访问任何需要同步访问的东西。SE-0313[6]的引入正是为了解决这个问题。我们可以用 nonisolated 关键字标记我们的方法,告诉 Swift编 译器我们的方法没有访问任何隔离数据:

extension ChickenFeeder {
nonisolated func printWhatChickensAreEating() {
print("Chickens are eating \(food)")
}
}

let feeder = ChickenFeeder()
feeder.printWhatChickensAreEating()
注意,你也可以对计算的属性使用 nonisolated 的关键字,这对实现 CustomStringConvertible 等协议很有帮助:

extension ChickenFeeder: CustomStringConvertible {
nonisolated var description: String {
"A chicken feeder feeding \(food)"
}
}
然而,在不可变的属性上定义它们是不需要的,因为编译器会告诉你:

Marking immutable properties nonisolated is redundant.

将不可变的属性标记为 nonisolated 是多余的。

为什么会出现数据竞争

为什么在使用 Actors 时仍会出现数据竞争?

当在你的代码中持续使用 Actors 时,你肯定会降低遇到数据竞争的风险。创建同步访问可以防止与数据竞争有关的奇怪崩溃。然而,你显然需要持续地使用它们来防止你的应用程序中出现数据竞争。

在你的代码中仍然可能出现竞争条件,但可能不再导致异常。认识到这一点很重要,因为Actors 毕竟被宣扬为可以解决一切问题的工具。例如,想象一下两个线程使用 await正确地访问我们的 Actor 的数据:

queueOne.async {
await feeder.chickenStartsEating()
}
queueTwo.async {
print(await feeder.numberOfEatingChickens)
}
这里的竞争条件定义为:“哪个线程将首先开始隔离访问?”。所以基本上有两种结果:

  • 队列一在先,增加吃食的鸡的数量。队列二将打印:1
  • 队列二在先,打印出吃食的鸡的数量,该数量仍为:0
这里的不同之处在于我们在修改数据时不再访问数据。如果没有同步访问,在某些情况下这可能会导致无法预料的行为。

结论

Swift Actors 解决了用 Swift 编写的应用程序中常见的数据竞争问题。可变数据是同步访问的,这确保了它是安全的。我们还没有介绍 MainActor 实例,它本身就是一个主题。我将确保在以后的文章中介绍这一点。希望您能够跟随并知道如何在您的应用程序中使用 Actor。

参考资料

[1]数据竞争: https://www.avanderlee.com/swift/thread-sanitizer-data-races/#what-are-data-races​。

[2]解决这些问题: https://www.avanderlee.com/swift/thread-sanitizer-data-races/#using-the-thread-sanitizer-to-detect-data-races​。

[3]Actor Model: https://en.wikipedia.org/wiki/Actor_model​。

[4]SE-0306: https://github.com/apple/swift-evolution/blob/main/proposals/0306-actors.md​。

[5]Concurrent vs. Serial DispatchQueue: https://www.avanderlee.com/swift/concurrent-serial-dispatchqueue/。

[6]SE-0313: https://github.com/apple/swift-evolution/blob/main/proposals/0313-actor-isolation-control.md​。

有关Swift 中的 Actors 使用以如何及防止数据竞争的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. ruby - 其他文件中的 Rake 任务 - 2

    我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

  4. ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2

    作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代

  5. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  6. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  7. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  8. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  9. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  10. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

随机推荐