写点什么

【译文】Rust futures: async fn 中的 thread::sleep 和阻塞调用

用户头像
袁承兴
关注
发布于: 2020 年 10 月 04 日
【译文】Rust futures: async fn中的thread::sleep和阻塞调用

原文:Rust futures: thread::sleep and blocking calls inside async fn

URL: https://blog.hwc.io/posts/rust-futures-threadsleep-and-blocking-calls-inside-async-fn/


近来,关于 Rust 的futuresasync/await如何工作(“blockers”,哈哈),我看到存在一些普遍的误解。很多新用户为async/await带来的重大改进而感到兴奋,但是却被一些基本问题所困扰。即使有了async/await,并发依然很难。文档还在进一步充实,阻塞/非阻塞之间的交互很棘手。希望本文对你有所帮助。


(本篇主要是关于特定的痛点;有关 Rust 中的异步编程的概述,请转至本书


TLDR(Too Long Didn't Read):小心在async fn中使用昂贵的阻塞调用!如果不确定, 鉴于 Rust std库中几乎所有都是阻塞的,所以就要注意哪些调用是耗时的!


虽然我认为任何人都可能犯这个错误(在引入足够的负载来显著地阻塞线程之前,往往察觉不到),但是初学者尤为如此。下面的场景可能有点冗长,但我认为有必要展示一下在async fn中实现阻塞调用是多么容易。


不要用 std::thread::sleep sleep


在研究了一个简单的示例之后,Rust 异步新手可能要做的第一件事就是去验证程序真正实现了异步。因此,我们使用 Rust 异步书籍中的示例:


use futures::join;
async fn get_book_and_music() -> (Book, Music) { let book_fut = get_book(); let music_fut = get_music(); join!(book_fut, music_fut)}
复制代码


即使你在 get_book 和 get_music 内部打日志,也无法通过简单的方式来判断它们是同时运行的,因为任何一次运行都可能产生恰好与代码顺序匹配的输出。你必须多次运行该程序,才能查看日志记录顺序是否可以翻转(如果不翻转怎么办?)。


如果想看到 get_book 和 get_music 是 100%同时运行,你可能会想到记录它们的开始时间,并查看开始时间是否相同。但是,等等,如果开始时间仍然是串行的,但 fn 运行得如此之快,看起来仍然像是并发该怎么办?


引入一个延迟!比如(清楚起见,使用伪码):


async fn get_book() {    println!("book start: time {}", current_time());    std::thread::sleep(one_second);    println!("book end: time {}", current_time());}
复制代码


在 get_book 和 get_music 内部延迟 1 秒,我们希望,如果是并发的话,则会看到以下的输出:


book start: time 0.00 

music start: time 0.00 

book end: time 1.00 

music start: time 1.00


如果是串行,我们预期是:


book start: time 0.00 

book end: time 1.00 

music start: time 1.00 

music end: time 2.00


你认为会发生什么, 串行或并发?


你已经读了这篇文章的标题,可能会猜到 get_book 和 get_music 是按顺序执行的。但为什么!?异步 fn 中的所有内容不是都应该同时运行吗?


在继续解释之前,可以看个问题已经多次被问到:


reddit 1 reddit 2 reddit 3 stackoverflow 1


因此,如果你也犯了这个错误,不用担心,其他许多人也有同样的经历。


什么搞错了?为什么 async 不行?


我不会在这里深入讨论futuresasync/await本书是一个很好的起点)。我只想指出造成困惑的两个可能的根源:


std::thread::sleep 会阻塞?


对于新手来说,std::thread::sleep会造成阻塞可能并不是显而易见的。尽管事后看起来很明显,但是当尝试掌握全新的程序执行范式时,却很容易忽略。


即使你大致了解并发,也可能不知道thread::sleep是具体如何实现的。一些上层推理加上一些示例(例如上述)可能会帮助你理解。但是文档中并没有明说“此调用是阻塞的,你不应该在异步上下文中使用它”,并且非系统程序员可能不会过多地考虑“将当前线程置于睡眠状态”。


(具有讽刺意味的是,如果人们的异步编程的心智模型是让Future进入“睡眠”状态从而得以让其他工作发生,那么thread::sleep可能会特别令人困惑)。


async 可以做什么?


但是有些人可能会说:“如果thread::sleep阻塞了怎么办?不是把它放在async fn中就好了吗?”


为了理解那些在线讨论,(就要知道)他们的想法是以为async可以使代码块或函数内部的所有内容异步。


首先,我想说这是有意义的;async/await存在的部分原因是它使每个人都容易进行异步操作。而且,如果你从较高的层次上理解了并发模型(事件循环,通常是尝试不阻塞线程),那么可能没有特定的理由导致async不能仅仅通过使事物定义为异步来起作用。那绝对是最简单,最符合人体工程学的方式。


不幸的是,这不是 Rust 的async范式的工作方式。async功能很强大,但从本质上讲,它只是提供了一种更好的处理Futures 的方法。而且Future不只是自动将阻塞调用移到一边以允许完成其他工作;它要结合使用具备轮询和异步运行时这种完全独立的系统,才能进行异步舞蹈。在该系统内进行的任何阻塞调用仍将处于阻塞状态。


这可能会造成一些困惑,因为async/await允许我们编写看起来更像常规(阻塞)代码的代码。那就是async/awaitawait部分进入的地方。当你在async块中awaitfuture 时,它能够将自己安排在线程外并为其他任务让路。阻塞代码可能看起来很相似,但是由于它不是 future,所以无法await,也无法为其他任务腾出空间。


因此,下面不会阻塞,但是await可以让你编写看起来与阻塞调用非常相似的代码:


async {    let f = get_file_async().await;    let resp = fetch_api_async().await;}
复制代码


下面在每行调用时阻塞:


async {    let f = get_file_blocking();    let resp = fetch_api_blocking();}
复制代码


下面将不能通过编译:


async {    let f = get_file_blocking().await;    let resp = fetch_api_blocking().await;}
复制代码


在这里什么也没有发生(您必须在async内部awaitfutures!):


async {    let f = get_file_async();    let resp = fetch_api_async();}
复制代码


总的来说,最好将async视为允许在函数或块中 await 的东西,但实际上并不会使任何东西异步。


如何不阻塞


如果想要异步 fn 取消阻塞该怎么办?


你可以找到一个异步替代方案:当thread::sleep阻塞时,你可以使用它们(取决于你选择的运行时生态系统):



tokioasync_std都为其他阻塞操作(例如文件系统和 tcp 流访问)提供了异步替代方法。


另一个选择是将阻塞调用移到另一个线程。



这要求你的运行时具有专用于卸载阻塞调用的机制(例如线程池)。


我还提出了一些问题,试图防止其他人陷入这个陷阱:



结语


希望该博客能够阐明有关阻塞调用如何与 Rust 的并发模型进行交互的一些信息!随时提供反馈给我。


发布于: 2020 年 10 月 04 日阅读数: 84
用户头像

袁承兴

关注

Rust语言爱好者。 2018.05.01 加入

职业程序员,图像算法工程师,团队教练。

评论

发布
暂无评论
【译文】Rust futures: async fn中的thread::sleep和阻塞调用