业务方反应调用接口超时,但是在服务端监控并没有看到 5xx 异常, 于是我们模拟一下请求超时时发生了什么?
1.openresty 模拟长耗时服务端
延迟 5s 响应
error_log logs/error.log; http { server { listen 80; charset utf-8; location /reqtimeout { default_type text/html; content_by_lua ' local start = os.clock() while os.clock() - start < 5 do end ngx.say("delay success!!") '; } } }
复制代码
2.golang 和.net 默认的 httpclient 对外都只有一个 timeout 设置
用于控制请求、响应的整体时间
.net httpclient 默认 timeout= 100s;golang net/http 无默认值设置,强烈推荐设置 timeout,以避免服务端慢响应拖垮客户端。
static void Main(string[] args) { Console.WriteLine("Hello, World!"); var a = HttpReqTimeout(); Console.WriteLine(a.Result); } static async Task<string> HttpReqTimeout() { var handler = new SocketsHttpHandler { PooledConnectionLifetime = TimeSpan.FromMinutes(1) }; using (var hc = new HttpClient(handler)) { hc.Timeout = TimeSpan.FromSeconds(3); return await hc.GetStringAsync("http://localhost/reqtimeout"); } }
复制代码
dotnet run ./ 显示客户端请求 3s 超时,爆出异常
Hello, World!Unhandled exception. System.AggregateException: One or more errors occurred. (A task was canceled.) ---> System.Threading.Tasks.TaskCanceledException: A task was canceled. at System.Threading.Tasks.Task.GetExceptions(Boolean includeTaskCanceledExceptions) at System.Threading.Tasks.Task.ThrowIfExceptional(Boolean includeTaskCanceledExceptions) at System.Threading.Tasks.Task`1.GetResultCore(Boolean waitCompletionNotification) at ConsoleApp1.Program.Main(String[] args) in /Users/admin/RiderProjects/TestHttpClientFactory/ConsoleApp1/Program.cs:line 9--- End of stack trace from previous location --- --- End of inner exception stack trace --- at System.Threading.Tasks.Task.ThrowIfExceptional(Boolean includeTaskCanceledExceptions) at System.Threading.Tasks.Task`1.GetResultCore(Boolean waitCompletionNotification) at ConsoleApp1.Program.Main(String[] args) in /Users/admin/RiderProjects/TestHttpClientFactory/ConsoleApp1/Program.cs:line 9
复制代码
openresty 服务端日志,显示执行完成,返回 200ok:
127.0.0.1 - - [04/Dec/2024:15:17:50 +0800] "GET /reqtimeout HTTP/1.1" 200 28 "-" "-"
复制代码
这也正是对应上了业务方的反馈和服务端的监控现象(无 5xx 报错)。
3.wireshark 抓包看实质
tcp.port == 80 && ip.addr ==127.0.0.1 && ip.dst ==127.0.0.1
从 tcp 抓包过程看,分为三阶段:
1>. httpclient 请求, 正常 tcp 三次握手+ 请求确认;
2>. 客户端 3s 之后超时, 客户端发送 FIN+ACK 数据包(客户端标记连接已经被关闭), 服务端确认收到客户端的 FIN 包;
3>. 服务端 5s 尝试响应给客户端,最终会检测到客户端已经关闭而释放资源。
也就是说客户端请求超时,只会影响客户端, 服务端还会继续处理并响应, 这也是我们在服务端监控上看不到 5xx 报错的原因,可以通过在服务端设置: request_time between (-xx, 3s) 监测请求耗时占比。
正常的请求/响应读者可以参考下图:
4. 服务端能感知到客户端请求超时吗 ?
客户端请求超时, 默认情况下服务端都是继续执行之后响应;
服务器是具备感知客户端请求取消的能力的。
C# 是通过CancellationToken,感知客户端取消,之后服务端可以做一些逻辑,比如记录客户端请求超时(常规实践是记录 408 响应码)
// 在控制器/服务获取到当前请求的上下文,通过token感知到客户端取消,var cancellationToken = httpContext.RequestAborted;await LongLoop(cancellationToken); public Task LongLoop(CancellationToken token){ while(true) { if (token.IsCancellationRequested == true) { break; } //--- 长耗时循环 } return Task.CompletedTask;}
复制代码
golang 是通过 request.Context 获取客户端取消信号,内核类似于 C#
func getHello(w http.ResponseWriter, r *http.Request) { ctx := r.Context() select { case <-ctx.Done(): // 如果请求已取消或超时,这里会被触发 err := ctx.Err() fmt.Println("Request cancelled:", err) return case <-time.After(5 * time.Second): io.WriteString(w, "Hello, HTTP!\n") return }}
复制代码
本文记录了 httpclient 客户端超时在双端的现象, 服务端会继续响应,在服务端可能检测不到客户端认定的报错, 经验无他,唯手熟尔。
文章转载自:码甲哥不卷
原文链接:https://www.cnblogs.com/JulianHuang/p/18586745
体验地址:http://www.jnpfsoft.com/?from=infoq
评论