Tensorflow 2.x 模型 - 部署与实践

作者：霍格沃兹测试开发学社

2022 年 9 月 26 日
北京
本文字数：3154 字
阅读完需：约 10 分钟

工作原理

架构图

**核心概念 **

**⑦ ServableHandler:**servable 实例，用于处理 client 发送的请求

servable 的生命周期：

● 一个 Source 插件会为一个特定的 version 创建一个 Loader。该 Loaders 包含了在加载 Servable 时所需的任何元数据

● Source 会使用一个 callback 来通知该 Aspired Version 的 Manager

● 该 Manager 应用该配置过的 Version Policy 来决定下一个要采用的动作，它会被 unload 一个之前已经加载过的 version，或者加载一个新的 version

● 如果该 Manager 决定它是否安全，它会给 Loader 所需的资源，并告诉该 Loader 来加载新的 version

● Clients 会告知 Manager，即可显式指定 version，或者只请求最新的 version。该 Manager 会为该 Servable 返回一个 handle

Tensorflow 2.x 模型部署

TF serving 环境准备

Tensorflow Serving 环境最简单的安装方式是 docker 镜像安装。

docker pull tensorflow/sering:last

sudo apt-get install -y nvidia-docker2

docker pull tensorflow/serving:latest-devel-gpu

模型保存—savedmodel

Tensorflow 2.x 模型有以下几种格式：

model.save_weights(“./xxx.ckpt” , save_format=”tf”)

model.save(“./xxx.h5”)model.save_weights(“./xxx.h5”, save_format=”h5”)

model.save(“./xxx”, save_format=”tf”)tf.saved_model.save(obj, “./xxx”)

model.to_json()

coding=utf-8

import tensorflow as tf

class TestTFServing(tf.Module):def init(self):self.x = tf.Variable("hello", dtype = tf.string,trainable=True)

@tf.function(input_signature=[tf.TensorSpec(shape = [], dtype = tf.string)])def concat_str(self, a):    self.x = self.x + a    return self.x
@tf.function(input_signature=[tf.TensorSpec(shape = [], dtype = tf.string)])def cp_str(self, b):    self.x.assign(b)    return self.x

复制代码

if name == 'main':demo = TestTFServing()tf.saved_model.save(demo, "model\test\1", signatures={"test_assign": demo.cp_str,

"test_concat": demo.concat_str})

coding=utf-8

import tensorflow as tf

class DenseNet(tf.keras.Model):def init(self):super(DenseNet, self).init()

def build(self, input_shape):    self.dense1 = tf.keras.layers.Dense(15, activation='relu')    self.dense2 = tf.keras.layers.Dense(10, activation='relu')    self.dense3 = tf.keras.layers.Dense(1, activation='sigmoid')    super(DenseNet, self).build(input_shape=input_shape)
def call(self, x):    x = self.dense1(x)    x = self.dense2(x)    x = self.dense3(x)    return x

复制代码

if name == 'main':model = DenseNet()model.build(input_shape=(None, 15))model.summary()inputs = tf.random.uniform(shape=(10, 15))model._set_inputs(inputs=inputs) # tf2.0 need add this linemodel.save(".\model\test\2", save_format="tf")tf.keras.models.save_model(model, ".\model\test\3", save_format="tf")

服务启动

docker run -p 8500:8500 -p 8501:8501 --mount "type=bind,source=/home/test/ybq/model/demo,target=/models/demo" -e MODEL_NAME=demo tensorflow/serving:latest

docker run -p 8500:8500 -p 8501:8501 --runtime nvidia --mount "type=bind,source=/home/test/ybq/model/demo,target=/models/demo" -e MODEL_NAME=demo tensorflow/serving:latest-gpu

Warm up 模型

由于 tensorflow 有些组件是懒加载模式，因此第一次请求预测会有很严重的延迟，为了降低懒加载的影响，需要在服务初始启动的时候给一些小的请求样本，为了降低懒加载的影响，需要在服务初始启动的时候给一些小的样本(tfrecord 格式)，调用模型的预测接口，预热模型。

WarmUp Model 步骤如下所示：

coding=utf-8

import tensorflow as tffrom tensorflow_serving.apis import model_pb2from tensorflow_serving.apis import predict_pb2from tensorflow_serving.apis import prediction_log_pb2def main():with tf.io.TFRecordWriter("tf_serving_warmup_requests") as writer:request = predict_pb2.PredictRequest(model_spec=model_pb2.ModelSpec(name="demo", signature_name='serving_default'),inputs={"x": tf.make_tensor_proto(["warm"]),"y": tf.make_tensor_proto(["up"])})log = prediction_log_pb2.PredictionLog(predict_log=prediction_log_pb2.PredictLog(request=request))writer.write(log.SerializeToString())if name == "main":main()

模型维护

默认版本维护策略是只会加载同时加载 servable 的一个版本，但是我们可以通过配置 config，修改模型版本加载策略，也可以通过配置多个模型，同时维护多个模型。

model_config_list {config {name: "demo"base_path: "/models/demo"model_platform: "tensorflow"model_version_policy{specific {versions: 1versions: 2}}}}

docker run -p 8500:8500 -p 8501:8501 --mount "type=bind,source=/home/test/ybq/model/demo,target=/models/demo" -e MODEL_NAME=demo

tensorflow/serving:latest

--model_config_file=/models/demo/model.config

--model_config_file_poll_wait_seconds=60

model_config_list {config {name: "demo"base_path: "/models/model/demo"model_platform: "tensorflow"model_version_policy{specific {versions: 1versions: 2}}}config {name: "111"base_path: "/models/model/111"model_platform: "tensorflow"model_version_policy{specific {versions: 1}}}}

docker run -p 8500:8500 -p 8501:8501 --mount "type=bind,source=/home/test/ybq/model/,target=/models/model" tensorflow/serving:latest

--model_config_file=/models/model/models.config

--model_config_file_poll_wait_seconds=60

服务调用

TF Serving 提供了两种方式，一种是 grpc 方式（默认端口是 8500），另一种是 http 接口调用方式（默认端口是 8501）。

对于 tensorflow2.x 版本生成的 saved_model 模型，没有像 1.x 版本使用 SavedModelBuilder API 自定义签名（输入输出的数据类型+方法），2.x 版本模型输入的数据类型可以通过 @tf.function 中的 input_signature 参数指定，方法目前来看是写死在源码中的，只有 signature_constants.PREDICT_METHOD_NAME 一种。很多时候模型的输入输出对我们来说是黑盒的，而在调用服务接口的时候我们需要知道模型的输入输出以及签名的 key，我们可以使用 saved_model_cli show --dir model/test/1 –all 来查看我们需要的参数。

grpc 和 http 请求对应的代码片段分别如下所示：

coding=utf-8

import requestsimport jsonimport tensorflow as tffrom tensorflow_serving.apis import predict_pb2from tensorflow_serving.apis import prediction_service_pb2_grpcimport grpc

def test_grpc():channel = grpc.insecure_channel('{host}:{port}'.format(host="127.0.0.1", port=8500))stub = prediction_service_pb2_grpc.PredictionServiceStub(channel)request = predict_pb2.PredictRequest()request.model_spec.name = "demo"request.model_spec.signature_name = "test_concat"request.inputs['a'].CopyFrom(tf.make_tensor_proto("xxx"))result = stub.Predict(request, 10.0)return result.outputs

def test_http():params = json.dumps({"signature_name": "test_concat", "inputs": {"a": "xxx"}})data = json.dumps(params)rep = requests.post("http://127.0.0.1:8501/v1/models/demo/version1/:predict", data=data)return rep.text

点击下方链接免费领取：性能测试+接口测试+自动化测试+测试开发+测试用例+简历模板+测试文档

http://qrcode.testing-studio.com/f?from=infoQ&url=https://ceshiren.com/t/topic/22265

发布于: 刚刚阅读数: 3

霍格沃兹测试开发学社

关注

社区：ceshiren.com 微信：ceshiren2021 2019.10.23 加入

微信公众号：霍格沃兹测试开发提供性能测试、自动化测试、测试开发等资料，实时更新一线互联网大厂测试岗位内推需求，共享测试行业动态及资讯，更可零距离接触众多业内大佬。

发布

暂无评论

创作场景

Tensorflow 2.x 模型 - 部署与实践

coding=utf-8

coding=utf-8

coding=utf-8

coding=utf-8

点击下方链接免费领取：性能测试+接口测试+自动化测试+测试开发+测试用例+简历模板+测试文档

霍格沃兹测试开发学社

评论