标签:start client save 参考 红色 gpu sse require ref
train.py
local_infer_test.py
git clone git@gitee.com:sheng_peng_exhibition/densent_ctc.git
pip install -r requirement.txt
tf.flags.DEFINE_integer(‘batch_size‘, 8, ‘number of training iterations.‘)
tf.flags.DEFINE_integer(‘max_epochs‘, 2, ‘max number of training iterations.‘)
tf.flags.DEFINE_integer(‘num_gpus‘, 1, ‘gpu nums.‘)
tf.flags.DEFINE_integer(‘num_classes‘, 37, ‘num_classes.‘)
tf.flags.DEFINE_integer(‘steps_per_epoch‘, 100, ‘step_per_epoch.‘)
tf.flags.DEFINE_string(‘data_url‘, ‘./data‘, ‘dataset directory.‘)
tf.flags.DEFINE_string(‘dict_url‘, ‘./digitEn_37.txt‘, ‘dictionary directory.‘)
tf.flags.DEFINE_string(‘train_file_url‘, ‘./data/train_labels.txt‘, ‘train labels file.‘)
tf.flags.DEFINE_string(‘val_file_url‘, ‘./data/val_labels.txt‘, ‘val labels file.‘)
tf.flags.DEFINE_string(‘train_url‘, ‘./output‘, ‘saved model directory.‘)
tf.flags.DEFINE_float(‘learning_rate‘, 0.05, ‘learning rate.‘)
tf.flags.DEFINE_bool(‘local_debug‘, True, ‘local debug.‘)
将数据集拷贝至当前工作目录
python train.py
python local_infer_test.py --model_path=‘./output/pb_model‘ --data_path=‘./data‘ --dict_file=‘./digitEn_37.txt‘
修改数据访问模式
访问OBS内的数据需要通过moxing库(主要用于数据量过大,只能通过OBS访问数据集的情况)
注:配置文件从OBS复制到训练机器上,则在数据访问时可以正常使用open等函数,减少移植代码的工作量.
见:MoXing开发指南->常用操作的样例代码
https://support.huaweicloud.com/moxing-devg-modelarts/modelarts_11_0005.html
mox.file.copy(OBS上的文件路径, 训练机器上的目标路径)
模型转换为pb格式
def save_keras_model_to_serving(model, export_path):
signature = tf.saved_model.signature_def_utils.predict_signature_def(
inputs={‘images‘: model.inputs[0]}, outputs={‘logits‘: model.outputs[0]})
builder = tf.saved_model.builder.SavedModelBuilder(export_path)
legacy_init_op = tf.group(tf.tables_initializer(), name=‘legacy_init_op‘)
builder.add_meta_graph_and_variables(
sess=K.get_session(),
tags=[tf.saved_model.tag_constants.SERVING],
signature_def_map={
‘segmentation‘: signature,
},
legacy_init_op=legacy_init_op)
builder.save()
ocr //桶名称
digitEn //新建文件夹
digitEn_37.txt // 字典
data //数据集train_labels.txt // 训练集标签
val_labels.txt // 验证集标签
*.jpgdigitEn_output // 输出目录
digitEn_code // 代码目录train.py // 训练启动文件
train_lib
将模型推理代码、模型配置文件copy至OBS中,与pb格式模型文件放置同一处。
从训练中选择/从OBS中选择均可(注意选择model文件夹的上一级目录)
至此完成所有流程!欢迎交流!
【ModelArts】基于densent+ctc实现不定长文本识别训练与部署
标签:start client save 参考 红色 gpu sse require ref
原文地址:https://www.cnblogs.com/spz01/p/13281999.html