当前位置 主页 > 网站技术 > 代码类 >

    tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式

    栏目:代码类 时间:2020-01-24 12:08

    已经有了一个预训练的模型,我需要从其中取出某一层,把该层的weights和biases赋值到新的网络结构中,可以使用tensorflow中的pywrap_tensorflow(用来读取预训练模型的参数值)结合Session.assign()进行操作。

    这种需求即预训练模型可能为单分支网络,当前网络为多分支,我需要把单分支A复用到到多个分支去(B,C,D)。

    先导入对应的工具包

    from tensorflow.python import pywrap_tensorflow

    接下来的操作在一个tf.Session中进行

    reader = pywrap_tensorflow.NewCheckpointReader(pre_train_model_path)
    
    # 获取当前图可训练变量
    trainable_variables = tf.trainable_variables()
    # 需要赋值的当前网络层变量,这里只是随便起的名字。
    restore_v_target_name = "fc_target"
    # 需要的预训练模型中的某层的名字
    restore_v_source_name = "fc_source"
    for v in trainable_variables:
      if restore_v_target_name == v.name:
       # 回复weights和biases
        sess.run(
          tf.assign(v, reader.get_tensor(restore_v_source_name + "/weights"))) if "weights" in v.name else sess.run(
          tf.assign(v, reader.get_tensor(restore_v_source_name + "/biases")))
    

    以上这篇tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持IIS7站长之家。