您的位置:首页 > 健康 > 美食 > 做一个医院网站多少钱_企业官方网站制作推广软件_软文交易平台_百度北京分公司官网

做一个医院网站多少钱_企业官方网站制作推广软件_软文交易平台_百度北京分公司官网

2024/10/5 9:06:58 来源:https://blog.csdn.net/m0_51347013/article/details/142631725  浏览:    关键词:做一个医院网站多少钱_企业官方网站制作推广软件_软文交易平台_百度北京分公司官网
做一个医院网站多少钱_企业官方网站制作推广软件_软文交易平台_百度北京分公司官网

1.ping 网址

2.ssh nscc/l20

3.crtl+,打开vscode的setting

4.win 10修改ssh配置文件及其密钥权限为600 - 晴云孤魂 - 博客园

 

整体来看:

    使用transformer作为其主干网络,代替了原先的UNet
    在latent space进行训练,通过transformer处理潜在的patch
    输入的条件(timestep 和 text/label )的四种处理方法:
        In-context conditioning: 将condition和input embedding合并成一个tokens(concat),不增加额外计算量
        Cross-attention block:在transformer中插入cross attention,将condition当作是K、V,input当作是Q
        Adaptive layer norm (adaLN) block:将timestep和 text/label相加,通过MLP去回归参数scale和shift,也不增加计算量。并且在每一次残差相加时,回归一个gate系数。
        adaLN-Zero block:参数初始化为0,那么在训练开始时,残差模块当于identical function。
    整体流程:patchify -> Transfomer Block -> Linear -> Unpatchify。 注意最后输出的维度是原来维度的2倍,分别输出noise和方差。

由下图可见,adaLN-Zero最好。然后就是探索各种调参效果,此处略。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com