KeepLin's blog
心有猛虎,细嗅蔷薇
首页
归档
分类
关于我
Github
KeepLin's blog
首页
归档
分类
关于我
本地搜索
category
深度学习 分类
2024-04-07
修改模型词嵌入层(wte)
深度学习
修改模型词嵌入的输入,(vocab_size, embedding_size)m使得模型可以解决多个任务,主要是vocab_size这个
2024-04-07
cross_entropy的输出及标签
深度学习
常见报错
对于交叉熵损失,模型的输出类型需要为torch.float32,而标签的类型也需要为torch.float32