Transformer P15 生成器层代码实现

本课程为收费课程，购买后可查看！

立即注册登录

立即购买

视频选集

作者：陈华 • 发布时间：2023-08-31 • 阅读 593

参照 Transformer 结构图，在解码器之后，还有一个 linear 层和 softmax，我们把这两步操作，封装到一个生成器里面，这一层的输出，就是模型生成的目标序列。

1、生成器层

模型的输出值，就是目标序列词表中，每个字的概率值。

内容不可见，请联系管理员开通权限。

2、调用测试

通过 softmax 之后，最大的概率值对应的索引位置，就是生成的词的索引。

内容不可见，请联系管理员开通权限。

好的，到目前为止，Transformer 中几个大的模块，就全部实现了，然后可以新建一个 model.py 文件，把代码规整一下，下节课还有最后一件事，就是把零散的模块，封装成一个完整的模型结构。

NLP算法工程师 / 量化交易、人工智能培训讲师。

人工智能基金理财日记副业外快