前面课程当中,给大家演示了单标签和多标签分类的实现方法,但是在上节课的最后,给大家演示多标签预测效果的时候翻车了。所以,我课后又重新训练了模型,正好也有同学问到,训练过程看不到验证集的准确率,有点像盲盒这个问题,在这里给大家再补充讲解一下。

同时,这个方案不只是TextCNN项目适用,其他项目也可以参考这个方法。

代码示例

1、边训练边验证

首先,我们来解决盲盒的问题,就是在训练过程中,看不到模型在验证集上的表现。因为我们没有验证集,就直接把测试集当验证集使用了,在训练过程中,每训练完一轮,就做一次验证,取验证准确率最高的模型。

内容不可见,请联系管理员开通权限。
内容不可见,请联系管理员开通权限。

2、调参

我们这个模型比较简单,可能对模型有影响的参数有以下几个。

内容不可见,请联系管理员开通权限。

我尝试调整了这些参数,发现模型效果并没有明显的改善,个人感觉已经到了上限。

算法界有个基本共识:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。所以在工业级项目中,应该把更多精力放在构建更好的数据集上。

本文链接:http://www.ichenhua.cn/edu/note/567

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!