前面课程当中,我们用ChatGPT生成了语料模板,然后又从知识图谱的数据里面,抽取到了真实的实体。接下来,就只剩下最后一步,就是把模板中的实体占位符,替换成真实的实体文字。

另外,因为模板很少,实体却很多,所以把一个模板多替换几次实体,这样可以生成的数据就多了,同时,也可以帮助模型定位句子的重点,尽快排除实体对分类的干扰。

代码示例

1、解析label标签

内容不可见,请联系管理员开通权限。

2、加载模板和实体文件

内容不可见,请联系管理员开通权限。

3、遍历模板,每行替换随机实体

内容不可见,请联系管理员开通权限。

4、随机拆分数据集

内容不可见,请联系管理员开通权限。

好的,到目前为止,通过ChatGPT去生成训练语料的任务就完成了。除了这个应用场景之外呢,我还计划录制一个ChatGPT的专题课程,集中讲解ChatGPT更多精彩的应用案例,希望大家可以持续关注陈华编程的最新课程。

本文链接:http://www.ichenhua.cn/edu/note/623

版权声明:本文为「陈华编程」原创课程讲义,请给与知识创作者起码的尊重,未经许可不得传播或转售!