ChatGPT应用 P4 替换模板实体占位符并拆分样本

作者：陈华 • 发布时间：2023-08-03 • 阅读 819

前面课程当中，我们用ChatGPT生成了语料模板，然后又从知识图谱的数据里面，抽取到了真实的实体。接下来，就只剩下最后一步，就是把模板中的实体占位符，替换成真实的实体文字。

另外，因为模板很少，实体却很多，所以把一个模板多替换几次实体，这样可以生成的数据就多了，同时，也可以帮助模型定位句子的重点，尽快排除实体对分类的干扰。

1、解析label标签

内容不可见，请联系管理员开通权限。

2、加载模板和实体文件

内容不可见，请联系管理员开通权限。

3、遍历模板，每行替换随机实体

内容不可见，请联系管理员开通权限。

4、随机拆分数据集

内容不可见，请联系管理员开通权限。

好的，到目前为止，通过ChatGPT去生成训练语料的任务就完成了。除了这个应用场景之外呢，我还计划录制一个ChatGPT的专题课程，集中讲解ChatGPT更多精彩的应用案例，希望大家可以持续关注陈华编程的最新课程。

本课程为收费课程，购买后可查看！