英文对话改写 em 值 99.2% 首先把正负样本数据集放在data文件夹下面,启动processor.py,将负样本转换成正样本格式,并生成new_data文件,共30万样本,正负比2:8 run.py 训练模型 predict.py 用户自定义两句输入 思路是检查数据集和发现只有插入操作,所以3个指针就可以完成,分别为关键词起始位置指针,关键词结束指针,插入位置指针 正负样本的识别为decode阶段,若解码插入位置在第一句话中,就不该写第二句话 参考链接 https://zhuanlan.zhihu.com/p/137127209