GitHub

英文对话改写

em 值 99.2%

首先把正负样本数据集放在data文件夹下面，启动processor.py，将负样本转换成正样本格式，并生成new_data文件,共30万样本，正负比2：8

run.py 训练模型

predict.py 用户自定义两句输入

思路是检查数据集和发现只有插入操作，所以3个指针就可以完成，分别为关键词起始位置指针，关键词结束指针，插入位置指针

正负样本的识别为decode阶段，若解码插入位置在第一句话中，就不该写第二句话

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
__pycache__		__pycache__
README.md		README.md
config.py		config.py
data_utils.py		data_utils.py
decode.py		decode.py
metrics.py		metrics.py
model.py		model.py
predict.py		predict.py
run.py		run.py
utils.py		utils.py

Provide feedback