码迷,mamicode.com
首页 > 其他好文 > 详细

深度问答之提取语料

时间:2018-09-13 14:05:53      阅读:265      评论:0      收藏:0      [点我收藏+]

标签:turn   imp   rsa   去除   ret   enc   load   nes   port   

根据目录下的yml文件循环创建同名文件夹,并从yml文件读取问答并给每个文件夹写入question和answer文件

 

#!/usr/bin/env python
# coding:utf8
# author:Z time:2018/9/12


"""
遍历循环,每个文件生成question和answer

"""

import yaml

import os

def mkdir(path):
    # 去除首位空格
    path = path.strip()
    # 去除尾部 \ 符号
    path = path.rstrip("\\")

    # 判断路径是否存在
    # 存在     True
    # 不存在   False
    isExists = os.path.exists(path)

    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        # 创建目录操作函数
        os.makedirs(path)

        print(path +  创建成功)
        return True
    else:
        # 如果目录存在则不创建,并提示目录已存在
        print(path +  目录已存在)
        return False


yml_file_list=[]
path=os.path.dirname(os.path.abspath(__file__))
file_list=os.listdir(path)
for file in file_list:
    if file.endswith(yml):
        yml_file_list.append(file)
        """
        循环创建文件夹
        """
        # # 定义要创建的目录
        # mkpath = "E:\\chatterbot-corpus-master\\chatterbot_corpus\\data\\chinese\\" + file[:-4]
        # # 调用函数
        # mkdir(mkpath)



for yml_file in yml_file_list:
    with open(yml_file, r, encoding="utf-8") as rf:
        ss = yaml.load(rf)
        aa=ss[conversations]

        index=1

        for i in aa:
            question=i[0]
            answer=i[1:]
            with open(yml_file[:-4]+/question,a+,encoding=utf8)as f:

                f.write(question+\n)
            with open(yml_file[:-4]+/answer,a+,encoding=utf8)as f:
                for j in answer:

                    f.write(str(index)+j+\n)
            index+=1

 

深度问答之提取语料

标签:turn   imp   rsa   去除   ret   enc   load   nes   port   

原文地址:https://www.cnblogs.com/z-x-y/p/9639733.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!