本发明提供一种重要领域智能机器人文字播音朗读审核校对方法与系统,它包括在系统载入模块中预先建立的三个数据库模块:分别收集各类知识库和特殊符号的播音语料和朗读语料形成的播音语言模块和语音朗读识别模块,和收集系统词库数据库、差错类型数据库和科学实用词表形成的词表科学实用模块。播音校对时导入原稿,播音语言模块通过播放器对原稿进行播音,校对人员根据播音对校稿进行校对;语音朗读校对时导入校稿,校对人员通过麦克风向系统中朗读原稿,语音朗读识别模块对校稿进行校对;在上述校对时,同时使用词表科学实用模块对可疑处进行提醒,并将修改信息存储在科学实用词表。本发明的语音数据库中包含符号的语料,可进行文本的精准校对。`!`
1.智能机器人文字播音朗读审核校对方法,其特征在于:预先建立以下三个数据库模块:播音语言模块,所述播音语言模块为通过收集各类原始语言材料、汉语知识库的文字播音语料和特殊符号的播音语料形成的播音语料数据库;所述特殊符号包括文本中不属于文字字符的所有符号;语音朗读识别模块,所述语音朗读识别模块为通过收集各类原始语言材料、汉语知识库的文字朗读语料和特殊符号的朗读语料形成的语音朗读数据库;所述特殊符号包括文本中不属于文字字符的所有符号;所述语音朗读识别模块中同时设置有对于校稿进行校对的内容;词表科学实用模块,所述词表科学实用模块包括系统词库数据库、差错类型数据库和科学实用词表,所述系统词库数据库为全部知识库;所述差错类型数据库为正向的逻辑函数序列库;所述科学实用词表包括收集的修改信息;所述修改信息为通过将校对修改中属于差错类型数据库中的差错类型的可疑处与系统词典数据库进行对比,获取的正确信息;进行播音校对时:向系统中导入原稿,播音语言模块对原稿的内容进行播音,校对人员根据播音的内容对校稿进行校对;进行语音朗读校对时:向系统中导入校稿,校对人员向系统中朗读原稿,语音朗读识别模块根据存储的朗读语料对校对人员输入系统中的语音进行识别并解析出语音中的内容,根据该解析出的内容,对系统中的校稿进行校对;词表科学实用模块能够单独对原稿或者校稿的可疑处进行提醒,使校对人员选择是否进行修改,并在修改过程中将修改信息添加到科学实用词表中;同时,在上述进行播音校对或者语音朗读校对的同时,能够使用词表科学实用模块对可疑处进行提醒,使校对人员选择是否进行修改,修改时将修改信息存储在科学实用词表,同时也能够选择不使用词表科学实用模块进行可疑处提醒,仅仅在对原稿或者校稿进行修改时,将修改信息存储在科学实用词表。
2.根据权利要求1所述的智能机器人文字播音朗读审核校对方法,其特征在于:所述通过播音语言模块进行播音校对时,播音语言模块能够选择逐字逐句逐符号逐格式的方式进行播音校对,或者忽略特殊符号,仅仅对文本内容进行播音校对;所述通过语音朗读识别模块进行朗读校对时,校对人员能够选择逐字逐句逐符号逐格式的方式进行朗读校对,或者忽略特殊符号,仅仅对文本内容进行朗读校对。
3.根据权利要求1所述的智能机器人文字播音朗读审核校对方法,其特征在于:词表科学实用模块的系统词库数据库和科学实用词表进行建立时,对系统词库数据库进行类型分类或者添加不同类型的词库数据库,同时科学实用词表的修改信息在建立时,将不同校对文本类型分类后,将校对时的修改信息存储在相应的类型数据库中,建立词表科学实用模块的历史数据;在进行校对时,对导入的作为校对文本的原稿或者校稿,先进行分类,建立与系统词库数据库和科学实用词表的关联,校对时,调用系统词库数据库中的一个或多个词库数据库,或者调用科学实用词表中的一个或者多个类型的数据库,对校对文本进行校对。
4.根据权利要求1所述的智能机器人文字播音朗读审核校对方法,其特征在于:所述播音语言模块进行播音朗读时,能够选择全文朗读或单句朗读或从光标处朗读或只朗读选中文本模式。
5.根据权利要求1所述的智能机器人文字播音朗读审核校对方法,其特征在于:所述对原稿或者校稿进行校对过程中,如果发现不属于差错类型数据库中的差错类型的可疑处,则提示未知错误或者不提示;如果提示未知错误,则校对人员能够选择对此可疑处进行修改,并将该差错类型写入差错类型数据库中,或者忽略该可疑处。
6.根据权利要求1所述的智能机器人文字播音朗读审核校对方法,其特征在于:所述对校稿进行校对的内容包括:(1)多、漏、错文字及标点、符号错误校对;标题、署名,文中人名、地名、数字、公式错误校对;(2)版面、格式,图表位置及表题、图题,字体、字号、字距和行距校对;(3)标题位置、层次及转行,注释、参考文献及序号校对,中英文目录及页码与文章的一致校对;(4)目录及对应的页码、刊眉、页码顺序、版权,封面、封二、封三、封底的文字、刊号、年月期号校对。
7.应用权利要求1~6任一项所述的智能机器人文字播音朗读审核校对方法的系统,其特征在于:包括系统载入模块,所述系统载入模块上连接有用户设备,所述系统载入模块内设置有播音语言模块、语音朗读识别模块、词表科学实用模块,所述用户设备包括用于通过播音语言模块对校稿进行播放的播放器,和校对人员向系统载入模块输入朗读语料的麦克风。
8.根据权利要求7所述的系统,其特征在于:所述播音语言模块、语音朗读识别模块、词表科学实用模块均为可扩展的数据库模块。
9.根据权利要求7所述的系统,其特征在于:所述系统载入模块包括服务器系统、便携式存储设备。
10.根据权利要求7所述的系统,其特征在于:系统审核能够作为管理人员选项设置签批审核意见。