一种基于SegaBert预训练模型的文本、简历和理财公告抽取方法

    公开(公告)号:CN113486141A

    公开(公告)日:2021-10-08

    申请号:CN202110865625.4

    申请日:2021-07-29

    Abstract: 本发明公开了一种基于SegaBert预训练模型的文本、简历和理财公告抽取方法在预训练阶段,能利用更丰富的位置表征,对段落、句子、词语三者间的位置关系联合建模,对输入的文本能做到片段感知,提升了预训练语言模型的文本编码能力,使其在微调阶段得到更完善的句子和篇章表示,进而提升下游任务的预测效果。增加对标注和训练样本预处理,能够筛选出更合理的数据;提取简历文本信息,对各个简历文本信息进行中文分词,实现所需简历信息的准确提取,可以提高简历信息的抽取效率;通过对理财公告的文本进行标注,通过对预训练模型进行预训练,从而通过训练后的预训练模型实现理财公告信息的获取。

    一种开放性问答的方法
    2.
    发明授权

    公开(公告)号:CN108959366B

    公开(公告)日:2020-11-17

    申请号:CN201810491331.8

    申请日:2018-05-21

    Abstract: 本发明公开了一种开放性问答的方法,运用于机器智能交互技术领域,采对问题进行分词得到分词数据;匹配得到问题领域,生成表达式并通过表达式在知识图谱中进行查询答案,也可通过远程数据源查询答案。本发明技术方案将问题解析成计算机容易理解的表达式,进一步通过表达式从而进行计算和查询,得到问题的答案,适用于大规模分布并发并行计算模型框架,可以训练更深层的计算机神经网络,加大数据的分析量,加快对话任务的回复速度,提高问答系统效率。

    一种自然语言理解方法及基于该方法的旅游问答系统

    公开(公告)号:CN104850539A

    公开(公告)日:2015-08-19

    申请号:CN201510282019.4

    申请日:2015-05-28

    Abstract: 本发明公开了一种自然语言理解方法及基于该方法的旅游问答系统,通过将提问与语法库中的问题匹配,根据问题对应的函数与参数值从知识库中抽取答案,提供的语法库不仅涵盖了领域范围内的绝大多数问题,还通过非领域知识库提供超出领域范围的问题,并通过读取缓存中历史问题相关数据使得获取的答案符合用户提问时的情境,除了提供精确答案外还提供存在的相关联的答案;该方法用于旅游问答系统时,不仅能涵盖旅游领域99%以上的问题,还可以抽取超出旅游领域问题的答案,提供存在的相关联的答案,通过测试准确率达到95%以上。

    一种文章评估方法及系统

    公开(公告)号:CN108829663B

    公开(公告)日:2022-04-29

    申请号:CN201810490177.2

    申请日:2018-05-21

    Abstract: 本发明涉及文章处理技术领域,尤其涉及一种文章评估方法及系统,包括:步骤S1,采集一待处理文章;步骤S2,提取待处理文章中无法识别的词语作为关键词;步骤S3,在近义词库中分别查找与每个无法识别的关键词的语义距离值最小的近义词,并采用语义距离值最小的近义词替换对应的关键词,生成一可处理文章;步骤S4,将可处理文章放入文章训练模型库中的文章训练模型中进行处理,并根据处理结果确定可处理文章的评估结果;能够对复杂的文章进行评估,是可靠性高的文章处理和评估方法。

    一种文章评估方法及系统

    公开(公告)号:CN108829663A

    公开(公告)日:2018-11-16

    申请号:CN201810490177.2

    申请日:2018-05-21

    Abstract: 本发明涉及文章处理技术领域,尤其涉及一种文章评估方法及系统,包括:步骤S1,采集一待处理文章;步骤S2,提取待处理文章中无法识别的词语作为关键词;步骤S3,在近义词库中分别查找与每个无法识别的关键词的语义距离值最小的近义词,并采用语义距离值最小的近义词替换对应的关键词,生成一可处理文章;步骤S4,将可处理文章放入文章训练模型库中的文章训练模型中进行处理,并根据处理结果确定可处理文章的评估结果;能够对复杂的文章进行评估,是可靠性高的文章处理和评估方法。

    一种信息处理方法
    6.
    发明公开

    公开(公告)号:CN108733654A

    公开(公告)日:2018-11-02

    申请号:CN201810491332.2

    申请日:2018-05-21

    Abstract: 本发明公开了一种信息处理方法,采用信息处理端接收需要被处理的文本,将文本进行分词,依次得到多个词语;信息处理端根据词语之间的语义关系,将词语合并为多个词包;信息处理端根据词包和文本的句式,编译关系图谱;信息处理端根据关系图谱,自动生成多个问题及对应的答案并保存;信息处理端根据问题和对应的答案与用户端之间进行反馈学习。采用本发明的技术方案,可以使得计算机能从海量信息的互联网数据中获取知识,自动归纳新的概念以及信息之间的联系,使得计算机中的人工智能的知识广度和深度可以做到持续提升。

    一种儿童学习内容的推送方法

    公开(公告)号:CN108647211A

    公开(公告)日:2018-10-12

    申请号:CN201810470656.8

    申请日:2018-05-17

    Abstract: 本发明公开了一种儿童学习内容的推送方法,首先确定用户当前的学习能力等级,并将与学习能力等级匹配的当前待推送内容在一个学习周期内随机以不同的推送方法推送给用户进行学习,再获取当前的一个学习周期内用户对于该领域中的每个推送方法的当前好感值,当一个学习周期结束后将当前答题正确率与预先设定的通过率进行比较,并结合每个推送方法的当前好感值,最终得到直接结束课程推送过程、保持用户当前的学习能力等级进入下一个学习周期及对用户当前的学习能力升级后进入下一个学习周期三种判定结果,并且确定了下一个学习周期中将待推送内容分配给特定推送方法模块的比例;优点是对儿童的学习内容有选择进行推送,从而有效的提升学习质量。

    一种重心可控的不倒翁及控制不倒翁重心的方法

    公开(公告)号:CN105688415B

    公开(公告)日:2017-11-03

    申请号:CN201610039097.6

    申请日:2016-01-20

    Abstract: 本发明公开了一种重心可控的不倒翁,包括底部为半球形的不倒翁外壳,不倒翁外壳的底部设置有用于平衡的重物块,特点是不倒翁外壳内设置有转盘定位组件、摆动定位组件、重心定位块和控制模块,转盘定位组件设置在重物块上,摆动定位组件设置在转盘定位组件上,重心定位块设置在摆动定位组件上,控制模块分别与转盘定位组件和摆动定位组件电连接,控制模块用于控制转盘定位组件转动以及控制摆动定位组件摆动;优点是用户通过控制模块分别通过控制转盘定位组件和摆动定位组件将重心定位块定位到需要的空间位置处,不倒翁做出相应的动作,大大增加了不倒翁的趣味性和互动性;本发明同时还公开了控制该种不倒翁重心的方法。

    一种基于上下文的人机对话方法

    公开(公告)号:CN106326452A

    公开(公告)日:2017-01-11

    申请号:CN201610742179.7

    申请日:2016-08-26

    CPC classification number: G06F16/90332

    Abstract: 本发明涉及人机对话技术领域,尤其涉及一种基于上下文的人机对话方法,包括:接收客户端发送的用户问题,对所述用户问题进行分词以得到若干分词数据;将所述分词数据与预存于服务器中与上下文主题对应的优先查询模板或问题查询模板相匹配,以确定与所述用户问题对应的上下文主题;并从所述分词数据中提取所述用户问题的关键词集合,或从确定的上下文主题的关键项集合中提取与缺失的关键词对应的关键项,然后根据关键词集合和关键项,从服务器的数据库中获取相应的答案回复至客户端。本发明通过结合上下文信息来理解用户问题的方法,可以有效提升对于用户问题的语义的理解准确性,从而提升回答的准确度。

    一种基于SegaBert预训练模型的合同抽取方法

    公开(公告)号:CN113505201A

    公开(公告)日:2021-10-15

    申请号:CN202110865024.3

    申请日:2021-07-29

    Abstract: 本发明公开了一种基于SegaBert预训练模型的合同抽取方法通过从合同数据样本提取的信息,利用在合同中快速定位需要抽取的合同信息,因此,本发明可以准确快速地从待抽取合同中筛选出一种或者多种输出要信息;进一步地,对多个所述输出信息进行检验,得到每种输出信息对应的概率值,可以提高合同信息抽取方法的效率。本发明在预训练阶段,能利用更丰富的位置表征,对段落、句子、词语三者间的位置关系联合建模,对输入的文本能做到片段感知,学习到信息更丰富的上下文表示。这样的改进,提升了预训练语言模型的文本编码能力,使其在微调阶段得到更完善的句子和篇章表示,进而提升下游任务的预测效果。

Patent Agency Ranking