一种面向桥梁检测文本的少样本机器阅读理解方法

    公开(公告)号:CN115392255A

    公开(公告)日:2022-11-25

    申请号:CN202211035572.4

    申请日:2022-08-26

    Abstract: 本发明涉及桥梁文本信息检索技术领域,具体涉及一种面向桥梁检测文本的少样本机器阅读理解方法。本方法中,即使获取到的样本数据并不多,但每一个样本,既可以通过问题分类模型及答案预测模型构建模拟预测数据,同时也可以通过人工标注的方式得到实际训练数据,每一个样本数据均可以得到充分的使用。与现有技术相比,本方法对收集到的文本数据进行了充分的开发使用,通过模拟训练数据及待标注的文本数据,可以让答案抽取模型在预训练Pre‑Training后,得到预微调Pre‑Tuning和微调Fine‑Tuning两次训练,与使用预训练+微调的现有训练方式相比,在只能收集到相同数据的文本数据时,同样可以大幅度提升答案抽取模型的训练效果。

    一种基于规则的Spark分布式弹性语义流推理方法

    公开(公告)号:CN113191498B

    公开(公告)日:2022-08-05

    申请号:CN202110482360.X

    申请日:2021-04-30

    Abstract: 本发明公开了一种基于规则的Spark分布式弹性语义流推理方法,包括:S1、获取RDF图;S2、为RDF图的标识符构建双向字典;S3、对RDF图进行划分得到模式图模型和实例图模型;S4、利用双向字典基于模式图模型和实例图模型设计对应的键值模型;S5、基于规则的Spark分布式弹性语义流推理引擎模块读取模式图模型和实例图模型中的模式数据和实例数据,根据RDFS规则的优化顺序执行Spark作业。与现有技术相比,本发明采用分布式内存计算模型Spark,把面向分布式数据集的操作抽象成面向本地数据集的操作,进一步提高了大数据处理环境下迭代计算的效率,并且实现了分布式的内存RDFS推理,有助于进一步提升RDFS推理效率和可扩展性。

    一种基于规则的Spark分布式弹性语义流推理方法

    公开(公告)号:CN113191498A

    公开(公告)日:2021-07-30

    申请号:CN202110482360.X

    申请日:2021-04-30

    Abstract: 本发明公开了一种基于规则的Spark分布式弹性语义流推理方法,包括:S1、获取RDF图;S2、为RDF图的标识符构建双向字典;S3、对RDF图进行划分得到模式图模型和实例图模型;S4、利用双向字典基于模式图模型和实例图模型设计对应的键值模型;S5、基于规则的Spark分布式弹性语义流推理引擎模块读取模式图模型和实例图模型中的模式数据和实例数据,根据RDFS规则的优化顺序执行Spark作业。与现有技术相比,本发明采用分布式内存计算模型Spark,把面向分布式数据集的操作抽象成面向本地数据集的操作,进一步提高了大数据处理环境下迭代计算的效率,并且实现了分布式的内存RDFS推理,有助于进一步提升RDFS推理效率和可扩展性。

Patent Agency Ranking