-
公开(公告)号:CN113761215A
公开(公告)日:2021-12-07
申请号:CN202110321491.X
申请日:2021-03-25
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 赵忠华 , 李建广 , 余智华 , 王禄恒 , 陈欣洁 , 赵志云 , 冯凯 , 葛自发 , 杜漫 , 孙小宁 , 穆庆伟 , 万欣欣 , 申双成 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。
-
公开(公告)号:CN112130812B
公开(公告)日:2022-04-15
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
公开(公告)号:CN112130933A
公开(公告)日:2020-12-25
申请号:CN202010773698.6
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供了一种算子集构建方法和装置,算子单元接收,所述算子单元为处理单元用于完成所对应的处理任务;算子接口参数获取,根据所述算子单元获取所述算子接口参数,所述算子接口参数包括开启参数和运行参数;算子模块构建,将获取了算子接口参数的算子单元构建为算子模块。所述算子单元的接口参数为统一的包括有开启参数和运行参数,统一所述算子接口参数的规格,降低开发人员多种语言和算法的衔接难度;对于业务人员,业务人员可以直接调用算子模块,降低工作难度。本发明还提供了一种算子集调用方法和装置,业务人员可以针对运行环境选择适用的算子模块,再将被选择的算子模块发送至运行节点运行,提高业务人员工作效率。
-
公开(公告)号:CN113761910A
公开(公告)日:2021-12-07
申请号:CN202110283681.7
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/289 , G06F40/211 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合情感特征的评论文本细粒度情感分析方法,包括以下步骤S1、已有评论数据语料预处理;S2、联合向量构建;S3、ADBC细粒度情感模型训练。有益效果:本发明通过融合情感标签,情感词、方面词来表示文本向量,设计一种针对评论文本的增强语义的高鲁棒性细粒度情感分析框架,更多的挖掘文本中潜在的情感信息,同时在注意力机制之前嵌入CNN卷积神经网络对Bi‑GRU的输出层进行特征的强化学习,从而提高了细粒度情感分析的准确性。能够反映出用户真实的评价信息,使用户对产品的各方面好坏有更加直接的了解。为消费者及供应商们提供高效可靠的反馈结果。
-
公开(公告)号:CN119807275A
公开(公告)日:2025-04-11
申请号:CN202411850948.6
申请日:2024-12-16
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供一种用于数据要素处理的异构资源集成系统,包括资源单元:融合数据资源、算法资源、模型资源和应用资源,依据资源列表调用对应资源并给出任务结果;资源分类单元:包含若干类典型应用场景下数据资源、算法资源、模型资源和应用资源之间关联关系的关联网络结构;资源推荐单元:依据任务数据和关联网络结构生成资源列表;资源应用单元:接收任务数据并输出任务结果。本发明能够单独且灵活调用不同数据资源、算法资源、模型资源和应用资源,实现各种数据资源与算法资源、模型资源和应用资源之间的松耦合,灵活扩展数据资源和应用场景,实现突发任务时应用场景的快速构建和及时响应。
-
公开(公告)号:CN112130895B
公开(公告)日:2022-04-15
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130851B
公开(公告)日:2022-04-15
申请号:CN202010772703.1
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
Abstract: 本发明提供了一种用于人工智能的建模方法,包括以下步骤:模型初始化:接收新建模块组件指令或编辑模块组件指令,生成菜单组件和视图组件;算子组件构建:接收选择算子标识的指令;接收复制指令;接收生成位置指令;在所述位置建立算子组件,所述算子组件抽取算子标识携带的信息;连线构建:判断连线输出节点,判断连线输入节点,在连线输出节点和连线输入节点之间构建有向连线;运行验证:接收运行指令,将数据沿有向连线在算子组件之间进行传递,将正在执行的算子组件进行突出显示,在算子组件上显示运行结果。本发明还提供了一种电子设备、存储介质,将创建模型的过程可视化,便于查看模型的结构、数据流向、执行、运行结果。
-
公开(公告)号:CN113761885A
公开(公告)日:2021-12-07
申请号:CN202110283749.1
申请日:2021-03-17
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/263 , G06F40/289 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于BayesLSTM的语种识别方法,包括以下步骤:S1、构建词向量模型;S2、词向量作为输入,输入到LSTM中;S3、通过概率密度分布来对权重进行采样,优化分布参数;S4、通过Softmax分类器对经过贝叶斯优化的特征向量进行预测分类;S5、根据步骤S4的预测分类概率,最终得到文本的分类类别标签。有益效果:本发明的方法通过估计模型参数的不确定性来提高模型的鲁棒性和语种识别的准确率。
-
公开(公告)号:CN112130895A
公开(公告)日:2020-12-25
申请号:CN202010772714.X
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/76
Abstract: 本发明提供了一种可移植性的模型发布方法、装置和存储介质,算子阶段获取,接收算子训练模型,所述算子训练模型中包括多个算子单元,将所述算子训练模型中的多个算子单元进行划分,对每个算子单元独立封装为一个算子阶段;算子单元逻辑关系获取,提取算子单元间的逻辑关系;算子发布模型建立,获取多个算子阶段及算子阶段对应算子单元间的逻辑关系,建立算子发布模型;模型文件转化,将所述算子发布模型转化为Json格式的模型文件。本发明的方法能够直接完成全流程的发布,全流程的所述模型文件在被转化后,只需要将数据输入模型文件,即可得出全流程处理后的数据结果,全流程的操作都不需要使用多种不同的运行环境,提高运行便捷度。
-
公开(公告)号:CN112130812A
公开(公告)日:2020-12-25
申请号:CN202010772705.0
申请日:2020-08-04
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F8/20
Abstract: 本发明提供了一种基于数据流混合编排的分析模型构建方法,所述基于数据流混合编排的分析模型构建方法包括以下步骤:拆分处理子任务,接收分析任务的数据流转,并将分析任务按照分析流程拆分为处理子任务;修饰处理子任务,为处理子任务定义:数据输入、数据输出及处理逻辑;封装分析任务,将分析任务封装为编码结构的数据流图;转换语言格式,将数据流图转换为标记语言格式的任务流图;调度执行,将任务流图解析,并进行分发调度执行;生成分析结果,返回调度执行的执行结果,得到分析结果。本发明还提供了一种基于数据流混合编排的分析模型构建系统。本发明能够解决了数据分析建模过程中建模方式单一、建模流程复杂、缺少混合运算支持的问题。
-
-
-
-
-
-
-
-
-