-
公开(公告)号:CN114742319A
公开(公告)日:2022-07-12
申请号:CN202210528593.3
申请日:2022-05-16
Applicant: 重庆觉晓科技有限公司
Abstract: 本发明公开了法考客观题成绩预测方法、系统及存储介质,方法包括:获取前a年内预设m个学员的考试分数,对考试分数进行预处理,获得m个分数标签向量L,其中,a、m均为正整数;获取每个学员每个知识点的平均正确率、每个科目的听课总时长和做题总量,进行归一化处理,获得m个学习特征向量F;根据分数标签向量L和学习特征向量F构造考试成绩训练样本;利用考试成绩训练样本进行训练,获得考试成绩预测模型,考试成绩预测模型为脉冲MLP模型,其前向传播采用LIF神经元,反向传播采用sigmoid神经元;获取当前学员每个知识点的平均正确率、每个科目的听课总时长和做题总量,基于考试成绩预测模型预测当前学员的考试成绩。
-
公开(公告)号:CN117574970A
公开(公告)日:2024-02-20
申请号:CN202311436719.5
申请日:2023-10-31
Applicant: 重庆觉晓科技有限公司
IPC: G06N3/0495 , G06N3/0455 , G06N5/04
Abstract: 本发明公开了一种用于大规模语言模型的推理加速方法,包括:获取用户输入的待处理数据;将待处理数据转换为向量;采用FlashAttention技术对向量进行分块处理得到处理结果,将处理结果送SRAM中;将大规模语言模型的浮点数模型参数转化为定点数或低位宽度的整数表示。该方法提高了大规模语言模型的推理速度,即使面对庞大的模型结构和参数量,也能迅速地完成推理过程,为用户提供实时响应。提高了大规模语言模型推理的适应性,能够处理各种复杂场景下的推理请求。提高了大规模语言模型推理的效率,不仅仅是在单次推理上,在高并发、大数据量的场景下,模型推理的整体效率得到显著提升。
-
公开(公告)号:CN116805148A
公开(公告)日:2023-09-26
申请号:CN202211674954.1
申请日:2022-12-26
Applicant: 重庆觉晓科技有限公司
IPC: G06F40/289 , G06F40/216 , G06N20/00
Abstract: 本发明公开了一种法考客观题上下文检索方法和系统,涉及在线教育技术领域,所述方法包括:获取待检索语句;考虑法律专有名词的重要性、完整性和非专有名词的多样性对所述待检索语句进行预处理,得到目标检索分词,根据BM25算法和所述目标检索分词从预构建的法考语料库中获取检索结果;展示所述检索结果。本发明基于传统的BM25算法,结合法考客观题的特点进行改进优化,能够从大量的法考书籍和法规法条中为一道客观题关联若干个相关的上下文,提高了检索精度和效率。
-
公开(公告)号:CN115934954A
公开(公告)日:2023-04-07
申请号:CN202211317341.2
申请日:2022-10-26
Applicant: 重庆觉晓科技有限公司
IPC: G06F16/36 , G06F40/166 , G06F40/216 , G06N3/0455 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于知识图谱引导的评论事实修正方法、系统、设备及介质,涉及自然语言处理技术领域,本发明的方法包括将评论数据输入文本生成模型,得到待修正文本数据,抽取待修正文本数据中的实体数据;采用循环mask机制将所述实体数据掩盖,并通过文本修正模型预测被掩盖实体数据在掩盖位置的生成概率,根据所述生成概率对掩盖位置的实体数据进行修正。本发明能够对对百科知识图谱进行学习可以得到修正能力较好的文本修正模型,通过文本生成模块与可对评论事实进行预处理,得到待修正文本数据,再对待修正的预处理文本数据进行实体抽取,通过文本修正模型对实体进行修正,从而保证了评论数据在客观事实的正确性,修正效率高且效果好。
-
公开(公告)号:CN119893234A
公开(公告)日:2025-04-25
申请号:CN202411664842.7
申请日:2024-11-20
Applicant: 重庆觉晓科技有限公司
IPC: H04N21/845 , H04N21/8405 , G06V30/14 , G06V20/40 , G06V10/74
Abstract: 本发明实施例公开了一种课程视频自动剪辑方法、装置、计算机设备及介质。其中,方法包括:通过将课程视频进行分片后,将每个分片视频进行关键帧采样,然后采用OCR提取对应视频帧的文本,去重后分别进行稀疏向量化和稠密向量化,稀疏向量化更加重视关键词,而稠密向量化更加偏向语义,通过两者结合计算相似度来判断每个视频片段所属的知识点。与现有技术相比,本申请不需要人工标注数据训练视频分类模型,实时快速,能够有效提高学生的学习效率,推进个性化和智适应在线教育。
-
公开(公告)号:CN119884290A
公开(公告)日:2025-04-25
申请号:CN202411664765.5
申请日:2024-11-20
Applicant: 重庆觉晓科技有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/35 , G06N3/006 , G06N3/045 , G06N3/08 , G06F40/284 , G06N5/025 , G06Q50/20
Abstract: 本发明实施例公开了一种基于大模型的智能教学方法、系统、服务端及介质。方法包括:根据用户的意图构建多个智能体;获取用户历史对话记录和当前问题,形成输入文本;采用意图识别智能体进行用户意图的识别,得到意图标签;根据意图标签确定意图类型,调用对应的大模型智能体进行问答响应。实施本发明实施例,通过将大型语言模型和多智能体结合,解决了目前的非个性化教学、智适应教学的问题,以及解决了目前通用大模型在教育领域意图识别不精准,导致后续向量检索结果误差大,以及知识图谱构建繁琐,推理效率低的问题,从而提高了在线教育的智能化,个性化和在线学习效率。
-
公开(公告)号:CN119669395A
公开(公告)日:2025-03-21
申请号:CN202411477828.6
申请日:2024-10-22
Applicant: 重庆觉晓科技有限公司
IPC: G06F16/3329 , G06F40/211 , G06F16/35 , G06F18/214 , G06F18/241
Abstract: 本发明实施例公开了一种结构化的动态语义重构方法、装置及介质。方法包括:在动态对话重建的过程中,获取待处理数据;将其输入预训练好的动态语义重构模型,输出对当前最后一个人的说话信息进行语义重构的结果。本发明通过对句子进行句法依存分析,将其融合到模型的词语编码、位置编码等模块,增强了模型对复杂句法结构的句子的理解能力,从而可以保证正确且流畅地对句子进行重构,解决了人机动态交互中由于存在指代和省略现象导致算法模型的语义理解偏差问题;同时,本发明不需要大量的人工标注工作,只需要用对话数据即可训练,降低了算法模型训练过程中对高质量人工标注数据的依赖,也降低了算法模型部署需要的硬件材料依赖性。
-
公开(公告)号:CN116522954A
公开(公告)日:2023-08-01
申请号:CN202310487641.3
申请日:2023-04-28
Applicant: 重庆觉晓科技有限公司
IPC: G06F40/30 , G06F40/237 , G06N3/096
Abstract: 本发明公开了一种基于迁移学习的文本语义推理方法,包括:基于RoBERTa模型构建语义推理模型,所述语义推理模型包括引导者模型和学习者模型;采用迁移学习技术对语义推理模型进行训练得到训练好的语义推理模型;采用训练好的语义推理模型对客观题进行文本语义预测得到推理结果;展示所述推理结果。该方法采用迁移学习方法来增强语义推理模型的效果,实现提高模型泛化性能,降低模型训练成本,提高模型预测效果。
-
公开(公告)号:CN115204396A
公开(公告)日:2022-10-18
申请号:CN202210724122.X
申请日:2022-06-24
Applicant: 重庆觉晓科技有限公司
IPC: G06N5/04 , G06F40/237 , G06F40/30 , G06K9/62
Abstract: 本发明公开一种基于交互式阅读理解的文本语义推理方法及系统,包括采集司法领域的文本,将其作为语料数据输入通用的RoBerta模型进行模型预训练,获得司法领域的预训练模型;基于人工标注的训练数据调整预训练模型参数,对调整后的预训练模型及模型各层级之间的知识进行蒸馏,获得实时文本智能推理模型;将用户输入的一组文本数据输入所述实时文本智能推理模型,预测文本之间的推理关系;将模型输出的预测结果实时展现于用户界面。上述方案采用知识蒸馏方法,在保证了模型效果的同时,大幅度减小了模型的参数量,既保证了预测的准确性,也提高了模型的响应速度。
-
公开(公告)号:CN119887461A
公开(公告)日:2025-04-25
申请号:CN202411683947.7
申请日:2024-11-22
Applicant: 重庆觉晓科技有限公司
IPC: G06Q50/20 , G06F16/338 , G06F16/3332 , G06F16/334 , G06F16/383 , G06F16/31 , G06N5/04 , G06V30/416
Abstract: 本发明实施例公开了一种集成化的知识管理方法、装置、计算机设备及介质。方法包括:构建向量数据库;获取用户的检索需求,对其向量化,得到所述检索需求的稠密向量和稀疏向量;进行相似度计算,得到第一、第二检索结果,并采用倒数排序融合的方式进行融合,得到相似分片列表;使用基于大模型的重排器对融合后的排序结果进行重新排序,得到相似文档分片,过滤掉相似度分数小于阈值的文档分片,得到最终分片集合;使用大语言模型对所述最终分片集合中的文档分片进行结构化,提取输出Markdown文档,并将内容进行思维导图可视化。本发明可以通过一条数据处理管道快速的对知识进行管理,能够有效的提高用户在线学习过程中的知识获取效率。
-
-
-
-
-
-
-
-
-