-
公开(公告)号:CN106126573A
公开(公告)日:2016-11-16
申请号:CN201610439205.9
申请日:2016-06-17
Applicant: 北京大学
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公布了一种网络用户的特征识别方法,根据网络用户获得网页数据包的大小,通过逆向检测用户访问的网页,识别用户感兴趣的网页类型;包括:获取访问量靠前的网站、设置兴趣类型、定期扫描获得网页和数据包大小、提取网页对并将网页对与数据包大小建立对应、设置网页对的兴趣类型、生成数据包对与网页对兴趣类型的对应数据库、根据IP地址划分数据包、获得网络每次连续访问的网页对、获得连续访问网页对的数据包大小、获取数据库中匹配记录对应的兴趣类型并和IP地址关联、获得该IP地址的兴趣类型作为相应用户的兴趣特征。本发明不需要检测数据包内容,只需获得数据包大小,简单快捷、效率高、准确性高。
-
公开(公告)号:CN119541743A
公开(公告)日:2025-02-28
申请号:CN202411438146.4
申请日:2024-10-15
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G16H10/20 , G06F16/25 , G06F16/334 , G06F40/30
Abstract: 本发明公开了一种数据融合方法、装置、设备及存储介质,该方法包括:获取各数据库中的量表数据;利用预设语义分析模型,将量表数据中的量表字段转义为CDISC标准中的标准命名,并构建字段映射关系和字段值映射关系;基于字段映射关系和字段值映射关系将量表数据转化为符合CDISC标准的目标数据;采用加权平均法,根据各数据库的权重对各目标数据进行数据融合,获得数据融合结果。由于本发明利用预设语义分析模型,将量表数据中的量表字段转义为标准命名,基于字段映射关系和字段值映射关系将量表数据转化为符合CDISC标准的目标数据,最后采用加权平均法对各目标数据进行数据融合,提升了跨对列研究数据融合的效率和可复用性。
-
公开(公告)号:CN119396908A
公开(公告)日:2025-02-07
申请号:CN202411416652.3
申请日:2024-10-11
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G06F16/25 , G06F40/189
Abstract: 本申请公开了一种数据导出方法、装置、设备、存储介质及产品,涉及数据处理技术领域,所述数据导出方法,包括:基于用户的数据导出请求确定待对齐导出数据库以及导出数据参数;根据可视化界面中选择的待导出字段和待导出数据选项从各待对齐导出数据库中获取待导出数据;基于导出数据参数对待导出数据进行数据对齐,获得目标导出数据;将目标导出数据进行数据导出。由于是基于导出数据参数对待导出数据进行数据对齐,实现小范围的队列数据柔性化自动对齐结构化导出。减少用户实际操作时间,提升工作效率,并实现个性化的跨队列数据对齐需求。
-
公开(公告)号:CN119179473A
公开(公告)日:2024-12-24
申请号:CN202410993679.2
申请日:2024-07-23
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G06F8/36 , G06F8/33 , G06F9/48 , G06F9/445 , G06F16/242
Abstract: 本申请公开了一种工作流自动化生成方法,本申请涉及人工智能技术领域,该方法包括:获取用户输入的目标需求语句;根据目标需求语句对预设节点库进行检索,获得目标功能节点;对目标功能节点进行组装,获得目标工作流。本申请通过获取用户通过自然语言输入描述其业务需求的目标需求语句,从预设节点库中自动选择和配置相应的目标功能节点,生成目标工作流。本申请减少了用户在工作流创建和配置中的人工成本,提高了自动化效率和准确性,适用于多种业务场景,解决了现有技术在易用性和智能化方面的不足,为用户提供了更高效、便捷的工作流自动化解决方案,提升用户体验。
-
公开(公告)号:CN118467707B
公开(公告)日:2024-10-29
申请号:CN202410919350.1
申请日:2024-07-10
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G06F16/332 , G16H80/00 , G06F18/25 , G06F16/583 , G06N3/0455 , G06N20/00 , G06N5/04
Abstract: 本发明公开了一种医学视觉问答方法、装置、设备及存储介质,该方法包括:获取用户输入的目标图像和用户指令,并判断所述目标图像和所述用户指令是否符合医学视觉问答要求;在所述目标图像符合医学视觉问答要求时,将所述目标图像和所述用户指令输入至目标医学多模态大语言模型生成对应的目标答复,所述目标医学多模态大语言模型包括视觉编码器、文本编码器、基于注意力的图像分块选择器、上下文信息融合器和基于大语言模型的文本解码器;将所述目标答复返回至所述用户。相比于现有技术,由于本发明通过基于注意力的图像分块选择器和上下文信息融合器,提升了模型对图像关键区域的关注度和模型对上下文细节的理解能力,进而提升了答复准确性。
-
公开(公告)号:CN118445776B
公开(公告)日:2024-10-29
申请号:CN202410905247.1
申请日:2024-07-08
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
Abstract: 本申请公开了一种心理咨询对话数据集生成方法、装置、设备及存储介质,涉及数据集生成技术领域,该方法包括:获取不同数据源的心理咨询数据,并对心理咨询数据进行数据预处理;基于个案概念化模板生成拓展对话提示信息;将预处理后的心理咨询数据以及拓展对话提示信息输入至预训练大语言模型,获得初始多轮对话数据;对初始多轮对话数据进行标签提取,获得各轮对话的对话标签;根据对话标签对初始多轮对话数据进行标注,生成对话数据集。本申请通过引入个案概念化模板生成提示信息以辅助预训练大语言模型对获取的心理咨询数据进行拓展,能够增强得到的多轮对话数据的逻辑性和有效性,进而在由对话标签标注后得到专业相关性更强的对话数据集。
-
公开(公告)号:CN118553412A
公开(公告)日:2024-08-27
申请号:CN202411028276.0
申请日:2024-07-30
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
IPC: G16H50/20 , G06F16/332 , G06F16/36 , G06F16/35 , G06N5/02
Abstract: 本发明公开了一种心理咨询对话生成方法、装置、设备及存储介质,该方法包括:在接收到用户的对话输入指令时,基于时空知识图谱,并根据用户的历史对话信息和历史对话状态确定用户的当前对话状态;根据用户的当前对话对应的对话上下文和当前对话活动序列预测对话活动类型;利用检索增强生成技术,通过当前对话状态和对话活动类型从心理知识库中匹配目标文本片段;将当前对话状态、对话活动类型和目标文本片段输入至预设大语言模型生成目标答复语句。本发明根据用户的历史对话信息和历史对话状态确定用户的当前对话状态,利用检索增强生成技术从心理知识库中匹配目标文本片段,最后生成目标答复语句,保证了线上心理咨询回复的体系性和专业性。
-
公开(公告)号:CN118445776A
公开(公告)日:2024-08-06
申请号:CN202410905247.1
申请日:2024-07-08
Applicant: 北京大学 , 北京六元空间信息科技有限责任公司
Abstract: 本申请公开了一种心理咨询对话数据集生成方法、装置、设备及存储介质,涉及数据集生成技术领域,该方法包括:获取不同数据源的心理咨询数据,并对心理咨询数据进行数据预处理;基于个案概念化模板生成拓展对话提示信息;将预处理后的心理咨询数据以及拓展对话提示信息输入至预训练大语言模型,获得初始多轮对话数据;对初始多轮对话数据进行标签提取,获得各轮对话的对话标签;根据对话标签对初始多轮对话数据进行标注,生成对话数据集。本申请通过引入个案概念化模板生成提示信息以辅助预训练大语言模型对获取的心理咨询数据进行拓展,能够增强得到的多轮对话数据的逻辑性和有效性,进而在由对话标签标注后得到专业相关性更强的对话数据集。
-
公开(公告)号:CN117649917B
公开(公告)日:2024-06-28
申请号:CN202410116272.1
申请日:2024-01-29
Applicant: 北京大学
Abstract: 本申请涉及一种检验报告生成模型的训练方法及装置、检验报告生成方法。初始检验报告生成模型包括特征提取模块及特征融合模块,所述方法包括:获取样本检验图像,从检验报告先验知识图谱中确定样本检验图像对应的目标子图;通过特征提取模块分别对样本检验图像及目标子图进行特征提取处理,得到样本检验图像的图像特征、及目标子图的图谱特征;通过特征融合模块对图像特征及图谱特征进行融合处理,得到融合特征;根据融合特征生成目标检验报告,并根据样本检验图像对应的样本检验报告与目标检验报告之间的差异,对初始检验报告生成模型进行训练,得到训练好的检验报告生成模型。采用本方法能够提高检验报告的生成精度。
-
公开(公告)号:CN118094273A
公开(公告)日:2024-05-28
申请号:CN202410078590.3
申请日:2024-01-19
Applicant: 北京大学
IPC: G06F18/23213 , G06F18/22
Abstract: 本申请涉及一种聚类方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待聚类数据包括的多个样本以及各样本的目标权重;通过距离聚类算法以及各样本的目标权重,对多个样本进行聚类,得到第一聚类结果;确定第一聚类结果对应的区分参数,以及确定各簇分别对应的线性判别参数;基于各簇分别对应的线性判别参数对各样本的目标权重进行更新,基于更新后的目标权重,得到目标聚类结果。通过采用本方法,可以避免对数据进行压缩,保留数据的完整信息,通过加权距离以及实时更新的权重实现数据的聚类,提高了聚类的可靠性,通过动态迭代的方式实时对样本的权重进行更新,可以更好地适应动态变化的聚类过程,提升聚类效率。
-
-
-
-
-
-
-
-
-