-
公开(公告)号:CN111967063A
公开(公告)日:2020-11-20
申请号:CN202010908124.5
申请日:2020-09-02
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F21/64 , G06F16/951 , G06F16/958 , G06K9/62 , G06F40/279
Abstract: 本发明提供了一种基于多维度分析的数据篡改监测和识别方法、装置、电子设备及其存储介质,属于互联网内容安全监测技术领域。所述方法应用于服务器,从网页中抽取网页特征,通过分类算法构建篡改二分类模型,利用fasttext算法对模型进行机器学习分类训练,并通过DNS分析、网页结构分析、暗链/外链分析、词库/规则匹配分析多个维度进行监测,对模型训练数据和各维度监测数据进行综合评分,最终得到监测结果。本技术方案将DNS分析、网页结构分析、暗链/外链分析、词库/规则匹配分析、篡改二分类模型分析技术相融合,相比传统仅采用一项分析技术的监测方法而言,从多个维度、多个特质综合多项分析技术进行监测和统一分析,能有效减少误报、漏报情况;并且,通过制定和采用一定规则,同时实施多项分析技术,将近时间内分析结果存入缓存中,能有效避免重复计算,高并发处理海量网页,使处理速度远高于常规监测手段。
-
公开(公告)号:CN111008339A
公开(公告)日:2020-04-14
申请号:CN201911177981.6
申请日:2019-11-27
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F16/9536
Abstract: 本发明提供了一种基于多元协同的内容智能推荐与分发方法及其系统,所述系统包括人工协同单元、算法协同单元和社交协同单元。与现有技术相比,本发明通过构建人工协同、社交协同、算法协同的三元协同体系,创建了全量、完备的属性特征库,实现内容和用户的精准匹配,其中,人工协同帮助内容平台建立内容调性,社交协同帮助提高内容曝光量,算法协同帮助内容平台向用户精准分发其感兴趣的内容。通过创建“用户+内容”的打分矩阵,利用统计数据对用户向量和内容向量进行相似度计算,预测用户喜好,实现内容的智能推荐与分发,通过设置内容质量影响因子定义内容评分公式为用户提供最优的推荐结果,扩大用户的兴趣域,节省人力和物力成本。
-
公开(公告)号:CN108921126B
公开(公告)日:2019-07-23
申请号:CN201810795447.0
申请日:2018-07-20
Applicant: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
Abstract: 本发明提供了一种自动识别签名章或手写签名的方法,包括如下步骤:S1、根据特征图片生成一个M1xM2的特征矩阵M,所述特征图片为包含签名章或手写签名的图片;S2、获取目标图片并得到目标图片的一个N1xN2特征矩阵N,所述目标图片为待识别图片;S3、通过判断特征矩阵N中是否包含矩阵M来判断目标图片中是否包含特征图片中的签名章或手写签名,如果是,则确定目标图片中包含特征图片,即目标图片中含有特征图片中的签名章或手写签名,反之则不包含。同时,本发明还提供了一种自动识别签名章或手写签名的装置。采用本发明实施例,能够实现简单、快速的对签名章或手写签名检查。
-
公开(公告)号:CN109597931B
公开(公告)日:2019-07-16
申请号:CN201811247462.8
申请日:2018-10-25
Applicant: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
IPC: G06F16/9535
Abstract: 本发明提供了一种基于规则引擎的智能推送方法及系统,本发明方法具体包括以下步骤:S1、构建规则引擎;S2、采集用户操作习惯等信息资源;S3、构建规则库:对采集的信息资源做分类整理,构建规则库,并根据各个分类的特点定义规则库;S4、按照规则对采集的信息资源做分析处理;S5、返回分析结果,后台定时器定期向用户推送资源。另外,本发明还提供了一种基于规则引擎的智能推送系统,本发明的技术方案解决了传统系统在选择用户关注或感兴趣的内容上准确度不足、时间段上把握不精准、开发维护上费时又费力的问题,能够精确识别用户关注或感兴趣的内容,通过分析和预测用户的操作习惯,有针对性地、在准确的时间段将内容主动推送给用户,并及时通知更新和更改的内容,使用户在浏览和阅读时更加方便和快捷,大大满足了用户个性化需求,同时也降低了系统更新和维护的成本。
-
公开(公告)号:CN109241383B
公开(公告)日:2019-06-21
申请号:CN201810815713.1
申请日:2018-07-20
Applicant: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
IPC: G06F16/953 , G06K9/62
Abstract: 本发明提供了一种基于深度学习的网页类型智能识别方法及系统,包括:搜集不同类型网页数据,标记每个网页类别,并对每个网页进行预处理,得到训练集数据;对训练集中的数据,利用深度学习算法构建深度学习模型;对每个测试的网页进行预处理将所得到的数据输入所述深度学习模型,得到该测试网页的网页类型。同时,本发明还提供了一种基于深度学习的网页类型智能识别系统。采用本发明实施例,能够提高网页智能分类的准确率。
-
公开(公告)号:CN109597931A
公开(公告)日:2019-04-09
申请号:CN201811247462.8
申请日:2018-10-25
Applicant: 北京开普云信息科技有限公司 , 广东开普云信息科技股份有限公司
IPC: G06F16/9535
Abstract: 本发明提供了一种基于规则引擎的智能推送方法及系统,本发明方法具体包括以下步骤:S1、构建规则引擎;S2、采集用户操作习惯等信息资源;S3、构建规则库:对采集的信息资源做分类整理,构建规则库,并根据各个分类的特点定义规则库;S4、按照规则对采集的信息资源做分析处理;S5、返回分析结果,后台定时器定期向用户推送资源。另外,本发明还提供了一种基于规则引擎的智能推送系统,本发明的技术方案解决了传统系统在选择用户关注或感兴趣的内容上准确度不足、时间段上把握不精准、开发维护上费时又费力的问题,能够精确识别用户关注或感兴趣的内容,通过分析和预测用户的操作习惯,有针对性地、在准确的时间段将内容主动推送给用户,并及时通知更新和更改的内容,使用户在浏览和阅读时更加方便和快捷,大大满足了用户个性化需求,同时也降低了系统更新和维护的成本。
-
公开(公告)号:CN109542895A
公开(公告)日:2019-03-29
申请号:CN201811247458.1
申请日:2018-10-25
Applicant: 北京开普云信息科技有限公司 , 广东开普云信息科技股份有限公司
Abstract: 本发明提供了一种基于元数据自定义扩展的资源管理方法及系统。本发明方法的具体实施步骤包括:S1、构建元数据或元数据集;S2、将元数据或元数据集匹配到指定目录中;S3、通过外部程序访问接口,带回准备上传的信息资源;S4、导入或添加信息资源;S5、对元数据进行自定义扩展。本发明的技术方案解决了资源管理过程中在提取元数据时仅仅依靠人工方式进行匹配出现的低准确度和不完整性问题,通过“人工匹配+自动匹配算法”方式大大提升元数据提取的工作效率,准确度更高,且极大丰富了索引库,为高级搜索带来更好的用户体验。
-
公开(公告)号:CN108920710A
公开(公告)日:2018-11-30
申请号:CN201810815712.7
申请日:2018-07-20
Applicant: 北京开普云信息科技有限公司 , 广东开普云信息科技股份有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种对互联网信息进行涉密涉敏信息监测的方法,具体包括以下步骤:S1、构建涉密涉敏信息识别模型;S2、构建涉密涉敏词库和规则库:对政务网站进行分析,将涉及到的涉密涉敏信息加入到涉密涉敏词库中,构建涉密涉敏词库,并根据词库特点定义规则库;S3、采集互联网信息,对其进行涉密涉敏信息检测,判断其涉密涉敏信息泄漏级别;S4、将涉密涉敏信息泄漏级别为严重以及重大级别的互联网信息通过短信、和\或微信、和\或邮件的方式通知用户。另外,本发明还提供了一种对互联网信息进行涉密涉敏信息监测的系统,本发明的技术方案解决了当前对海量互联网信息进行涉密涉敏信息监测无法实时过滤,并且高误报得问题,能够高效、快速、准确地对互联网中的涉密涉敏相关信息进行识别。
-
公开(公告)号:CN119669763A
公开(公告)日:2025-03-21
申请号:CN202411836060.7
申请日:2024-12-13
Applicant: 开普云信息科技股份有限公司
IPC: G06F18/214 , G06N3/044 , G06N3/08 , G06N3/0499 , G06N3/006 , G06Q10/04 , G06Q50/26 , G06Q40/00 , G06Q50/40
Abstract: 本申请公开了一种特定人员的聚集场所模型的训练方法、装置、介质及设备,属于机器学习技术领域。获取特定人群的金融行为特征、交通行为特征和地理区域特征;根据金融行为特征和交通行为特征生成第一训练集,训练样本包括第一时段内的金融行为特征和交通行为特征、第二时段内的金融行为特征和交通行为特征,第二时段晚于第一时段;根据第一训练集训练RNN模型;根据金融行为特征、交通行为特征和地理区域特征生成第二训练集,训练样本包括金融行为特征、交通行为特征、地理区域特征以及标注信息,标注信息表示特定人员在某个时间出现在某个地理区域内的某个聚集场所的概率;根据第二训练集训练PSO‑ELM模型,以提高预测的准确率。
-
公开(公告)号:CN116843515A
公开(公告)日:2023-10-03
申请号:CN202310626537.8
申请日:2023-05-30
Applicant: 开普云信息科技股份有限公司
Abstract: 本申请公开了一种跨语种的专利文本检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的第一查询文本;利用转换模型将第一查询文本转换为第二查询文本,第一查询文本是基于第一语言的文本,第二查询文本是基于第二语言的文本;利用BERT模型从分类号库中筛选与第二查询文本相似的多个IPC分类号;利用BERT模型从专利文本库中筛选与多个IPC分类号对应的多篇专利文本,专利文本是基于第二语言的文本;利用BERT模型对第二查询文本和多篇专利文本进行检索,得到检索结果。本申请可以先进行语种转换,再利用IPC分类号对专利文本进行初选,以缩小专利文本的检索范围,从而提高了检索效率。
-
-
-
-
-
-
-
-
-