-
公开(公告)号:CN116311209A
公开(公告)日:2023-06-23
申请号:CN202310316512.8
申请日:2023-03-28
Applicant: 北京匠数科技有限公司
IPC: G06V20/62 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种窗口检测方法、系统和电子设备,包括:通过预先训练好的目标检测模型检测显示界面中的目标点,得到目标点的标注信息;其中,目标点包括前景窗口的顶点,以及前景窗口彼此之间的交叉点;标注信息包括中心点坐标、标签值;基于目标点生成交点集合;其中,交点集合为满足预设矩形线段规则的点构成的集合;从交点集合中筛选出包含至少三个交点的目标交点集合;基于目标交点集合确定矩形窗口。该方式中,通过获取前景窗口中未遮挡的目标点,并通过这些目标点构建矩形窗口的方式,从而精准识别当前显示界面的前景窗口,减小窗口识别的误差。
-
公开(公告)号:CN115935433B
公开(公告)日:2023-05-26
申请号:CN202310024081.8
申请日:2023-01-09
Applicant: 北京匠数科技有限公司
Abstract: 本发明提供了屏幕实时隐私保护方法和装置,包括:对第一视频流进行提取得到M帧图像;普通模式下,将每帧图像通过图像隐私区域检测算法得到图像组帧,将图像组帧进行组合后得到第二视频流;自适应模式下,从M帧图像中选取任一帧图像作为当前帧图像;通过图像相似性检测算法判断当前帧图像是否进行窗口检测;如果否,则将上一帧图像的模糊区域坐标进行模糊处理;如果是,则将当前帧图像通过图像隐私区域检测算法得到第一图像与模糊区域坐标,重复自适应模式的过程,直至每帧图像均被遍历;加速模式下,将M帧图像通过图像隐私区域检测算法,得到第二图像与模糊区域坐标;将第一图像与模糊区域坐标或第二图像与模糊区域坐标进行模糊处理。
-
公开(公告)号:CN115809662A
公开(公告)日:2023-03-17
申请号:CN202310054923.4
申请日:2023-02-03
Applicant: 北京匠数科技有限公司
IPC: G06F40/284 , G06F40/237 , G06F40/242 , G06F18/22 , G06F18/2433 , G06N3/0455
Abstract: 本申请提供了一种文本内容异常检测的方法、装置、设备及介质,该方法包括:获取目标文本,并构造字典文件;从目标文本中确定待掩码字符并从多个目标类型中确定匹配每一个待掩码字符的特定目标类型;选取并使用目标替换字符替换该待掩码字符,得到训练数据;使用训练数据训练初始语言模型,得到文本内容异常检测模型;将待检测文本输入到文本内容异常检测模型中,得到还原文本;使用预设的目标违规词库对还原文本进行检测,确定异常内容。本申请使用了更加全面的替换字符,以使得到的文本内容异常检测模型更加符合实际应用场景,能够针对文本中的拼音相关内容进行处理,以使文本内容异常检测模型具有拼写纠错、拼音还原、无意义字符去除等功能。
-
公开(公告)号:CN115761383A
公开(公告)日:2023-03-07
申请号:CN202310014977.8
申请日:2023-01-06
Applicant: 北京匠数科技有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/82 , G06T3/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种图像分类方法、装置、电子设备及介质,所述方法包括:将目标图像输入至训练好的图像分类模型,通过所述图像分类模型,将所述目标图像进行缩放,得到目标图像的多个不同尺寸的图像;将多个不同尺寸的图像拼接为一个多尺度图像,提取出所述多尺度图像的原始图像特征张量;在空间维度上展平所述多尺度图像的原始图像特征张量,得到目标图像的多尺度图像特征张量;根据所述多尺度图像特征张量,识别出目标图像中每个目标物体的类别,并输出目标图像中每个目标物体的类别,从而能够精准的对大分辨率图像进行分类,识别精度高,分类效果好,图像分类模型的训练成本低。
-
公开(公告)号:CN115630645A
公开(公告)日:2023-01-20
申请号:CN202211552883.8
申请日:2022-12-06
Applicant: 北京匠数科技有限公司
IPC: G06F40/289 , G06F40/30 , G06F16/35
Abstract: 本申请提供了一种文本纠错方法、装置、电子设备及介质,方法包括:将目标业务领域的目标句子输入至训练好的专有短语纠错模型,通过所述专有短语纠错模型判断所述目标句子中是否存在专有短语;若不存在,则确定纠错结果为所述目标句子中不存在专有短语;若存在,则确定出所述目标句子对应的专有短语标签,并根据专有短语标签从所述目标句子中确定出目标片段;当判断目标片段与专有短语标签相同时,确定纠错结果为所述目标句子中专有短语正确;当判断目标片段与专有短语标签不一致时,确定目标句子中的专有短语错误,并确定纠错结果为专有短语标签和目标片段;本申请考虑句子语义识别出句子的专有短语是否错误,精确度高,且计算量小。
-
公开(公告)号:CN112712080B
公开(公告)日:2021-09-28
申请号:CN202110021188.8
申请日:2021-01-08
Applicant: 北京匠数科技有限公司
Abstract: 本发明公开了一种用于走字屏采集图像的文字识别处理方法,文字检测模型输出的特征图上分别由文字区域和背景区域两种值,通过掩码从走字屏采集图像提取文字区域;文字识别模型的输入图像为预设尺寸,文字识别模型的输出为字符类别,通过查询类别值与计算机字符的映射关系得到字符区域文字区域;根据字符区域文字区域所在的行坐标进行聚合,并按照每个字符行坐标从左到右的顺序将字符组成字符串;文字检测模型的训练阶段引入文字边缘和文字间隙图像作为训练数据,推理阶段,当采样窗口的中心落在文字边缘或在两个文字的中间空隙时,将最终的特征值定义为背景。本发明能够模拟走字屏文字特征,生成特征训练数据,使得模型能够实现对走字屏文字的针对性训练,训练效果好。
-
公开(公告)号:CN112416276B
公开(公告)日:2021-07-23
申请号:CN202011091624.0
申请日:2020-10-13
Applicant: 北京匠数科技有限公司
Abstract: 本申请属于画面数据处理领域,公开了一种显示画面解析装置、系统及方法,其中,装置包括:输入接口,接收接收卡发来的画面驱动信号;画面重构模块,对接收的画面驱动信号进行采样解析,解析成局部显示画面,对局部显示画面进行重组,形成完整的采集画面;画面解析模块,对接收到的完整的采集画面进行解析,确定完整的采集画面中是否含有不良信息,若含有不良信息,则生成拦截指令,否则生成透传指令;拦截开关,若接收到拦截指令,则将输入接口传送的画面驱动信号拦截,若接收到透传指令,则将画面驱动信号透传;输出接口,接收画面驱动信号并输出。这样,本方案提出的画面重构方案能够适应各种型号的显示屏幕,将含有不良信息的画面进行拦截。
-
公开(公告)号:CN112379856B
公开(公告)日:2021-07-06
申请号:CN202011091609.6
申请日:2020-10-13
Applicant: 北京匠数科技有限公司
Abstract: 本申请属于视频数据处理领域,公开了一种显示画面重构装置及方法,其中,装置包括:输入接口,与至少一个接收卡相连,用于接收接收卡发来的画面驱动信号,其中,接收卡将终端设备输出的画面信息转换成对应的画面驱动信号;画面重构模块,与输入接口相连,用于接收输入接口发来的画面驱动信号,对画面驱动信号进行采样解析,解析成局部显示画面,对局部显示画面进行重组,形成完整的采集画面;输出接口,与画面重构模块相连,用于接收画面重构模块发来的完整的采集画面并输出。这样能够将各个接收卡对应的画面进行整合重构处完整的采集画面,进而更加便于利用视频分析装置对重构出的采集画面进行分析处理。
-
公开(公告)号:CN112733932A
公开(公告)日:2021-04-30
申请号:CN202110021199.6
申请日:2021-01-08
Applicant: 北京匠数科技有限公司
Abstract: 基于训练数据相似度聚合的模型加速训练方法及装置,以一份最小化的训练数据作为起始,在每个轮次中应用随机采样和随机增量的方式从当前模型的预测结果中提取预测不佳的数据,并且用聚类提取方式采样额外的训练数据,从而获取最具有代表性的训练信息,提高每个轮次的训练效率。本发明减少每个轮次模型训练的数据集规模,训练时间大幅减少,聚类不需要精确结果,可减少迭代次数或使用更快速简单的聚类方法,总体上每个轮次总训练时间仍比原有全训练集训练减少很多;每个轮次选择的训练数据均有针对性,选用推理错误的图像训练,能够最大程度的获取反向传播梯度,降低训练时陷入局部最优解的概率,便于在训练过程中动态调整,以达到最佳训练结果。
-
公开(公告)号:CN112733858A
公开(公告)日:2021-04-30
申请号:CN202110021200.5
申请日:2021-01-08
Applicant: 北京匠数科技有限公司
Abstract: 基于字符区域检测的图像文字快速识别方法及装置,利用卷积层将目标图像的通道数转换为类别个数;通过文字区域检测模型生成目标图像按比例缩小的特征图;将生成的掩码与目标图像叠加获得到包含文字的区域子图像;对区域子图像文字间隙识别,将文字间隙标记为背景,使掩码图中每个文字字符分隔开;通过掩码图对区域子图像字符区域提取,获得每个字符的字符区域;对掩码图进行横向闭运算合成一个闭合区域,提取闭合区域的矩形轮廓获得一行文字的整体区域,利用初始的掩码图提取整体区域的每个字符区域,将提取的整体区域的每个字符区域从左到右排序,将排序后的字符区域按照行组合。本发明采用较小的神经网络即可实现,推理速度快,占用资源少。
-
-
-
-
-
-
-
-
-