-
公开(公告)号:CN119048744B
公开(公告)日:2025-03-28
申请号:CN202411521052.3
申请日:2024-10-29
Applicant: 深圳爱莫科技有限公司
Abstract: 本发明提供了一种基于计算机视觉卷烟识别和数量统计方法,包括以下步骤:步骤一:获取并识别三类目标检测区域,区分条烟的不同面,包括条烟面、端头面和特殊四边形区域;步骤二:建立特殊四边形区域的关联机制,判断是否存在与条烟面和端头面相关的特殊四边形区域。本发明通过在检测阶段自动识别条烟面、端头面和特殊四边形区域,并根据四边形区域直接关联条烟面与端头面,避免了重复识别和漏识别的情况,通过此关联机制,条烟识别准确率显著提升,大幅提升了系统的整体识别性能;本发明通过自动关联条烟面与端头面,并结合得分机制对品规进行筛选,本发明能够准确确定每条烟的唯一性,数量统计准确率提升,确保了统计结果的精确性和可靠性。
-
公开(公告)号:CN118553000B
公开(公告)日:2024-11-22
申请号:CN202410996709.5
申请日:2024-07-24
Applicant: 深圳爱莫科技有限公司
IPC: G06V40/16 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/30 , G06V10/80 , G06V10/82
Abstract: 本发明提供了一种基于生成式人工智能的图像产生方法、装置、设备以及存储介质,输入待处理的文本提示词,根据所述文本提示词通过文本编码,得到文本特征;获取人脸图像信息,所述人脸图像信息包括图像编码和人脸特征提取;根据所述图像编码通过解耦的交叉注意力层对图像特征提示输入,并通过图像交叉注意模块嵌入到扩散空间;通过额外的人脸特征提取器提取人脸特征,并通过特征对齐模块,将包含有高语义的特征融合至扩散空间中,作为人脸生成的重要提示;保持较高质量的生成图的同时,能有效提升生成人脸的相似度,用单独的人脸特征提取器进行人脸特征提取,在模型采样迭代中进行人脸特征融合,以此保证人脸的生成方向控制。
-
公开(公告)号:CN118569653A
公开(公告)日:2024-08-30
申请号:CN202411053154.7
申请日:2024-08-02
Applicant: 深圳爱莫科技有限公司
IPC: G06Q10/0635 , G06Q50/18 , G06V30/42 , G06V30/41 , G06V30/19
Abstract: 本申请公开了一种基于大语言模型的专利风险评估方法,包括:提取多个专利文件的图片信息以及非图片信息,从每个专利文件的图片信息中提取专利文件的图像数据,从每个专利文件的非图片信息中提取专利文件的文字数据;对每个专利文件的文字数据以及图像数据分别进行编码,利用经编码的文字数据和经编码的图像数据构建专利库;基于专利库对待分析文件进行对比分析,获得待分析文件的相似度结果。本申请能够提升专利相似度评价的准确性,还能够显著提高工作效率,减轻专利审查员和研究人员的负担,为专利审查和技术创新提供有力支持。
-
公开(公告)号:CN113850258B
公开(公告)日:2024-08-23
申请号:CN202111124778.X
申请日:2021-09-25
Applicant: 深圳爱莫科技有限公司
IPC: G06V20/62
Abstract: 本申请公开了一种提取文档中文本行的方法、系统、设备及存储介质,其中,所述方法包括:获取文档图像;基于文档图像,确定文档首行的行标志文本块;基于首行的行标志文本块,对首行的文本行进行文字提取;待首行的文本行的文字提取完成后,获取相邻行的行标志文本块;基于相邻行的行标志文本块,对相邻行的文本行进行文字提取;待上一行的文本行的文字提取完成后,再次进行下一相邻行的行标志文本块的获取以及文本行提取,直至所有的文本行提取完成,通过本申请上述方案,能够准确高效地实现文档的文本行提取,提取过程简单直观,适用性强。
-
公开(公告)号:CN117274887B
公开(公告)日:2024-07-05
申请号:CN202311558702.7
申请日:2023-11-22
Applicant: 深圳爱莫科技有限公司
Abstract: 本发明公开了一种条烟端头检测方法及条烟规格和数量的识别方法,涉及计算机视觉技术领域,解决了拍摄的照片上条烟包裹不规整,会导致出现漏检的技术问题。该方法包括以下步骤:S1、通过训练得到欧拉角预测模型和端头检测模型;S2、将待检测的条烟图片输入所述欧拉预测模型,得到所述条烟图片中,条烟端头面的欧拉角;其中,所述条烟图片包括多盒条烟;S3、根据所述欧拉角,对所述条烟图片进行矫正,得到条烟矫正图片;S4、将所述条烟矫正图片输入所述端头检测模型,得到所述条烟图片中所有条烟端头的顶点坐标。本发明通过对条烟的端头面进行矫正,能够有效的避免漏检问题。
-
公开(公告)号:CN118095443A
公开(公告)日:2024-05-28
申请号:CN202410478429.5
申请日:2024-04-19
Applicant: 深圳爱莫科技有限公司
IPC: G06N5/04 , G06N20/00 , G06F16/9532 , G06F16/332 , G06F40/247 , G06F40/30
Abstract: 本发明涉及互联网技术领域,尤其涉及一种根据事实进行文字生成大模型的训练方法、设备。包括步骤:基于用户输入的内容获取至少一个关键词/句;根据关键词/句获取与关键词/句相关联领域的网页信息;根据关键词/句对网页信息的内容进行标注后生成网页结构的提取数据集;根据数据集对网页结构的预测模型进行优化后建立优化模型,并将优化模型集成至一信息检索系统中;根据优化模型对网页信息进行清洗获取纯文字信息;将关键词/句和纯文字信息输入至LLM大模型中以获取优化信息。解决了检索信息时,网页数据质量低的技术问题。
-
公开(公告)号:CN118093790A
公开(公告)日:2024-05-28
申请号:CN202410488986.5
申请日:2024-04-23
Applicant: 深圳爱莫科技有限公司
IPC: G06F16/33 , G06F40/30 , G06F40/205
Abstract: 本发明公开了一种检索增强的大语言模型生成优化方法。本发明包括如下步骤:S1、获取用户的检索需求;S2、根据检索需求,获取多个检索结果,其中,检索结果包括多个文本信息和多个历史对话;S3、根据每个检索结果和检索需求,得到每个检索结果和检索需求之间的目标语义距离;S4、对每个目标语义距离进行排序,得到检索需求的数组,并依次对数组中的每个元素进行字节处理,得到大语言模型的上下文信息。本发明能够基于目标语义距离提高上下文信息的相关性,同时能够得到符合大语言模型输入要求的上下文信息以使大语言模型减少崩溃,也即能够在长度以及内容维度上得到最符合大语言模型输入的上下文信息。
-
公开(公告)号:CN118072128A
公开(公告)日:2024-05-24
申请号:CN202410478451.X
申请日:2024-04-19
Applicant: 深圳爱莫科技有限公司
IPC: G06V10/774 , G06V10/26 , G06V10/40
Abstract: 本发明公开了一种细粒度多模态大模型训练方法,包括如下步骤:S1、获取烟包陈列图像,将烟包陈列图像输入语义分割模型;S2、语义分割模型对烟包陈列图像进行分割,生成烟包分割图像,烟包分割图像包括每个烟包的陈列位置信息;S3、将烟包分割图像输入至图像识别模型,生成烟包信息,每个烟包信息包括烟包品牌、规格、商标、公司以及烟包价格;S4、将每个烟包的烟包信息和烟包分割图像的陈列位置信息进行结构化处理,得到每个烟包的文本信息,并输入至大语言模型;S5、基于用户提问,大语言模型根据每个烟包的文本信息输出用户提问对应的烟包陈列信息。本发明能够使大语言模型所输出的烟包陈列信息与用户的提问更加契合。
-
公开(公告)号:CN117237743B
公开(公告)日:2024-02-27
申请号:CN202311484260.6
申请日:2023-11-09
Applicant: 深圳爱莫科技有限公司
IPC: G06V10/764 , G06N3/0464 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种小样本快消品识别方法、存储介质及处理设备,涉及计算机视觉技术领域。本方法包括:从第一样本中提取产品的类别特征,根据第一样本的类别特征通过主成分分析得到第一样本的类别特征对应的主成分和基矩阵;从小样本中提取产品的类别特征,计算小样本的每个类别特征对应的中心点;根据主成分仿真得到小样本的类别特征对应的主成分权值,根据基矩阵、主成分权值以及中心点计算小样本的仿真类别特征,重复执行本步骤预设次数得到多个仿真类别特征;将多个仿真类别特征用于训练识别网络,训练的识别网络用于产品的识别。本方法适用于针对样本不足的新规格产品的快速识别。
-
公开(公告)号:CN116166688A
公开(公告)日:2023-05-26
申请号:CN202310151075.9
申请日:2023-02-14
Applicant: 深圳爱莫科技有限公司
IPC: G06F16/242 , G06N3/045 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种基于自然语言交互的业务数据检索方法、系统及处理设备,涉及自然语言处理技术领域,解决了现有自然语言交互数据检索系统一般只能一次性输入要查询的内容,影响了查询的准确率和流畅度的技术问题。该方法包括:对对话场景进行整理,将查询概率超过设定阈值的对话场景设置为独立意图;基于独立意图的数据,经处理后生成训练样本,得到对话过程管理模块;用户输入查询意图,对话过程管理模块判断是否满足最低查询条件,若是,输出查询结果,否则,提示用户增加和/或修改查询条件。本发明中用户可进行查询条件的补充和/或修改,查询的准确率和流畅度得到大大提高,用户的使用体验也更好。
-
-
-
-
-
-
-
-
-