基于高斯几何基元的视线估计方法、装置、设备和介质

    公开(公告)号:CN119919445A

    公开(公告)日:2025-05-02

    申请号:CN202411978781.1

    申请日:2024-12-30

    Inventor: 胡飞扬

    Abstract: 本发明涉及一种基于高斯几何基元的视线估计方法、装置、设备和介质。基于高斯几何基元的视线估计方法,包括:获取左右眼球移动时连续采集到的图像序列;根据图像序列对左右眼球进行三维重建,生成左右眼球模型,左右眼球模型是至少一组动态变化的高斯几何基元;对左右眼球模型中的高斯几何基元进行运动分析,确定左右眼球的旋转信息;根据左右眼球的眼球坐标系,计算左右眼球在世界坐标系中的视线交点,眼球坐标系是以左右眼球的眼球中心为原点、基于旋转信息构建的;利用视线交点估计视线方向,得到视线估计结果。本申请提供的方法,实现了高精度、低延迟的视线估计,减少了眼动追踪技术在实时应用中的限制。

    前庭功能检测系统及数据处理方法、电子设备及程序产品

    公开(公告)号:CN119908673A

    公开(公告)日:2025-05-02

    申请号:CN202510412965.X

    申请日:2025-04-03

    Abstract: 本发明公开了一种前庭功能检测系统及数据处理方法、电子设备及程序产品,其方法包括:获取受试者在前庭功能检测中的眼动视频;从眼动视频中提取受试者的眼动轨迹;眼动轨迹包括水平方向眼动轨迹、垂直方向眼动轨迹、扭转方向眼动轨迹中的一项或多项;获取受试者的辅助检测数据;辅助检测数据包括受试者在前庭功能检测中的体位数据和/或从眼动轨迹中获取的眼震特征参数;将眼动轨迹与辅助检测数据输入至训练好的神经网络模型,通过神经网络模型识别输出受试者的前庭功能数据;其中,眼动轨迹与辅助检测数据通过时间同步关联。本申请方案相比于只考虑眼动视频或眼动轨迹数据,体位数据或眼震特征参数的加入,使得评估的前庭功能数据更为准确。

    文本标注方法、装置及设备

    公开(公告)号:CN112906683B

    公开(公告)日:2025-05-02

    申请号:CN202110180619.5

    申请日:2021-02-08

    Abstract: 本说明书实施例涉及人工智能技术领域,具有公开了一种文本标注方法、装置及设备,所述方法包括:将待标注文本转换为待标注图片;利用眼球追踪技术对获得业务员对所述待标注图片的关注图像信息,所述关注图像信息包括所述业务员对所述待标注图片的关注区域和关注频率;根据所述待标注图片中的像素点和所述待标注文本的字符之间的对应关系,将所述关注图像信息转换为关注字符信息;基于光学字符识别技术对所述关注字符信息进行筛选,获得所述待标注文本的标注信息。不需要人工手动标注,实现了文本的自动化、无感标注,提高了文本标注的效率。

    一种用于交易监管的一体式信息采集设备

    公开(公告)号:CN119904921A

    公开(公告)日:2025-04-29

    申请号:CN202510409286.7

    申请日:2025-04-02

    Inventor: 王兴

    Abstract: 本发明公开了一种用于交易监管的一体式信息采集设备,涉及采集设备技术领域,包括设备箱;本发明通过控制模块和检测组件的配合,便于采集或验证人员身份信息,实现了采集和修改人员身份信息的能力,再通过控制模块和采集组件的配合,便于采集人员身体信息,实现了全面的信息收集能力;通过分析模块先进行身高验证,若身高数据检测异常则停止面部识别操作,降低了处理器的运算负担;节省了大量的存储空间,使设备的存储资源能够更高效地被利用;在精准确定瞳孔位置后再进行虹膜特征的采集和比对,能够确保虹膜区域划分准确无误,极大地提高了虹膜特征提取的完整性和准确性,有效避免了因虹膜区域划分不准确而导致的身份验证错误问题。

    用户眼睛模型匹配检测
    7.
    发明公开

    公开(公告)号:CN119895471A

    公开(公告)日:2025-04-25

    申请号:CN202380065927.0

    申请日:2023-09-22

    Applicant: 苹果公司

    Abstract: 公开了用于在设备中提供眼睛模型匹配的方法和装置。当用户激活设备并且检测到该用户的眼睛的存在时,捕获该用户的眼睛的图像。然后实现眼睛模型匹配过程以确定与所捕获的图像中的眼睛最佳匹配的存储的眼睛模型(例如,在该设备上注册该眼睛之后存储的眼睛模型)。该最佳匹配眼睛模型的确定可基于所捕获的图像中的该用户的眼睛的特性(诸如角膜和瞳孔特征)与由该眼睛模型确定的该用户的眼睛的特性之间的匹配。然后可在例如眼睛注视跟踪过程中实现最佳匹配眼睛模型。在某些情况下,该最佳匹配眼睛模型在于下游过程中实现之前满足匹配的阈值。

    一种视网膜图像分层模型训练方法、装置、设备和介质

    公开(公告)号:CN119888405A

    公开(公告)日:2025-04-25

    申请号:CN202411954948.0

    申请日:2024-12-27

    Abstract: 本发明提供了一种视网膜图像分层模型训练方法、装置、设备和介质,涉及图像处理技术领域,包括:获取初始视网膜图像以及对应的至少一个病变标签,并输入至多标签划分模型中,得到初始训练集和验证集;将初始训练集输入至预处理模块中,进行增广处理,得到训练集;预处理模块包括串联连接的多个类型的预处理单元,各预处理单元按照预设概率对输入图像进行增广处理;基于训练集和验证集对初始视网膜图像分层模型进行训练,得到视网膜图像分层模型;视网膜图像分层模型包括多个编码层和多个解码层;解码层包括深度卷积层、逐点卷积层和自注意力模块。本发明实施例的技术方案能够提高视网膜图像分层模型的训练效果,减少模型的计算量。

    一种具有管控功能的教育平板系统

    公开(公告)号:CN119883081A

    公开(公告)日:2025-04-25

    申请号:CN202411967867.4

    申请日:2024-12-30

    Abstract: 本发明涉及教育平板领域,尤其涉及一种具有管控功能的教育平板系统,本发明通过设置双目检测模块、动作分析模块、切换分析模块、特征分析模块以及管控模块,通过获取检测目标的图像数据解析注视动作特征,划分检测目标当前的注视动作类别,在强注视动作类别下,依据当前浏览页面以及预切换浏览页面中视觉图像特征的差异,判定是否符合视觉刺激标准,以对预切换浏览页面进行优化,后续基于视觉受激时域段内的瞳孔变化特征计算视觉影响参数,以对应发出管控提示,本发明能获取检测目标的注视动作特征,及时发现页面切换过程中对视觉造成刺激的情况并及时干预,并且及时发出管控提示,减少对视觉的刺激以及影响,提高使用者使用体验。

    一种DMS驾驶员分心识别系统

    公开(公告)号:CN119418314B

    公开(公告)日:2025-04-25

    申请号:CN202510016442.3

    申请日:2025-01-06

    Inventor: 邹定远

    Abstract: 本发明属于汽车驾驶研究技术领域,本发明公开了一种DMS驾驶员分心识别系统;包括:采集驾驶员三维头部参数,根据驾驶员三维头部参数建立驾驶员三维头部模型;根据驾驶员三维头部模型采用光线追踪算法,计算获取驾驶员正视前方视野范围;根据深度学习算法构建用于预测驾驶员视线方向的驾驶员视线方向预测模型;采集驾驶员三维头部姿态数据;将驾驶员三维头部姿态数据输入驾驶员视线方向预测模型;当驾驶员视线方向预测模型预测得到的驾驶员视线方向不在正视前方视野范围时,则为驾驶员分心;并进行多模态警示反馈;有效提高驾驶安全性;有效应对驾驶安全隐患。

Patent Agency Ranking