音视频信息处理方法、装置、可读存储介质及终端设备

    公开(公告)号:CN111918126A

    公开(公告)日:2020-11-10

    申请号:CN201910387849.1

    申请日:2019-05-10

    Inventor: 包树南 王鹏

    Abstract: 本发明属于交流辅助技术领域,尤其涉及一种音视频信息处理方法、装置、计算机可读存储介质及终端设备。所述方法获取包括第一手势动作序列的第一视频;使用预设的第一神经网络模型识别所述第一视频的各帧图像的手部区域,并提取各帧图像的手部区域的子图像构造为手部区域视频;使用预设的第二神经网络模型对所述手部区域视频中进行处理,得到与所述第一手势动作序列对应的第一文本信息;使用预设的第三神经网络模型将所述第一文本信息转换为第一语音信息。即通过从手语到文本再到语音的一整套处理流程,实现了将手语的交流形式转换为语音的交流形式,使得没有学过手语的正常人也能够理解使用手语的聋哑人所要表达的意思。

    一种门锁控制方法、移动终端、门控终端及存储介质

    公开(公告)号:CN112132996A

    公开(公告)日:2020-12-25

    申请号:CN201910486871.1

    申请日:2019-06-05

    Inventor: 王鹏

    Abstract: 本发明涉及安防技术领域,尤其涉及一种门锁控制方法、移动终端、门控终端、门控系统、存储介质及终端设备。所述方法包括在接收到用户的门锁控制请求时,采集包含用户人脸的视频和用户的语音信息;从视频中截取多张人脸图像,将截取的多张人脸图像输入至活体检测模型,得到活体检测结果;当活体检测结果为检测到活体时,将多张人脸图像输入至基于用户的训练人脸图像训练得到的人脸特征提取模型,得到人脸特征参数,并将语音信息输入至基于用户的训练语音信息训练得到的声纹特征提取模型,得到声纹特征参数;根据语音信息确定门锁控制请求所对应的控制指令,并将控制指令、人脸特征参数和声纹特征参数发送至门控终端,以指示门控终端进行门锁控制。

    一种发音的纠正方法、智能终端及存储介质

    公开(公告)号:CN111370001A

    公开(公告)日:2020-07-03

    申请号:CN201811605128.5

    申请日:2018-12-26

    Inventor: 王鹏

    Abstract: 本发明公开了一种发音的纠正方法、智能终端及存储介质,方法包括:将用户的读音与用户语音数据库进行对比分析,提取出用户的读音中发音异常的音节;从预设的数据库中找出与所提取的发音异常的音节相匹配的语音进行播放。本发明通过将用户的读音与标准的发音进行对比分析,提取出发音异常的音节,有助于改善用户的发音标准性,此外,本发明还根据发音异常音节找出对应的文字,以供用户反复练习,提高用户的发音标准性。

    基于用户识别的开机内容推荐方法、智能电视及存储介质

    公开(公告)号:CN112312215A

    公开(公告)日:2021-02-02

    申请号:CN201910704161.1

    申请日:2019-07-31

    Inventor: 张文静 王鹏

    Abstract: 本发明公开了基于用户识别的开机内容推荐方法、智能电视及存储介质,所述方法包括:采集用户的语音或视频信号,判断用户是否发出唤醒电视的唤醒指令,若用户发出所述唤醒指令,则开启电视;电视开机后,收集用户声音信息和图像信息,分别利用声音信息和图像信息对用户进行身份识别,并综合声音识别结果和图像识别结果得到用户身份识别结果;根据所述用户的身份识别结果,在电视开机画面上显示相应的节目列表。本发明通过识别观看电视用户的身份,并根据用户身份或用户群组的不同特征向其推荐不同的内容列表作为开机内容,使得智能电视的开机内容更具个性化和普适性。

    一种会话翻译方法、装置、存储介质及终端设备

    公开(公告)号:CN111241853A

    公开(公告)日:2020-06-05

    申请号:CN201811446077.6

    申请日:2018-11-29

    Inventor: 张文静 王鹏

    Abstract: 本发明公开了一种会话翻译方法,包括:获取第一会话信息;确定接收第一会话信息的目标用户,并获取目标用户所设置的目标接收语言;添加与目标接收语言相对应的目标语言标签至第一会话信息中;将添加目标语言标签的第一会话信息输入至预训练完成的多语言神经网络机器翻译模型,获取多语言神经网络机器翻译模型输出的第二会话信息,其中,第二会话信息为第一会话信息翻译成目标接收语言后的会话信息;将第二会话信息发送至目标用户,以实现多语言会话中的实时翻译,解决不同语种之间沟通、交流困难的问题,从而满足人们日常工作、生活的需求。本发明还提供一种会话翻译装置、计算机可读存储介质及终端设备。

    目标定位方法及终端设备

    公开(公告)号:CN110726970A

    公开(公告)日:2020-01-24

    申请号:CN201810783230.8

    申请日:2018-07-17

    Inventor: 王鹏

    Abstract: 本发明涉及通信技术领域,提供了一种目标定位方法及终端设备。该方法包括:获取训练数据;根据各个第一距离值以及对应的第一信号强度值对第一信号传播模型进行训练;根据各个第二距离值以及对应的第二信号强度值对第二信号传播模型进行训练;根据所述预设位置坐标、各个第一距离值以及各个第二距离值对联合模型进行训练;保存定位模型,所述定位模型用于在目标终端运行时指示所述目标终端根据所述定位模型进行定位;所述定位模型包括训练后的第一信号传播模型、训练后的第二信号传播模型以及训练后的联合模型。本发明能够避免定位过程中目标终端与服务器的交互过程及交互延迟,能够减少定位所需的时间,提高定位效率。

    语句的调整方法及装置
    7.
    发明公开

    公开(公告)号:CN111310460A

    公开(公告)日:2020-06-19

    申请号:CN201811515760.0

    申请日:2018-12-12

    Inventor: 包树南 王鹏

    Abstract: 本发明适用于人工智能技术领域,提供了语句的调整方法及装置,包括:获取目标联系人在第一时间段内的聊天记录,并解析聊天记录对应的情感类别;若聊天记录对应的情感类别属于预设的情感类别集合,则接收用户输入的语句,并解析用户输入的语句对应的情感类别;若用户输入的语句对应的情感类别属于预设的情感类别集合,则将用户输入的语句转换为调整语句;显示调整语句或将所述调整语句发送至所述目标联系人,以更加智能化地对聊天时输入的语句进行调整,提高目标联系人对聊天的满意程度。

Patent Agency Ranking