-
公开(公告)号:CN118466889A
公开(公告)日:2024-08-09
申请号:CN202410594655.X
申请日:2019-10-11
Applicant: 三星电子株式会社
IPC: G06F3/16 , G06F3/0481 , G06F3/04842 , G06F3/04883 , G06N3/08 , G06V10/764 , G10L15/22 , G10L15/26
Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。
-
公开(公告)号:CN110088833B
公开(公告)日:2024-04-09
申请号:CN201780078456.1
申请日:2017-12-14
Applicant: 三星电子株式会社
Abstract: 提供了一种语音识别方法和语音识别装置,其预先下载预测使用的语音识别模型并在语音识别中使用语音识别模型。所述语音识别方法,由所述语音识别装置执行,包括:基于用户信息确定语音识别模型,下载语音识别模型,基于语音识别模型执行语音识别,以及输出执行语音识别的结果。
-
公开(公告)号:CN111787012B
公开(公告)日:2022-10-14
申请号:CN202010629273.8
申请日:2015-11-09
Applicant: 三星电子株式会社
IPC: H04L9/40 , G10L15/183 , G10L15/30 , G10L15/06
Abstract: 本发明公开一种语音信号处理方法及实现此的终端和服务器。所述语音处理方法包括如下步骤:通过将标识ID映射到个人信息来产生映射表;通过使用映射表来产生基于ID的私密化模型;从服务器接收通过使用基于ID的私密化模型来对语音信号执行数据处理的结果;通过使用所述数据处理的结果和映射表来恢复与所述ID对应的个人信息。
-
公开(公告)号:CN113168837A
公开(公告)日:2021-07-23
申请号:CN201980076729.8
申请日:2019-11-22
Applicant: 三星电子株式会社
IPC: G10L17/14 , G16H50/30 , G10L17/02 , G10L17/18 , G10L17/08 , G10L15/02 , G10L17/00 , G10L17/04 , G10L15/04 , G10L17/26 , G10L25/15
Abstract: 提供了一种用于处理从说话者接收的语音的人声数据的方法和设备。所述方法包括:从接收自说话者的语音的人声数据提取说话者特征向量,通过将提取的说话者特征向量定位在多维向量空间上的特定位置处来生成说话者特征图,通过对位于说话者特征图上的至少一个说话者特征向量进行分组来形成指示多个说话者的人声的特征的多个集群,以及根据所述多个集群对所述多个说话者进行分类。
-
公开(公告)号:CN113140215A
公开(公告)日:2021-07-20
申请号:CN202110527107.1
申请日:2015-01-16
Applicant: 三星电子株式会社
IPC: G10L15/14 , G10L15/02 , G10L15/06 , G10L15/187 , G10L15/197 , G10L15/28
Abstract: 本申请公开了执行用户语音的语音识别的方法和电子设备。该电子设备包括:存储器,存储计算机可读指令;以及至少一个处理器,当运行计算机可读指令时,被配置为:获得基于由所述电子设备检测到的用户语音的第一音频数据,获得基于由第二电子设备检测到的用户语音的第二音频数据,确定第一音频数据的第一音频质量,确定第二音频数据的第二音频质量,基于第一音频质量和第二音频质量,选择第一音频数据和第二音频数据中的音频数据,选择所述电子设备和第二电子设备中的获得所选择的音频数据的电子设备,基于所选择的音频数据,执行用户语音的语音识别,并且在所选择的电子设备输出语音识别的结果。
-
公开(公告)号:CN111418008A
公开(公告)日:2020-07-14
申请号:CN201880077091.5
申请日:2018-11-29
Applicant: 三星电子株式会社
Abstract: 提供了一种语音辨识设备。语音辨识设备包括:至少一个麦克风,其被配置为从第一声源接收声音信号;以及至少一个处理器,其被配置为基于声音信号来确定第一声源的方向,确定第一声源的方向是否位于登记的方向上,以及基于第一声源的方向是否位于登记的方向上,从声音信号中辨识语音,而不管声音信号是否包括唤醒关键字。
-
公开(公告)号:CN101997071B
公开(公告)日:2015-06-10
申请号:CN201010256572.8
申请日:2010-08-17
Applicant: 三星电子株式会社
CPC classification number: H01L33/007 , H01L21/0237 , H01L21/02439 , H01L21/0254 , H01L21/02639 , H01L21/0265 , H01L27/156 , H01L33/0079 , H01L33/12 , H01L33/20
Abstract: 本发明涉及衬底结构及其制造方法。通过在缓冲层之下形成衬底的突出区域以及在缓冲层上形成半导体层而制造衬底结构,由此在除了在形成突出部的区域以外的区域将衬底与缓冲层分开。不与衬底接触的缓冲层上的半导体层具有独立特性,可以减少或防止位错或裂纹。
-
公开(公告)号:CN102682763B
公开(公告)日:2014-07-16
申请号:CN201110063938.4
申请日:2011-03-10
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
CPC classification number: G10L15/22 , G10L15/08 , G10L15/1815 , G10L2015/221
Abstract: 本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。
-
公开(公告)号:CN103839545A
公开(公告)日:2014-06-04
申请号:CN201310603916.1
申请日:2013-11-25
Applicant: 三星电子株式会社 , 戴尔莫尔感知人工智能研究所
IPC: G10L15/06
CPC classification number: G06F17/289 , G10L15/00
Abstract: 提供了一种用于构建多语言声学模型的设备和方法。用于构建多语言声学模型的方法包括:将输入特征划分为共同语言部分和区别语言部分,通过使用神经网络训练划分的共同语言部分和区别语言部分以估计和去除音素之间的相关性来获得串联特征,将使用串联特征构建的初始声学模型的参数划分为共同语言参数和区别语言参数,使用训练语言的数据适应于共同语言参数,使用目标语言的数据适应于区别语言参数,并使用适应的共同语言参数和适应的区别语言参数来构建针对目标语言的声学模型。
-
公开(公告)号:CN1655234B
公开(公告)日:2012-01-25
申请号:CN200510008224.8
申请日:2005-02-06
Applicant: 三星电子株式会社
CPC classification number: G10L25/93
Abstract: 本发明提供了一种用于鉴别口声的装置和方法。该装置包括:成帧单元,用于将一输入信号分成多个帧,每个帧具有一预定长度;音调提取单元,用于确定每个帧是一发音帧还是一非发音帧并所述帧的音调轮廓;零交叉速率计算器,用于计算每个帧的零交叉速率;参数计算器,用于计算包括由音调提取单元确定的发音帧和非发音帧的时间长度比、所述音调轮廓的统计信息和频谱特征的参数;和分类器,用于输入零交叉速率和从参数计算器输出的参数并确定输入信号是否是一口声。
-
-
-
-
-
-
-
-
-