KR102225404B1 - Method and Apparatus of Speech Recognition Using Device Information

    公开(公告)号:KR102225404B1

    公开(公告)日:2021-03-09

    申请号:KR1020140062586A

    申请日:2014-05-23

    CPC classification number: G10L15/30 G10L15/02 G10L15/183

    Abstract: 적어도 하나 이상의 음향 모델을 저장하고, 외부의 디바이스로부터 상기 디바이스를 식별할 수 있는 디바이스 ID를 획득하고, 상기 디바이스로부터 음성 데이터를 획득하고, 상기 디바이스 ID에 기초하여 음향 모델을 선택하고, 상기 선택된 음향 모델, 문법적 모델인 언어 모델, 및 발음에 관한 사전을 이용하여 상기 음성 데이터에 대하여 음성인식을 수행하고, 상기 음성인식의 결과를 출력하는, 디바이스 정보를 이용하는 음성인식 방법이 개시된다.

    전자 장치 및 그의 제어 방법
    2.
    发明申请

    公开(公告)号:WO2022139124A1

    公开(公告)日:2022-06-30

    申请号:PCT/KR2021/012902

    申请日:2021-09-17

    Inventor: 한주범 한창우

    Abstract: 전자 장치 및 그 제어 방법이 제공된다. 제어 방법은 마이크로폰을 통해 수신된 오디오 신호에 기초하여, 사용자가 대중 교통에 탑승한 상태인지 판단하는 단계, 상기 오디오 신호가 상기 대중 교통의 음향 기기를 통해 출력된 음성 신호를 포함하는지 감지하는 단계, 상기 음향 기기로부터 출력된 음성 신호가 복수의 정류장 중 적어도 하나의 정류장을 안내하기 위한 음성 신호를 포함하는지 판단하는 단계 및 상기 적어도 하나의 정류장에 대한 정보를 출력하는 단계를 포함한다.

    전자 장치 및 이의 제어 방법
    3.
    发明申请

    公开(公告)号:WO2022086045A1

    公开(公告)日:2022-04-28

    申请号:PCT/KR2021/014195

    申请日:2021-10-14

    Abstract: 전자 장치 및 이의 제어 방법이 개시된다. 본 개시에 따른 전자 장치의 제어 방법은, 타겟 화자의 복수의 음성 데이터를 획득하는 단계; 상기 복수의 음성 데이터 중 제1 음성 데이터를 노이즈 데이터와 합성하여 제1 오디오 데이터를 획득하는 단계; 오디오 데이터에서 타겟 화자의 음성을 분리하기 위한 제1 신경망 모델에 상기 제1 오디오 데이터를 입력하여 제1 타겟 음성 데이터를 획득하는 단계; 상기 제1 타겟 음성 데이터와 상기 제1 음성 데이터를 비교하여 제1 손실 정보를 획득하는 단계; 화자를 식별하기 위한 제2 신경망 모델에 상기 복수의 음성 데이터를 각각 입력하여 타겟 화자에 대응되는 화자 식별 정보를 획득하고, 상기 제2 신경망 모델에 상기 제1 타겟 음성 데이터를 입력하여 제1 타겟 화자 식별 정보를 획득하는 단계; 상기 화자 식별 정보와 상기 제1 타겟 화자 식별 정보를 비교하여 제2 손실 정보를 획득하는 단계; 및 상기 제1 손실 정보 및 상기 제2 손실 정보를 바탕으로 상기 제1 신경망 모델을 학습하는 단계;를 포함한다.

    음성 인식을 위한 전자 장치 및 그 제어 방법

    公开(公告)号:WO2023068552A1

    公开(公告)日:2023-04-27

    申请号:PCT/KR2022/013533

    申请日:2022-09-08

    Abstract: 본 전자 장치는 음성 인식 모델 및 음성 인식 모델을 통해 획득한 제1 사용자 음성에 대응되는 제1 인식 정보를 저장하는 메모리, 상기 음성 인식 모델은 제1 네트워크, 제2 네트워크 및 제3 네트워크를 포함하고, 및 제2 사용자 음성을 에 대응되는 음성 데이터를 상기 제1 네트워크에 입력하여 제1 벡터를 획득하고, 제1 인식 정보를 제1 가중치 정보에 기초하여 벡터를 생성하는 상기 제2 네트워크에 입력하여 제2 벡터를 획득하고, 제1 벡터 및 제2 벡터를 제2 가중치 정보에 기초하여 인식 정보를 생성하는 제3 네트워크에 입력하여 제2 사용자 음성에 대응되는 제2 인식 정보를 획득하는 프로세서를 포함하고, 제2 가중치 정보 중 적어도 일부는 제1 가중치 정보와 동일하다.

    전자 장치, 그 제어 방법 및 전자 시스템

    公开(公告)号:WO2022108075A1

    公开(公告)日:2022-05-27

    申请号:PCT/KR2021/012656

    申请日:2021-09-16

    Abstract: 전자 장치는 마이크, 제1 신경망 모델 및 제2 신경망 모델이 저장된 메모리, 통신 인터페이스 및 마이크, 메모리 및 통신 인터페이스와 연결되며, 마이크를 통해 사용자 음성이 수신되면 사용자 음성을 제1 신경망 모델에 입력하여 연산 결과를 획득하고, 연산 결과를 제2 신경망 모델에 입력하여 사용자 음성에 대응되는 적어도 하나의 기기를 식별하며, 연산 결과를 적어도 하나의 기기로 전송하도록 통신 인터페이스를 제어하는 프로세서를 포함하고, 제1 신경망 모델은 음성으로부터 텍스트를 식별하도록 학습된 제3 신경망 모델의 일부 레이어 만이 추가 학습된 후 추가 학습된 일부 레이어 만을 포함하도록 구성된 모델이며, 제2 신경망 모델은 음성에 대응되는 기기를 식별하도록 학습된 모델일 수 있다.

    전자 장치 및 전자 장치의 개인화된 음성 처리 방법

    公开(公告)号:WO2022265210A1

    公开(公告)日:2022-12-22

    申请号:PCT/KR2022/005415

    申请日:2022-04-14

    Abstract: 다양한 실시예에 따른 전자 장치는, 사용자의 음성을 포함하는 오디오 신호를 수신하는 마이크와, 인스터럭션들을 저장하는 메모리와, 상기 메모리와 전기적으로 연결되고, 상기 인스트럭션들 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의한 상기 인스트럭션들의 실행은, 상기 프로세서의 복수의 동작들을 야기하고, 상기 복수의 동작들은, 제1 출력 결과를 생성하기 위해 상기 오디오 신호로부터 노이즈를 제거하는 단계와, 제2 출력 결과를 생성하기 위해 상기 오디오 신호에 화자 분리를 수행하는 단계와, 상기 제1 출력 결과 및 상기 제2 출력 결과에 기초하여 상기 오디오 신호에 대응하는 명령을 처리하는 단계를 포함한다.

    전자 장치 및 그 제어 방법
    7.
    发明申请

    公开(公告)号:WO2022169038A1

    公开(公告)日:2022-08-11

    申请号:PCT/KR2021/007818

    申请日:2021-06-22

    Abstract: 전자 장치 및 그 제어 방법이 개시된다. 전자 장치는 이미지 데이터 및 음성 데이터를 포함하는 컨텐츠를 수신하는 통신 인터페이스, 단어 간의 연관성이 학습된 언어 컨텍스처 모델을 저장하는 메모리, 프로세서 및 디스플레이를 포함하고, 프로세서는 이미지 데이터에 포함된 오브젝트 및 문자를 추출하고, 오브젝트의 오브젝트 이름 및 문자를 식별하며, 식별된 오브젝트의 이름 및 식별된 문자에 기초하여 이미지 데이터와 관련된 이미지 관련 단어를 포함하는 바이어스 키워드 리스트를 생성하고, 바이어스 키워드 리스트 및 언어 컨텍스처 모델에 기초하여 음성 데이터를 텍스트로 변환하며, 음성 데이터로부터 변환된 텍스트를 자막으로 표시하도록 디스플레이를 제어한다.

    전자 장치 및 이의 제어 방법
    8.
    发明申请

    公开(公告)号:WO2022025428A1

    公开(公告)日:2022-02-03

    申请号:PCT/KR2021/007655

    申请日:2021-06-18

    Abstract: 전자 장치의 제어 방법이 개시된다. 본 개시에 따른 전자 장치의 제어 방법은 텍스트를 입력받는 입력 영역을 포함하는 화면을 표시하는 단계, 사용자 음성을 수신하고, 사용자 음성에 대응되는 텍스트를 획득하는 단계, 획득된 텍스트를 입력 영역에 입력하여 입력 영역에 대응되는 서비스 동작을 수행하는 단계 및 서비스 동작의 수행 결과에 따라, 확인된 텍스트와 발음이 유사한 복수의 유사 텍스트를 획득하고, 획득된 복수의 유사 텍스트를 순차적으로 입력 영역에 입력하여 서비스 동작을 반복적으로 수행하는 단계를 포함한다.

    전자 장치 및 전자 장치의 제어 방법

    公开(公告)号:WO2020080753A1

    公开(公告)日:2020-04-23

    申请号:PCT/KR2019/013356

    申请日:2019-10-11

    Abstract: 사용자 인터페이스를 통해 사용자 음성에 대응되는 텍스트 정보를 제공할 수 있는 전자 장치 및 이의 제어 방법이 제공된다. 구체적으로, 본 개시에 따른 전자 장치는 적어도 하나의 오브젝트를 포함하는 이미지가 획득되면 이미지를 분석하여 이미지에 포함된 적어도 하나의 오브젝트를 식별하고, 사용자 음성이 수신되면 사용자 음성에 대한 음성 인식을 수행하여 사용자 음성에 대응되는 텍스트 정보를 획득하며, 이미지에 포함된 적어도 하나의 오브젝트 중 사용자 음성에 대응되는 오브젝트를 식별하고, 디스플레이 상의 영역 중 사용자 음성에 대응되는 것으로 식별된 오브젝트에 대응되는 영역 상에 텍스트 정보를 포함하는 메모 UI (User Interface)를 표시한다.

    음성 인식 시스템 및 방법
    10.
    发明公开
    음성 인식 시스템 및 방법 审中-实审
    语音识别系统及其方法

    公开(公告)号:KR1020160110085A

    公开(公告)日:2016-09-21

    申请号:KR1020160011838

    申请日:2016-01-29

    Abstract: 본개시는개인화웨이크업키워드를이용하여보다효과적으로음성을인식할수 있는기술을제공할수 있다. 이를위해, 디바이스는개인화웨이크업키워드모델을이용하여수신되는사용자의음성신호로부터웨이크업키워드를검출하고, 웨이크업키워드검출여부및 수신되는음성신호를음성인식서버로전송하고, 음성인식서버는웨이크업키워드검출여부에따라음성인식모델을설정하여사용자의음성신호에대한인식처리를수행할수 있다.

    Abstract translation: 本公开可以提供通过使用个性化唤醒关键字来有效地识别语音的技术。 为此,设备通过使用个性化的唤醒关键字模型从接收到的用户的语音信号中检测唤醒关键词,发送是否检测到唤醒关键字或接收到的语音信号到语音识别服务器。 语音识别服务器根据是否检测到唤醒关键字来设置语音识别模型,并且可以对用户的语音信号执行识别处理。 因此,可以提供准确的语音识别功能。

Patent Agency Ranking