-
公开(公告)号:KR102235645B1
公开(公告)日:2021-04-02
申请号:KR1020190135595A
申请日:2019-10-29
Applicant: 서울대학교산학협력단
CPC classification number: H04B7/0413 , G06N3/0454 , G06N3/08 , H02J50/80 , H04B17/30 , H04W88/08
Abstract: 본 발명은 심층강화학습 모델을 이용하여, 다중 기지국 대용량 안테나 시스템에서 에너지 하베스팅을 수행할 기지국을 결정하는 방법 및 장치를 제공한다.
본 발명에서는, 사용자 단말들 각각의 하향링크 채널 정보, 사용자 단말들 각각의 데이터 요구량 및 기지국들 각각의 전송 전력 조건을 이용하여 현재 상태를 생성하고, 현재 상태에 기초하여, 에너지 하베스팅을 수행할 기지국을 선택하는 행동을 결정할 수 있으며, 결정된 행동에 따른 사용자 단말들의 총 데이터 전송률을 보상으로 획득할 수 있다.
본 발명에서는 현재 상태, 행동 및 보상을 이용하여, 보상이 최대가 되도록 심층강화학습 모델을 학습하고, 학습된 심층강화학습 모델을 이용하여 에너지 하베스팅을 수행할 기지국을 결정할 수 있다.-
公开(公告)号:KR102235645B1
公开(公告)日:2021-04-02
申请号:KR1020190135595
申请日:2019-10-29
Applicant: 서울대학교산학협력단
Abstract: 본발명은심층강화학습모델을이용하여, 다중기지국대용량안테나시스템에서에너지하베스팅을수행할기지국을결정하는방법및 장치를제공한다. 본발명에서는, 사용자단말들각각의하향링크채널정보, 사용자단말들각각의데이터요구량및 기지국들각각의전송전력조건을이용하여현재상태를생성하고, 현재상태에기초하여, 에너지하베스팅을수행할기지국을선택하는행동을결정할수 있으며, 결정된행동에따른사용자단말들의총 데이터전송률을보상으로획득할수 있다. 본발명에서는현재상태, 행동및 보상을이용하여, 보상이최대가되도록심층강화학습모델을학습하고, 학습된심층강화학습모델을이용하여에너지하베스팅을수행할기지국을결정할수 있다.
-