-
公开(公告)号:DE112023001817T5
公开(公告)日:2025-01-23
申请号:DE112023001817
申请日:2023-03-21
Applicant: IBM
Inventor: SANTHAR SATHYA , KANNAN SRIDEVI , RAKSHIT SARBAJIT K , JAWAHARLAL SAMUEL MATHEW
IPC: H04N1/44
Abstract: Verschlüsselung von Bilddaten, indem erste Bilddaten empfangen werden, die einem ersten Bild entsprechen, das eine erste Bildgröße hat, die ersten Bilddaten komprimiert werden, was zweite Bilddaten ergibt, die einem zweiten Bild entsprechen, das eine zweite Bildgröße hat, die zweiten Bilddaten erweitert werden, was dritte Bilddaten ergibt, die einem dritten Bild entsprechen, das die erste Bildgröße hat, Koordinaten einer Position des zweiten Bildes innerhalb des dritten Bildes bestimmt werden, die dritten Bilddaten gemäß den Koordinaten verschlüsselt werden, die verschlüsselten dritten Bilddaten einem Decoder durch einen ersten Übertragungskanal bereitgestellt werden und die Koordinaten des zweiten Bildes innerhalb des dritten Bildes dem Decoder durch einen zweiten Übertragungskanal bereitgestellt werden.
-
公开(公告)号:DE112022004517T5
公开(公告)日:2025-01-02
申请号:DE112022004517
申请日:2022-09-22
Applicant: IBM
Inventor: SANTHAR SATHYA , KANNAN SRIDEVI , RAKSHIT SARBAJIT K , JAWAHARLAL SAMUEL MATHEW
Abstract: Ein Ansatz zum Generieren eines optimierten Videos eines Sprechers, das aus einer Quellsprache in eine Zielsprache übersetzt wird, wobei die Lippen des Sprechers bei abgestimmter Optimierung der Übersetzung in eine Zielsprache auf die übersetzte Sprache synchronisiert werden. Ein Quellvideo kann in ein neuronales Maschinenübersetzungsmodell eingegeben werden. Das Modell kann eine Mehrzahl von potenziellen Übersetzungen synthetisieren. Die Übersetzungen können von einem generativen kontroversen Netzwerk empfangen werden, das für jede Übersetzung ein Video generiert und die Übersetzungen als synchron oder nicht synchron klassifiziert. Für jedes der generierten Videos, die als synchron klassifiziert werden, kann eine Bewertung der Lippensynchronizität generiert werden.
-
3.
公开(公告)号:DE112022004259T5
公开(公告)日:2024-06-20
申请号:DE112022004259
申请日:2022-08-25
Applicant: IBM
Inventor: RAKSHIT SARBAJIT K , SANTHAR SATHYA , JAWAHARLAL SAMUEL MATHEW , KANNAN SRIDEVI
IPC: G06N3/0475 , G06F40/30
Abstract: Bereitgestellt werden ein System, ein Verfahren und ein Computerprogrammprodukt zum Realisieren einer Veränderung eines digitalen Skripts. Das Verfahren umfasst Erzeugen von Bildsequenzen zum Textinhalt einer digitalen Geschichte. Im Textinhalt werden mehrere Kontextdimensionen ermittelt, und eine Gruppe von Dimensionen wird ausgewählt. Die Bildsequenzen in Kombination mit der Gruppe von Dimensionen werden erweitert oder gekürzt, und Bildsequenzen werden auf Grundlage erkannter Interaktionen mit der Gruppe von Dimensionen geändert. Während der Präsentation der digitalen Geschichte werden Dimensionen aus der Gruppe von Dimensionen extrahiert, und ein Skriptautor wird befähigt, die Dimensionen zu verändern. Die Bildsequenzen werden verändert und eine Hardware-Schnittstelleneinheit wird befähigt, mit verschiedenen Bildsequenz zu interagieren und die mehreren Kontextdimensionen zu ändern. Der Textinhalt der digitalen Geschichte wird dynamisch geändert.
-
-