Patent search ap:("IBM") AND inv:"KANNAN SRIDEVI" Page 1

1.

发明专利
BILDVERSCHLÜSSELUNG 未知

公开(公告)号：DE112023001817T5

公开(公告)日：2025-01-23

申请号：DE112023001817

申请日：2023-03-21

Applicant: IBM

Inventor： SANTHAR SATHYA , KANNAN SRIDEVI , RAKSHIT SARBAJIT K , JAWAHARLAL SAMUEL MATHEW

IPC: H04N1/44

Abstract: Verschlüsselung von Bilddaten, indem erste Bilddaten empfangen werden, die einem ersten Bild entsprechen, das eine erste Bildgröße hat, die ersten Bilddaten komprimiert werden, was zweite Bilddaten ergibt, die einem zweiten Bild entsprechen, das eine zweite Bildgröße hat, die zweiten Bilddaten erweitert werden, was dritte Bilddaten ergibt, die einem dritten Bild entsprechen, das die erste Bildgröße hat, Koordinaten einer Position des zweiten Bildes innerhalb des dritten Bildes bestimmt werden, die dritten Bilddaten gemäß den Koordinaten verschlüsselt werden, die verschlüsselten dritten Bilddaten einem Decoder durch einen ersten Übertragungskanal bereitgestellt werden und die Koordinaten des zweiten Bildes innerhalb des dritten Bildes dem Decoder durch einen zweiten Übertragungskanal bereitgestellt werden.

2.

发明专利
OPTIMIERUNG VON LIPPENSYNCHRONISATION IN EINEM IN NATÜRLICHE SPRACHE ÜBERSETZTEN VIDEO 未知

公开(公告)号：DE112022004517T5

公开(公告)日：2025-01-02

申请号：DE112022004517

申请日：2022-09-22

Applicant: IBM

Inventor： SANTHAR SATHYA , KANNAN SRIDEVI , RAKSHIT SARBAJIT K , JAWAHARLAL SAMUEL MATHEW

IPC: G10L21/10 , G06F40/58 , G06N3/0475 , G06T13/40 , G06V20/40 , G06V40/16 , G10L13/08 , G10L15/26

Abstract: Ein Ansatz zum Generieren eines optimierten Videos eines Sprechers, das aus einer Quellsprache in eine Zielsprache übersetzt wird, wobei die Lippen des Sprechers bei abgestimmter Optimierung der Übersetzung in eine Zielsprache auf die übersetzte Sprache synchronisiert werden. Ein Quellvideo kann in ein neuronales Maschinenübersetzungsmodell eingegeben werden. Das Modell kann eine Mehrzahl von potenziellen Übersetzungen synthetisieren. Die Übersetzungen können von einem generativen kontroversen Netzwerk empfangen werden, das für jede Übersetzung ein Video generiert und die Übersetzungen als synchron oder nicht synchron klassifiziert. Für jedes der generierten Videos, die als synchron klassifiziert werden, kann eine Bewertung der Lippensynchronizität generiert werden.

3.

发明专利
DURCH EIN GENERATIVES ADVERSIALES NETZWERK REALISIERTE VERÄNDERUNG EINES DIGITALEN SKRIPTS 未知

公开(公告)号：DE112022004259T5

公开(公告)日：2024-06-20

申请号：DE112022004259

申请日：2022-08-25

Applicant: IBM

Inventor： RAKSHIT SARBAJIT K , SANTHAR SATHYA , JAWAHARLAL SAMUEL MATHEW , KANNAN SRIDEVI

IPC: G06N3/0475 , G06F40/30

Abstract: Bereitgestellt werden ein System, ein Verfahren und ein Computerprogrammprodukt zum Realisieren einer Veränderung eines digitalen Skripts. Das Verfahren umfasst Erzeugen von Bildsequenzen zum Textinhalt einer digitalen Geschichte. Im Textinhalt werden mehrere Kontextdimensionen ermittelt, und eine Gruppe von Dimensionen wird ausgewählt. Die Bildsequenzen in Kombination mit der Gruppe von Dimensionen werden erweitert oder gekürzt, und Bildsequenzen werden auf Grundlage erkannter Interaktionen mit der Gruppe von Dimensionen geändert. Während der Präsentation der digitalen Geschichte werden Dimensionen aus der Gruppe von Dimensionen extrahiert, und ein Skriptautor wird befähigt, die Dimensionen zu verändern. Die Bildsequenzen werden verändert und eine Hardware-Schnittstelleneinheit wird befähigt, mit verschiedenen Bildsequenz zu interagieren und die mehreren Kontextdimensionen zu ändern. Der Textinhalt der digitalen Geschichte wird dynamisch geändert.

Patent Agency Ranking