-
公开(公告)号:CN109857302B
公开(公告)日:2020-01-21
申请号:CN201910086626.1
申请日:2019-01-29
Applicant: 掌阅科技股份有限公司
IPC: G06F3/0483 , G06F15/02
Abstract: 本发明公开了一种电子书信息的修复方法、电子设备及计算机存储介质,该方法包括:确定电子书信息中包含的页面顺序文件所记录的页面元素的数量;判断页面顺序文件所记录的页面元素的数量与电子书信息相对应的书籍内容是否匹配;若否,获取与电子书信息相对应的目录文件;将目录文件与页面顺序文件所记录的页面元素进行比对,根据比对结果修复所述页面顺序文件,以使修复后的页面顺序文件所记录的页面元素的数量与所述电子书信息相对应的书籍内容匹配。本发明能够自动修复电子书信息中包含的页面顺序文件,以确保电子书中的各个页面能够依序展示并正常阅读,避免了因电子书信息中部分内容缺失而导致电子书无法上线的情况。
-
公开(公告)号:CN109062880B
公开(公告)日:2020-01-14
申请号:CN201810730145.5
申请日:2018-07-05
Applicant: 掌阅科技股份有限公司
IPC: G06F40/166 , H04L29/08
Abstract: 本发明公开了一种电子书文件的制作方法、电子设备、服务器、存储介质,其方法包括:获取电子书原始文件,将电子书原始文件进行文件转换处理,得到第一电子书文件;第一电子书文件包含文本数据和资源数据;对第一电子书文件中的文本数据和资源数据进行文件校对/编辑处理,并将第一电子书文件中的资源数据删除后在资源数据的相应位置增加资源数据链接信息和资源数据编辑信息,得到第二电子书文件;返回第二电子书文件。利用本发明可以减少在电子书文件制作过程中发送电子书文件所占用的带宽资源,改善集中上传/下载时带宽占用较多导致的速度、效率等问题。
-
公开(公告)号:CN109101973A
公开(公告)日:2018-12-28
申请号:CN201810884966.4
申请日:2018-08-06
Applicant: 掌阅科技股份有限公司
Abstract: 本发明公开了一种文字识别方法、电子设备、存储介质,其方法包括:获取包含第一文字的图片;提取图片中第一文字的笔画信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取第一文字的笔画信息,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中的线段数据集比对,计算数据集间的重合度,直观的根据数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。
-
公开(公告)号:CN112686000B
公开(公告)日:2021-09-28
申请号:CN202011552719.8
申请日:2020-12-24
Applicant: 掌阅科技股份有限公司
Inventor: 方建华
IPC: G06F40/151
Abstract: 本发明公开了一种电子书文档的格式转换方法、电子设备及存储介质,方法包括:针对与电子书相对应的第一文档格式的原始文档进行解析,提取原始文档中包含的与第一文档格式相对应的原始标签信息;判断原始标签信息中是否包含与第二文档格式无关的冗余标签;若是,针对冗余标签以及与冗余标签相对应的文档内容执行删除处理;提取原始标签信息中包含的文档拆分标签以及标题标签,根据文档拆分标签将原始文档拆分为多个目标文档,根据标题标签生成与拆分后的多个目标文档相对应的目录文件;将拆分后的多个目标文档以及与多个目标文档相对应的目录文件存储为与电子书相对应的第二文档格式的文档数据包。该方式能够自动实现文档格式的转换。
-
公开(公告)号:CN112699087A
公开(公告)日:2021-04-23
申请号:CN202011565518.1
申请日:2020-12-25
Applicant: 掌阅科技股份有限公司
Inventor: 方建华
IPC: G06F16/174 , G06T9/00
Abstract: 本发明公开了一种书籍资源文件的压缩方法、计算设备及计算机存储介质,该方法包括:对书籍资源文件进行解压,从解压得到的文件中提取出书籍图片资源;根据书籍资源文件的文件大小信息、书籍图片资源的大小信息以及目标压缩文件大小信息,得到对书籍图片资源进行压缩的压缩配置信息;根据压缩配置信息,对书籍图片资源进行压缩处理;根据压缩后的书籍图片资源打包生成压缩后的书籍资源文件。该方式中,通过将书籍资源文件中的书籍图片资源提取出来,根据压缩目标计算得到针对书籍图片资源的压缩配置,并按照压缩配置对书籍图片资源进行压缩处理,最终重新打包生成压缩后的书籍资源文件,该方式能够实现对书籍资源文件进行压缩,压缩处理效率高。
-
公开(公告)号:CN109062880A
公开(公告)日:2018-12-21
申请号:CN201810730145.5
申请日:2018-07-05
Applicant: 掌阅科技股份有限公司
Abstract: 本发明公开了一种电子书文件的制作方法、电子设备、服务器、存储介质,其方法包括:获取电子书原始文件,将电子书原始文件进行文件转换处理,得到第一电子书文件;第一电子书文件包含文本数据和资源数据;对第一电子书文件中的文本数据和资源数据进行文件校对/编辑处理,并将第一电子书文件中的资源数据删除后在资源数据的相应位置增加资源数据链接信息和资源数据编辑信息,得到第二电子书文件;返回第二电子书文件。利用本发明可以减少在电子书文件制作过程中发送电子书文件所占用的带宽资源,改善集中上传/下载时带宽占用较多导致的速度、效率等问题。
-
公开(公告)号:CN111782586B
公开(公告)日:2024-08-13
申请号:CN202010604303.X
申请日:2020-06-29
Applicant: 掌阅科技股份有限公司
IPC: G06F16/11 , G06F16/16 , G06F16/33 , G06F40/189
Abstract: 本发明公开了一种电子书数据源文件的匹配方法、计算设备及存储介质,该方法包括:读取书单文件中任一电子书的第一维度属性信息;其中,该书单文件用于记录至少一本电子书的至少一个维度的属性信息;将该第一维度属性信息与用于存储数据源文件的各个文件夹的文件夹名称进行匹配,确定目标文件夹;获取该目标文件夹包含的该电子书的数据源文件,将该数据源文件发送至排版系统以进行电子书制作处理。本发明方案,通过第一维度属性信息与文件夹名称的匹配,确定出电子书的数据源文件所在的目标文件夹,实现自动准确的匹配数据源以进行电子书制作。
-
公开(公告)号:CN113609073A
公开(公告)日:2021-11-05
申请号:CN202110909112.9
申请日:2021-08-09
Applicant: 掌阅科技股份有限公司
Inventor: 方建华
IPC: G06F16/11
Abstract: 本发明公开了一种Epub文件格式转换方法、电子设备及计算机存储介质。方法包括:根据待转换的Epub电子书的资源文件的原始Epub格式和目标Epub格式确定映射规则;其中,所述资源文件包括页面文件、样式文件和资源包文件;根据所述映射规则将所述原始Epub格式的资源文件转换为所述目标Epub格式的资源文件。本方案能够将所述原始Epub格式的资源文件转换为所述目标Epub格式的资源文件,无需人工参与即可完成Epub格式转换实现格式转换智能化,不仅节省了人力资源,还可以提高转换效率。
-
公开(公告)号:CN112686000A
公开(公告)日:2021-04-20
申请号:CN202011552719.8
申请日:2020-12-24
Applicant: 掌阅科技股份有限公司
Inventor: 方建华
IPC: G06F40/151
Abstract: 本发明公开了一种电子书文档的格式转换方法、电子设备及存储介质,方法包括:针对与电子书相对应的第一文档格式的原始文档进行解析,提取原始文档中包含的与第一文档格式相对应的原始标签信息;判断原始标签信息中是否包含与第二文档格式无关的冗余标签;若是,针对冗余标签以及与冗余标签相对应的文档内容执行删除处理;提取原始标签信息中包含的文档拆分标签以及标题标签,根据文档拆分标签将原始文档拆分为多个目标文档,根据标题标签生成与拆分后的多个目标文档相对应的目录文件;将拆分后的多个目标文档以及与多个目标文档相对应的目录文件存储为与电子书相对应的第二文档格式的文档数据包。该方式能够自动实现文档格式的转换。
-
公开(公告)号:CN111782586A
公开(公告)日:2020-10-16
申请号:CN202010604303.X
申请日:2020-06-29
Applicant: 掌阅科技股份有限公司
IPC: G06F16/11 , G06F16/16 , G06F16/33 , G06F40/189
Abstract: 本发明公开了一种电子书数据源文件的匹配方法、计算设备及存储介质,该方法包括:读取书单文件中任一电子书的第一维度属性信息;其中,该书单文件用于记录至少一本电子书的至少一个维度的属性信息;将该第一维度属性信息与用于存储数据源文件的各个文件夹的文件夹名称进行匹配,确定目标文件夹;获取该目标文件夹包含的该电子书的数据源文件,将该数据源文件发送至排版系统以进行电子书制作处理。本发明方案,通过第一维度属性信息与文件夹名称的匹配,确定出电子书的数据源文件所在的目标文件夹,实现自动准确的匹配数据源以进行电子书制作。
-
-
-
-
-
-
-
-
-