-
公开(公告)号:CN113742602A
公开(公告)日:2021-12-03
申请号:CN202010477300.4
申请日:2020-05-29
Applicant: 中国电信股份有限公司
IPC: G06F16/9536 , G06F16/35 , G06F16/955
Abstract: 本发明公开涉及用于对样本进行优化的方法、设备及计算机可读存储介质。根据本发明的样本优化方法包括:为同一分类的样本中的每一个样本构建特征向量;计算任意两个样本的特征向量之间的相似性;根据计算的相似性使用PageRank算法对所述样本进行排序;以及基于排序后的样本对样本进行优化。
-
公开(公告)号:CN113449512A
公开(公告)日:2021-09-28
申请号:CN202010220273.2
申请日:2020-03-25
Applicant: 中国电信股份有限公司
IPC: G06F40/216 , G06F40/289 , G06F40/295 , G06F40/30 , G06F40/242 , G06F16/332 , G10L13/04 , G10L13/047
Abstract: 本公开涉及一种信息处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:获取用户输入信息对应的文本;根据文本,识别文本对应的行业类别;将文本输入行业类别对应的自然语言处理模型,得到针对文本对应的输出信息;其中,不同行业类别对应不同的自然语言处理模型。
-
公开(公告)号:CN109388689A
公开(公告)日:2019-02-26
申请号:CN201710668364.0
申请日:2017-08-08
Applicant: 中国电信股份有限公司
IPC: G06F16/332 , G06F16/9535 , G06F17/27
Abstract: 本申请提出一种词库生成方法和装置,涉及人工智能技术领域。本发明的一种词库生成方法,包括:步骤i):根据开源词库确定基本词汇库;步骤ii):根据基本词汇库,基于词频统计的分词方法处理部分语料文本,获取更新词汇;步骤iii):以预定策略利用更新词汇更新基本词汇库;循环执行步骤ii)、iii),直至完成全部语料文本的处理;根据更新后的基本词汇库建立词库。通过这样的方法,能够基于已有的开源词库,通过处理语料文本的方式对词库进行更新,再用更新后的词库去处理语料文本,循环该过程,能够基于具有时效性的语料文本更新词库,从而使词库能够不断的更新和丰富,在无需依赖输入法的情况下得到最新词库。
-
公开(公告)号:CN109327293A
公开(公告)日:2019-02-12
申请号:CN201710646180.4
申请日:2017-08-01
Applicant: 中国电信股份有限公司
Abstract: 本申请提出一种跳变通道控制方法以及服务器、数据传输节点和系统,涉及互联网技术领域。本发明的一种跳变通道控制方法包括:服务器获取来自数据传输节点的当前网络状况信息;根据当前网络状态信息确定传输跳变通道的数量;将数量发送给数据传输节点以调节数据传输节点的传输跳变通道的数量。通过这样的方法,能够根据当前数据传输网络的状况实时调整跳变通道的数量,使得跳变通道的数量既能够满足传输跳变的需求,又能够尽量减少通道闲置和导致数据碎片化,使得跳变通道的数量满足当前网络状态的需求。
-
公开(公告)号:CN103167477B
公开(公告)日:2016-08-10
申请号:CN201110412672.X
申请日:2011-12-13
Applicant: 中国电信股份有限公司
Abstract: 本发明公开了一种业务下载的方法、UTK卡和移动终端,涉及移动互联网业务下载领域。UTK卡获取移动终端下载业务的状态信息,UTK卡通过状态信息判断下载是否成功,并发送短消息将判断的结果通知计费管理平台。本发明公开的业务下载的方法、UTK卡和移动终端,通过获得业务下载过程中的状态信息,判断下载是否成功,提高用户使用的舒适度,也可以统计用户成功下载量,对平台及网络性能做出准确评估。
-
公开(公告)号:CN101291450B
公开(公告)日:2011-06-15
申请号:CN200710101263.1
申请日:2007-04-20
Applicant: 中国电信股份有限公司
Abstract: 本发明涉及在电信系统中对组合业务进行管理的方法。所述方法包括:提供一个综合业务接入网关ISAG,该ISAG用于代理业务系统与ISMP和SP之间的信息交互;在通过ISAG使用组合业务中的每种业务能力时,在ISMP和ISAG之间交互的信息中增加“流程标识参数”和“判决标识参数”。其中,“流程标识参数”是ISMP根据组合业务的触发而随机产生的一个参数,该参数用于同时标识关于所述组合业务中的每一个业务的流程;“判决标识参数”是ISAG在组合业务中的最后一个业务流程完成后,向ISMP发送的用来通知组合业务运行完毕的参数。根据本发明,可以应对越来越复杂的业务管理并能够以更加有效和合理的方式实现组合业务的流程管理和计费管理。
-
公开(公告)号:CN112559474B
公开(公告)日:2024-09-03
申请号:CN201910914657.1
申请日:2019-09-26
Applicant: 中国电信股份有限公司
IPC: G06F16/18 , G06F16/33 , G06F40/279
Abstract: 本公开公开了一种日志处理方法和装置,涉及数据处理领域。该方法包括:利用停用词库对样本日志文件进行分词处理,得到样本日志文件中的多个词语;对多个词语进行词频统计,将词频数大于词频阈值的词语作为高频词;将样本日志文件中连续出现的预定个数的高频词,作为高频词组;计算每个高频词组与标点组合的加权概率;根据加权概率大于概率阈值的高频词组与标点组合,构建日志模版;根据日志模版,提取日志数据中的关键信息。本公开提高了日志处理的准确性。
-
公开(公告)号:CN113810338B
公开(公告)日:2023-11-03
申请号:CN202010535053.9
申请日:2020-06-12
Applicant: 中国电信股份有限公司
IPC: H04L9/40
Abstract: 本公开涉及一种异常服务地址检测方法和装置、计算机可读存储介质。该异常服务地址检测方法包括:采集并处理日志数据;从日志数据中提取服务地址特征向量;计算服务地址特征向量间的余弦相似度;将所述余弦相似度作为网页排名算法中的链上权重值,对服务地址特征向量进行相似重要程度排序;从相似重要程度序列中按照预定顺序截取预定数目的服务地址特征向量,将截取的服务地址作为异常服务地址。本公开可以基于链接关系进行异常服务地址检测,从而大大提升了异常服务地址检测效率。
-
公开(公告)号:CN115221974A
公开(公告)日:2022-10-21
申请号:CN202210929114.9
申请日:2022-08-03
Applicant: 中国电信股份有限公司
IPC: G06K9/62
Abstract: 本公开提供了一种数据识别器训练、数据识别方法、装置、电子设备及介质,涉及数据安全技术领域。该数据识别器训练方法包括:获取第一训练集,第一训练集中分别包括多个类别的样本,所述多个类别的样本的分布不均衡;训练所述第一训练集,得到第一分类器;循环执行如下迭代过程,直至所述多个类别的样本的分布均衡:调整所述多个类别的样本的数量,得到第二训练集,训练所述第二训练集,得到第二分类器;基于所述第一分类器和所述第二分类器,得到数据识别器。该训练方法加强了对小类别样本的学习效果,解决了由于样本稀少导致对小类别样本训练不足、识别准确率低的问题,能够在小类别样本不足的情况下,提高了数据识别器的拟合能力和准确率。
-
公开(公告)号:CN114707499A
公开(公告)日:2022-07-05
申请号:CN202210086774.5
申请日:2022-01-25
Applicant: 中国电信股份有限公司
IPC: G06F40/284
Abstract: 本公开提供了一种敏感词识别方法、装置、电子设备及存储介质,其中,敏感词识别方法包括:从预设编码库中分别获取待识别词对应的第一字符串和敏感样本词对应的第二字符串;对第一字符串和第二字符串分别进行预处理,得到待识别词的第一字符向量和敏感样本词的第二字符向量;计算第一字符向量和第二字符向量的余弦相似度;根据计算结果,确定待识别词是否为敏感词。本公开通过获取与待识别词和敏感样本词有映射关系的第一字符串和第二字符串,对第一字符串和第二字符串向量化处理,计算第一字符向量和第二字符向量的余弦相似度,根据得到的余弦相似度确定待识别词是否为敏感词,提高了敏感词识别的准确率和效率。
-
-
-
-
-
-
-
-
-