-
公开(公告)号:CN111459994A
公开(公告)日:2020-07-28
申请号:CN202010149602.9
申请日:2020-03-06
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/248
Abstract: 本发明提供一种面向残疾人大数据的分析方法,包括:对残疾人大数据对应数据集进行属性分解,将所有选择属性按照其选项分解为多个断属性,并将连续属性离散化;然后基于分解后的判断属性采用独热编码表示每一条数据,在每条编码中每个判断属性对应一个属性值,其中,判断属性对应的选项被选中的属性值为1,反之为0,将数据集中所有数据转换成独热编码形成数据集矩阵;基于数据集矩阵,为数据集矩阵中属性值为1的判断属性生成规则集合;对数据集矩阵进行回归分析,依次以一个判断属性作为目标属性,基于关联规则集合,计算数据集中其他属性对该目标属性影响力的权重,所有其他属性对目标属性影响力的权重形成该目标属性的权重集合。
-
公开(公告)号:CN111125186B
公开(公告)日:2023-06-13
申请号:CN201911168069.4
申请日:2019-11-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/215 , G06F17/18 , G06F18/2135 , G06F18/241
Abstract: 本发明提出一种基于调查问卷的数据处理方法及系统,包括:步骤1、通过调查问卷中的回答内容,得到原始数据集,并通过属性分解将该原始数据集中多选问题数据转换为单选问题数据,通过线性回归填补该原始数据集中空缺数据,得到第一数据集;步骤2、对该第一数据集进行质量筛查,剔除该第一数据集中错误数据和低质量数据,得到第二数据集,并对该第二数据集中冗余属性进行标记,得到预处理数据集,并将该预处理数据集输入至预设数据分析模型,得到分析结果。本发明可解决原始数据中的虚假信息难以过滤、属性冗余、难以直接处理原始数据中多选问题数据和漏填内容数据等技术问题。
-
公开(公告)号:CN112954689A
公开(公告)日:2021-06-11
申请号:CN202110179359.X
申请日:2021-02-07
Applicant: 中国科学院计算技术研究所
IPC: H04W12/121 , H04L29/06 , H04L12/851 , H04L12/24
Abstract: 本发明提出一种针对蓝牙无线传输的轻量化网络入侵检测系统和方法,包含两种工作状态,分别是离线训练和在线检测。离线训练包括数据收集、特征选取、数据训练和生成机器学习模型四个阶段,其中数据训练针对的是有标签的数据,其中标签代表正常数据或异常数据。数据训练阶段分为特征压缩、构建概率模型、计算数组出现概率三个步骤。在线检测则包括了数据收集、特征选取、特征压缩、计算数组出现概率、平滑概率和通过生成的模型实时得出检测结果。本发明提出的入侵检测方法可以提供更高的准确率和更少的误报。
-
公开(公告)号:CN111125186A
公开(公告)日:2020-05-08
申请号:CN201911168069.4
申请日:2019-11-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/215 , G06F17/18 , G06K9/62
Abstract: 本发明提出一种基于调查问卷的数据处理方法及系统,包括:步骤1、通过调查问卷中的回答内容,得到原始数据集,并通过属性分解将该原始数据集中多选问题数据转换为单选问题数据,通过线性回归填补该原始数据集中空缺数据,得到第一数据集;步骤2、对该第一数据集进行质量筛查,剔除该第一数据集中错误数据和低质量数据,得到第二数据集,并对该第二数据集中冗余属性进行标记,得到预处理数据集,并将该预处理数据集输入至预设数据分析模型,得到分析结果。本发明可解决原始数据中的虚假信息难以过滤、属性冗余、难以直接处理原始数据中多选问题数据和漏填内容数据等技术问题。
-
-
-