-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
公开(公告)号:CN117216397B
公开(公告)日:2024-03-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
公开(公告)号:CN117216614A
公开(公告)日:2023-12-12
申请号:CN202311237696.5
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F18/23213 , G06F18/24 , G06F18/22 , G06F16/29 , G06N3/0442 , G06N3/08
Abstract: 本发明提出一种基于时空信息提取的轨迹表征挖掘方法,属于数据挖掘技术领域。包括:S1.获取时空轨迹数据,并对数据进行预处理;S2.将时空轨迹数据映射到对应的城市区域;S3.根据区域分布的属性和用户对每个区域的访问时间点,进行初始时空特征编码;S4.将地理编码和关联访问区域编码的时间编码拼接构成轨迹的时空特征编码,并映射为向量表示;S5.将向量输入至LSTM网络中训练,捕捉上下文信息;S6.根据上下文信息计算每个区域对于轨迹经过其他区域的动态功能权重;S7.使用注意力权重对BiLSTM的输出进行加权,生成加权的上下文表示聚合每个区域在不同时段内的特征信息。解决缺少挖掘轨迹的动态功能表征方法的问题。
-
公开(公告)号:CN118484481B
公开(公告)日:2025-05-02
申请号:CN202410663869.8
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/29 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 一种基于时空信息提取的轨迹相似度分析方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为更全面准确地评估轨迹相似性,本发明采集时空轨迹数据,进行数据清洗、编码预处理,得到预处理后的时空轨迹数据输入到具有位置代码层的Transformer模型中进行处理,输出时空轨迹表征结果;将时空轨迹表征结果,通过余弦相似度进行T‑SNE降维处理,然后再进行K‑Means聚类,得到基于时空信息提取的轨迹相似度分析的可视化结果。本发明将复杂的轨迹数据转化为易于处理的向量形式,进而利用相似度分析算法对轨迹数据进行高效的比对和分类。这不仅能够提高数据分析的效率,还能够提升分析的准确性和可靠性。
-
公开(公告)号:CN118484481A
公开(公告)日:2024-08-13
申请号:CN202410663869.8
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/29 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 一种基于时空信息提取的轨迹相似度分析方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为更全面准确地评估轨迹相似性,本发明采集时空轨迹数据,进行数据清洗、编码预处理,得到预处理后的时空轨迹数据输入到具有位置代码层的Transformer模型中进行处理,输出时空轨迹表征结果;将时空轨迹表征结果,通过余弦相似度进行T‑SNE降维处理,然后再进行K‑Means聚类,得到基于时空信息提取的轨迹相似度分析的可视化结果。本发明将复杂的轨迹数据转化为易于处理的向量形式,进而利用相似度分析算法对轨迹数据进行高效的比对和分类。这不仅能够提高数据分析的效率,还能够提升分析的准确性和可靠性。
-
-
公开(公告)号:CN118916739A
公开(公告)日:2024-11-08
申请号:CN202410944911.3
申请日:2024-07-15
Applicant: 哈尔滨工业大学
IPC: G06F18/24 , G06F18/25 , G06F18/214 , G06F18/10 , G06F16/9536 , G06Q50/00 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及了一种基于编解码结构的用户生成内容目标立场联合检测方法及系统,涉及社交媒体的立场检测。本发明解决了立场检测任务的人工依赖问题,又消除了错误级联现象。技术要点:将预处理后的社交媒体文本数据输入编码器,编码器由序列编码器和经过微调的情感编码器构成,对查询向量之间使用自注意力机制,动态计算每个查询向量与其他查询向量的关联程度,从而更好地捕捉不同查询向量之间的依赖关系;然后,将编码器输出的序列特征输入解码器中,与查询向量做交叉注意力机制;将所有融合了序列特征的查询向量输入目标‑立场聚合层;将聚合后的查询向量与编码器输出的情感特征输入目标立场对解码层,首先通过注意力机制为查询向量与情感特征赋值权重,之后将两种特征进行拼接,得到最终的特征向量;将最终特征表示输入由两个全连接神经网络组成的解码器中以输出目标以及立场的预测结果。本发明应用于社交网络分析中。
-
公开(公告)号:CN117216397A
公开(公告)日:2023-12-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
-
-
-
-
-
-