텍스트 마이닝을 이용한 키워드 도출 방법
    1.
    发明授权
    텍스트 마이닝을 이용한 키워드 도출 방법 有权
    使用文字挖掘的关键字提取方法

    公开(公告)号:KR101505546B1

    公开(公告)日:2015-03-26

    申请号:KR1020140043649

    申请日:2014-04-11

    CPC classification number: G06F17/30616 G06F17/2705 G06F2216/11

    Abstract: 키워드 도출 방법이 개시된다. 상기 키워드 도출 방법은 다수의 기술 문헌들 각각을 텍스트 마이닝(text mining)하여 상기 다수의 기술 문헌들 각각에 포함된 다수의 단어들 각각의 단어-빈도 수(term frequency; TF)를 요소로 하는 문서-단어 행렬을 생성하는 단계, 역-문서 빈도 수(inverse document frequency; IDF)를 이용하여 상기 문서-단어 행렬의 각 요소의 제1 가중치를 결정하는 단계, 단어별로 상기 단어에 대응하는 제1 가중치의 총 합을 상기 단어가 포함된 문헌의 수로 나눈 값을 제2 가중치로 결정하는 단계, 및 상기 제2 가중치를 기초로 키워드를 선정하는 단계를 포함한다.

    Abstract translation: 公开了一种关键词提取方法。 关键词提取方法包括以下步骤:对多个技术文档中的每一个进行文本挖掘以生成文档术语矩阵,其中将每个技术文档中包括的多个术语中的每一个的术语频率(TF)用作 一个元素 使用逆文档频率(IDF)确定文档项矩阵的每个元素的第一权重; 确定作为第二权重的值,使得与所述条款对应的第一权重的总和除以包括条款的文档的数量; 以及基于所述第二权重来选择关键字。 因此,通过文本挖掘多个技术文档,可以通过结构化数据来分析技术文档。

    특허 키워드 분석에 기반한 부상 기술 예측 장치 및 방법
    2.
    发明授权
    특허 키워드 분석에 기반한 부상 기술 예측 장치 및 방법 有权
    基于专利关键词分析预测新兴技术的装置和方法

    公开(公告)号:KR101595342B1

    公开(公告)日:2016-02-18

    申请号:KR1020130069163

    申请日:2013-06-17

    Abstract: 특허키워드분석에기반한부상기술예측장치및 방법이개시된다. 저장부에는서지사항및 특허공보를포함하는특허정보가저장된다. 전처리부는특허정보의서지사항에포함되어있는발명의명칭과요약서에기재된단어들중 전체문서에서빈도수가중치가높은상위의단어들을분석에사용될핵심단어로선정한다. 키워드선정부는핵심단어들의빈도수평균과표준편차를산출한후 핵심단어들의분포상태를기초로부상기술의키워드후보를선정하고, 부상기술의키워드후보에속하는핵심단어가속한특허의출원일자를기준으로사전에설정된기준기간에대해산출한부상기술의키워드후보들의빈도수에있어서증가세를보이는핵심단어들의증가율의평균이양의값을가지는핵심단어를부상기술의키워드로선정한다. 유사도측정부는부상기술의키워드들사이의유사도가사전에설정되어있는기준값보다큰 키워드들을관련단어로검출한다. 분석부는부상기술의키워드및 관련단어를기초로특허정보로부터부상기술을검색한다. 본발명에따르면, 특허문서에서추출된키워드의시계열적정보를고려하여기존기술예측방법보다급변하는기술트렌드의변화추이를잘 반영하는예측결과를얻을수 있다.

    특허 키워드 분석에 기반한 부상 기술 예측 장치 및 방법
    3.
    发明公开
    특허 키워드 분석에 기반한 부상 기술 예측 장치 및 방법 有权
    基于专利密钥分析预测新兴技术的装置和方法

    公开(公告)号:KR1020140146439A

    公开(公告)日:2014-12-26

    申请号:KR1020130069163

    申请日:2013-06-17

    CPC classification number: G06F19/00

    Abstract: An apparatus and method for forecasting emerging technology based on patent keyword analysis are disclosed. A storage unit stores patent information including bibliographic items and publications. A preprocessing unit selects words with higher frequency weights as keywords to be used in the analysis from the entire document among words described in the title of the invention and the abstract included in the bibliographic items of the patent information. A keyword selection unit calculates the mean and standard deviation of frequency of the keywords and then selects keyword candidates of emerging technology based on a distribution state of the keywords, and selects keywords where the mean of increase rates of keywords is positive as keywords of the emerging technology, wherein the keywords show an increase in the frequency of the keyword candidates of emerging technology calculated for a preset reference period based on an application date of a patent including keywords belonging to the keyword candidates of the emerging technology. A similarity measurement unit detects keywords greater than a reference value as related words, wherein the similarity between the keywords of the emerging technology is preset to the reference value. An analysis unit searches the emerging technology from the patent information based on the keywords of the emerging technology and the related words. According to the present invention, the apparatus and method may obtain forecasting results which reflect changes in the rapidly changing technology trends, compared to a conventional technology forecasting method, by considering time-series information of the keywords extracted from the patent document.

    Abstract translation: 公开了一种基于专利关键词分析的新兴技术预测装置和方法。 存储单元存储包括书目项目和出版物的专利信息。 预处理单元选择具有较高频率权重的单词作为要从分析中使用的关键词,用于从本发明标题中描述的单词和包含在专利信息书目项目中的摘要中的整个文档。 关键词选择单元计算关键词的频率的平均值和标准偏差,然后基于关键词的分布状态选择新兴技术的关键词候选者,并且选择关键词的增加率为正的关键字作为新兴关键词的关键词 技术,其中关键字显示出基于包括属于新兴技术的关键字候选者的关键字的专利的专利的申请日期,针对预设参考期计算的新兴技术的关键词候选者的频率增加。 相似性测量单元检测大于参考值的关键字作为相关词,其中新兴技术的关键词之间的相似性预设为参考值。 分析单位根据新兴技术和相关词汇的关键词,从专利信息中搜索新兴技术。 根据本发明,与传统技术预测方法相比,通过考虑从专利文献中提取的关键词的时间序列信息,装置和方法可以获得反映快速变化的技术趋势变化的预测结果。

Patent Agency Ranking