Abstract:
A method for clustering gene using gene expression profile is provided to obtain an accurate clustering result with low calculation complexity without directly designating complicated and detrimental input variations determining quality of a clustering result by clustering a time series gene expression profile data set into a gene group having the similar function. A method for clustering gene using gene expression profile comprises the steps of: (a) calculating a parameter value of each orders of a linear regression model when the gene expression profile is inputted; (b) calculating an F-distribution based probability regarding each of the parameter value calculated linear regression model; and (c) after selecting the linear regression model having a minimum value of the calculated F-distribution based probability, clustering the gene in accordance with the order of the selected linear regression model, wherein the gene is clustered by an increase function or a decrease function according to a sign of the corresponding parameter value when the order of the finally selected linear regression model is 1st(linear) or at least 3rd. or is clustered by a concave function or a convex function according to the sign of the corresponding parameter value when the order of the finally selected linear regression model is 2nd(parabola).
Abstract:
본 발명은 인터넷 상에 각기 상이한 위치에 상이한 형태로 분산 저장된 정보 자원으로부터 원하는 정보를 획득하는 통합 뷰를 생성하기 위하여 데이터베이스 스키마를 생성하는 방법 및 정보 통합 시스템에 관한 것이다. 본 발명은 명세언어로 기술된 정보 데이터베이스의 구조 및 내용을 해석하여, 의미적으로 대응되는 스키마를 생성하는 규칙과 스키마로부터 통합된 뷰를 생성하기 위해 필요한 정보들에 대한 정의를 포함하는 것을 특징으로 한다. 또한, 단일 데이터베이스를 표현하는 지역스키마들에 대해, 통합 뷰를 표현하는 전역스키마의 생성을 위해 XQuery 문법의 일부를 도입하며 데이터 뷰의 표현에 대한 표준 표현법에 대한 정의를 포함하는 것이 바람직하다. 이에 따라, 네트워크 상에 산재하는 다양한 이종 데이터베이스들에 대해 명세언어를 이용하여 통합된 뷰를 작성하고 실시간으로 질의할 수 있는 정보 통합 시스템을 제공할 수 있다. 바이오인포매틱스, 생물정보 데이터베이스, XML 스키마, 생물정보 통합, 랩퍼
Abstract:
본 발명은 인터넷 상에 각기 상이한 위치에 상이한 형태로 분산 저장된 정보 자원으로부터 원하는 정보를 획득하는 통합 뷰를 생성하기 위하여 데이터베이스 스키마를 생성하는 방법 및 정보 통합 시스템에 관한 것이다. 본 발명은 명세언어로 기술된 정보 데이터베이스의 구조 및 내용을 해석하여, 의미적으로 대응되는 스키마를 생성하는 규칙과 스키마로부터 통합된 뷰를 생성하기 위해 필요한 정보들에 대한 정의를 포함하는 것을 특징으로 한다. 또한, 단일 데이터베이스를 표현하는 지역스키마들에 대해, 통합 뷰를 표현하는 전역스키마의 생성을 위해 XQuery 문법의 일부를 도입하며 데이터 뷰의 표현에 대한 표준 표현법에 대한 정의를 포함하는 것이 바람직하다. 이에 따라, 네트워크 상에 산재하는 다양한 이종 데이터베이스들에 대해 명세언어를 이용하여 통합된 뷰를 작성하고 실시간으로 질의할 수 있는 정보 통합 시스템을 제공할 수 있다. 바이오인포매틱스, 생물정보 데이터베이스, XML 스키마, 생물정보 통합, 랩퍼
Abstract:
본 발명은 인터넷을 통해 제공되는 생물 정보 검색 서비스 특성을 고려하여, URI를 사용한 내부(혹은 외부) 생물정보간의 참조 및 자체 생물정보 데이터 베이스에 적용 가능한 유용한 연산들을 수용하여 논리적 필드로 정의하고, 이에 기반한 통합검색을 위해 엑스쿼리 내에서 사용된 논리적 필드를 생물정보의 실제 필드로 사상하고 수행 처리하는 생물 정보 검색 시스템 및 생물 정보 검색 방법에 관한 것이다. 본 발명의 생물 정보 통합 검색 시스템은 다수의 생물 정보 데이터 베이스에 각각 대응하며, 상기 생물 정보 데이터 베이스에 대하여 각각 구축되어 있는 검색/분석 연산 규칙을 이용하여, 사용자 질의에 응답하는 다수의 래퍼; 상기 사용자 질의를 상기 개별 래퍼에서 실행될 수 있도록 하나 이상의 부 질의로 분할하거나, 하나 이상의 부 질의를 생성하는 미디에이터; 및 상기 생물 정보 데이터 베이스에 대응하는 래퍼를 자동으로 생성하는 래퍼 생성부를 포함한다. 생물정보통합, 엑스쿼리, 논리적 필드, 질의 개념화, 바이오 인포매틱스
Abstract:
본 발명은 정보질의 확장 시스템 및 그 방법에 관한 것으로, 인터넷 상에 산재된 정보를 표현하기 위해 정의된 명세 언어를 이용하여 이종의 데이터들을 효율적으로 관리하고, 특정한 목적을 위해 통합하기 위한 기준이 되는 개념적 질의 확장을 위한 방법을 제공한다.
Abstract:
본 발명은 인터넷을 통해 제공되는 생물 정보 검색 서비스 특성을 고려하여, URI를 사용한 내부(혹은 외부) 생물정보간의 참조 및 자체 생물정보 데이터 베이스에 적용 가능한 유용한 연산들을 수용하여 논리적 필드로 정의하고, 이에 기반한 통합검색을 위해 엑스쿼리 내에서 사용된 논리적 필드를 생물정보의 실제 필드로 사상하고 수행 처리하는 생물 정보 검색 시스템 및 생물 정보 검색 방법에 관한 것이다. 본 발명의 생물 정보 통합 검색 시스템은 다수의 생물 정보 데이터 베이스에 각각 대응하며, 상기 생물 정보 데이터 베이스에 대하여 각각 구축되어 있는 검색/분석 연산 규칙을 이용하여, 사용자 질의에 응답하는 다수의 래퍼; 상기 사용자 질의를 상기 개별 래퍼에서 실행될 수 있도록 하나 이상의 부 질의로 분할하거나, 하나 이상의 부 질의를 생성하는 미디에이터; 및 상기 생물 정보 데이터 베이스에 대응하는 래퍼를 자동으로 생성하는 래퍼 생성부를 포함한다. 생물정보통합, 엑스쿼리, 논리적 필드, 질의 개념화, 바이오 인포매틱스
Abstract:
유전자 어휘 분류체계를 이용한 유전자 발현 프로파일 군집화 방법 및 그 장치가 개시된다. 본 발명은 유전자 어휘 분류체계(GO) 트리에서 적어도 하나의 GO 용어들을 선택받고, 유전자 발현 데이터 집합을 입력받은 후, 유전자 발현 데이터 집합을 선택받은 GO 용어들에 따라 각각의 그룹으로 분류하고, 각 그룹에 대해 유전자 발현 데이터의 유사도를 기초로 1차 군집화하고, 1차 군집화의 결과를 씨드로 하여 유전자 발현 데이터 집합을 2차 군집화함으로써, 유전자 어휘 분류체계의 정보를 효과적으로 이용하여 생물학적으로 유의미하고 신뢰성 높은 군집결과의 생성을 가능하게 한다. 유전자 어휘 분류체계(GO), 유전자 발현 프로파일, 군집화
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은, 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은, 대상 종의 유전자 리스트 중에서 비교 종과 상동성(HomoloGene) 정보를 갖는 유전자들, 또는 비교 종에는 존재하지 않고 대상 종에만 존재하는 유전자들을 선별한 후, 상기 유전자들과 GO(Gene Ontology) 및 KEGG(Kyoto Encyclopedia of Genes and Genomes) 용어 사이의 통계적인 유의성을 갖는 용어를 검출하여, 유전자 리스트들이 참여하고 있는 생체 패스웨이로 할당하기 위한, 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치에 있어서, 대상 종의 유전자 리스트 중에서 비교 종과 상동성(HomoloGene)을 갖는 유전자들 또는 상기 비교 종에는 포함되어 있지 않은 유전자들을 선별하여 상동성 및 유일성 유전자 리스트를 생성하기 위한 상동성 및 유일성 유전자 리스트 생성수단; 상기 상동성 및 유일성 유전자 리스트 생성수단에서 생성한 상동성 및 유일성 유전자 리스트에 GO(Gene Ontology) 용어 및 KEGG(Kyoto Encyclopedia of Genes and Genomes) 용어를 각각 할당하기 위한 용어 할당수단; 상기 용어 할당수단을 통해 해당 GO 용어 및 KEGG 용어를 할당한 상동성 및 유일성 유전자 리스트에서 GO 용어 및 KEGG 용어별로 초 기하 분포(hyper-geometric distribution) 유의 확률을 계산하기 위한 통계적 유의 확률 계산수단; 및 상기 초 기하 분포 유의 확률이 계산된 상동성 및 유일성 유전자 리스트 별로 최소의 초 기하 분포 유의 확률값을 갖는 GO 용어 및 KEGG 용어를 선별하여 해당 유전자 리스트의 생체 패스웨이로 할당하기 위한 생체 패스웨이 할당수단을 포함함. 4. 발명의 중요한 용도 본 발명은 유전자 칩 분석 등에 이용됨. 유전자 칩, 상동성(HomoloGene), 유일성, GO 용어, KEGG 용어, 통계적 유의 확률, 생체 패스웨이
Abstract:
An apparatus for detecting transcriptional regulation between genes is provided to improve accuracy of detection by using transcriptional factors which is biologically present between genes, form a network of biological information by predicting the transcriptional regulation between genes, and obtain various transcriptional regulations between genes through the network or map. An apparatus for detecting transcriptional regulation between genes comprises: a storage unit for storing regulator gene, at least one transcriptional factor corresponding to the regulator gene, and a profile(sequence information) of the transcriptional factor; an input unit(13) for inputting the information of a first gene and a second gene; search units(14,15) for searching the profile of the first gene information inputted in the storage unit; and a transcriptional regulation-detecting unit(16) for detecting transcriptional regulation of the first gene and second gene by performing the local sequence alignment by using the searched transcriptional factor profile and the nucleic acid sequence of the second gene.
Abstract:
본 발명은 유사서열 추출을 통한 전사인자 결합부위 예측 장치 및 그 방법에 관한 것으로, 특히 입력 서열에 대한 전처리 후 접미사 배열을 구성하고 생성된 접미사 배열에 대한 LCP 정보에 의해 여러 서열에서 공통으로 존재하는 서열을 추출하여 국부 정렬 기법을 이용하여 전사인자 결합부위 후보 서열들을 추출함으로써, 전사인자 결합부위 예측에 따른 시간과 비용을 효율적으로 줄일 수 있는 유사서열 추출을 통한 전사인자 결합부위 예측 장치 및 그 방법에 관한 것이다. 본 발명의 유사서열 추출을 통한 전사인자 결합부위 예측 장치는, 입력된 서열들을 전처리, 접미사 배열 생성 및 국부 정렬하여 대상 서열에서 예측된 전사인자 결합부위들을 출력하기 위한 전사인자 결합부위 예측기; 및 상기 전사인자 결합부위 예측기로부터 출력된 전사인자 결합부위 서열들을 저장하기 위한 결합부위 데이터베이스를 포함하여 이루어진다.