Abstract:
본 발명은 양방향 은닉 마코프 모델을 이용한 완숙한 microRNA 위치예측방법 및 이를 구현하기 위한 컴퓨터 프로그램을 기록한 저장매체에 관한 것으로서, 상기 microRNA 전구체를 구성하는 염기쌍을 일치(match), 불일치(mismatch), 돌출(bulge) 중의 어느 하나의 상태정보로 표시하는 단계와; 상기 염기쌍에 대한 염기쌍 발산 심볼을 표시하는 단계와; 상태 s가 심볼 q를 발산할 확률(E s (q))과 상태 a에서 b로 전이할 확률(T ab )을 이용하여 상기 microRNA의 Viterbi 확률(P)을 계산하는 단계와; i 번째 염기쌍이 참(true)일 Viterbi 확률(P t (i))과 거짓(false)일 Viterbi 확률(P f (i))을 각각 계산하는 단계와; 상기 Viterbi 확률을 이용하여 완숙한 microRNA의 위치확률(S(i))을 계산하는 단계;를 포함하며, 상기 완숙한 microRNA의 위치확률(S(i))이 소정의 값 이상이면, 상기 위 염기쌍이 있는 위치를 성숙된 microRNA의 위치로 결정하는 것을 특징으로 한다. 본 발명에 따르면 학습시간이 짧고, 탐색시간도 훨씬 단축할 수 있으면서도 높은 효율을 나타내는 완숙한 microRNA 위치예측방법을 제공할 수 있으며, 또한 microRNA 유전자의 동정 뿐 아니라 완숙한 microRNA의 위치를 동시에 예측해서 알려 주기 때문에 훨씬 많은 정보를 제공할 수 있는 효과가 있다. microRNA, 은닉 마코프 모델, Viterbi 확률, 전구체
Abstract:
본 발명은 둘 이상의 유전자의 시계열적 발현 데이터로부터, 더욱 바람직하게는 DNA 마이크로어레이를 통해 수득된 둘 이상의 유전자의 시계열적 발현 데이터로부터, 특정 유전자가 다른 특정 유전자를 활성화시키거나 억제시키는 상관관계 등의 유전자 사이의 상관관계(correlation)를 분석하는 방법에 관한 것으로, 본 발명에 따른 방법은 SOM(self-organization maps)의 위상적 분석력 및 GTM의 확률적 은닉변수 모형의 재생 특성(generative property)을 결합한 새로운 확률적 은닉격자 모형(Self-Organizing Latent Lattice Model; SOLL Model)을 이용함을 특징으로 한다. DNA 마이크로어레이 데이터, 유전자들의 상관관계, 가시화, 은닉변수 모형, 은닉격자, 시간적 발현
Abstract:
본 발명은 인유두종바이러스의 위험군 분류방법에 관한 것으로, 보다 상세하게는 기 정의된 인유두종바이러스의 고위험군의 단백질서열과 저위험군의 단백질서열을 분류하는 단계와; 은닉마코프모델을 이용하여 최대분류지역을 검색하여 학습데이터를 생성하는 단계와; 상기 생성된 학습데이터를 스트링커널기반의 에스브이엠(Support Vector Machines)에 입력하여 학습시키는 단계와; 새로운 데이터를 상기 에스브이엠에 입력하여 상기 새로운 데이터의 고위험군 또는 저위험군 여부를 판별하는 단계를 갖는 인유두종바이러스의 위험군 분류방법에 관한 것이다.
Abstract:
본 발명은 DNA 가닥의 녹는점을 이용하여 DNA 컴퓨팅에서 필요한 실수 정보를 DNA 가닥에 인코딩하는 방법과, 이를 이용하여 그래프 문제를 해결하는 방법에 관한 것으로, 더욱 상세하게는, PCR 수행시 낮은 변성온도에서는 녹는점이 낮은 DNA 가닥이 상대적으로 더 많이 증폭된다는 사실에 기초하여, 녹는점의 차이를 이용해서 실수를 표현한 후 해당 녹는점을 가지는 DNA를 제작하고, PCR의 변성온도를 높은 것에서부터 시작하여 각 주기마다 서서히 낮추면서 PCR을 수행함으로써, 또는 그 반대로 낮은 변성 온도로부터 시작하여 각 주기마다 서서히 올려주면서 PCR을 수행함으로써, 필요한 DNA, 즉 큰 실수나 작은 실수를 표현하는 DNA를 상대적으로 더 많이 증폭시켜, 가중치가 있는 그래프문제를 해결할 수 있는 DNA 컴퓨팅 방법에 관한 것인데, 이는 녹는점이 관� �된 대부분의 구현 단계에 활용될 수 있고 해를 효율적으로 찾을 수 있다는 특징을 가진다.
Abstract:
PURPOSE: A computerized method for dynamically identifying an ncRNA(non-coding Ribonucleic Acid) sequence using a genetic programming technology is provided to quickly select only the miRNA(micro RNA) precursor or miRNA from a large quantity of genetic data with high peculiarity. CONSTITUTION: An initial group including a function tree is randomly generated. All function trees are transformed into structural grammar. All structural grammars are estimated through RNA motif search by using a positive data set and a negative data set. Peculiarity, sensitivity, and complexity are calculated from all structural grammars. The structural grammar having the fitness is transformed into the function tree. The selected function tree is modified through mutation and crossover. Next generation function tree having modification is generated and a fitness object is selected. Until the function tree having the fitness, the peculiarity, and the complexity is generated, previous steps are repeated.
Abstract:
본 발명은 DNA 컴퓨팅 기반 퍼셉트론의 구현 방법으로서, DNA 또는 RNA 등의 핵산을 이용해서 n 차원 입력 벡터를 표현하는 단계; 인 비트로(in vitro) 수준에서 입력 벡터의 각 요소에 대응되는 가중치를 표현하고 그 요소들의 가중치 합을 계산하는 단계; 및 상기 계산 결과를 측정하여 입력 벡터의 이진 분류를 수행하는 단계를 포함하는 것을 특징으로 한다. 또한, 본 발명은 DNA 컴퓨팅 기반 퍼셉트론의 구현 방법을 유전자 발현 패턴 또는 유전자 기반 진단에 이용하는 방법에 관한 것이다. 본 발명은 핵산 분자들 간의 혼성화 반응을 이용하여 가중치 합 연산을 수행하는 방법에 대한 것으로서, 상기 연산의 입력이 되는 입력 벡터를 핵산 분자를 이용해서 표현하는 단계; 상기 입력 벡터의 요소를 표현하는 핵산 분자와 이 핵산 분자에 특이적으로 결합하는 프로브 분자 사이의 경쟁적인 혼성화 반응을 통해 입력 벡터 요소의 가중치 합을 계산하는 단계; 및 상기 계산 결과를 측정하는 단계를 포함하는 것을 특징으로 한다. 본 발명은 상기 가중치 합 연산 방법을 이용하여 여러 종류의 목표 분자를 포함하고 있는 시료에 대해 각 목표 분자의 양의 가중치 합에 해당하는 정보를 얻어내는 정량 분석 방법을 포함한다. 또한 본 발명은 상기 연산 방법을 이용하여 유전자 발현 패턴 분석을 수행함으로써 해당 패턴의 이진 분류를 수행하는 것을 특징으로 유전자 발현 패턴 분석 및 유전자 기반 진단을 포함한다. DNA 컴퓨팅, 가중치 합 연산, 경쟁적 혼성화 반응, 정량 분석, 패턴 분류, 유전자 진단
Abstract:
본 발명은 희박데이터에 대한 분류성능을 향상시키기 위하여 베이지안망 분류기에 다수의 노드순서를 사용하는 방법으로서, 다수의 변수집합 U와 학습데이터 D를 바탕으로 소정의 개수의 노드순서( )를 사후확률분포( )로부터 생성하는 단계와; 마코프체인 몬테카를로 방법을 이용하여 상기 노드순서에 대한 결합확률분포( )를 계산하는 단계와; 상기 결합확률분포를 베이지안 분류를 위하여 근사화하는 단계와; 상기 근사화된 결합확률분포를 베이지안 분류기에 적용하는 단계;를 포함한다. 본 발명에 의하면 다중 노드순서에 대한 BMA를 통해 베이지안망 분류기의 희박데이터에 대한 분류 정확도를 향상시킬 수 있는 효과가 있다.
Abstract:
PURPOSE: A method for representing weighted numbers in DNA strands based on the melting temperature differences for DNA computing and a method for solving weighted graph problems by using the same are provided, thereby effectively applying weighted numbers to DNA strands for DNA computing. CONSTITUTION: A method for representing weighted numbers in DNA strands is characterized by using the melting temperature differences of DNA strands, wherein the melting temperature differences of DNA strands are formed by using GC contents and thermodynamic elements. A method for solving weighted graph problems is characterized by using DNA strands assigned by the weighted numbers, wherein the DNA strands assigned by the weighted numbers is amplified by denaturation temperature gradient PCR.
Abstract:
A weighted-sum computation method based on competitive hybridization reaction is provided to achieve the concept of perceptron through nucleic acid molecules and biochemical reactions and works between the nucleic acid molecules and apply the concept of perceptron to gene expression pattern or gene based diagnosis. A DNA computation method includes a step of forming an input-probe hetero duplex and computing a weighted sum through competitive hybridization reaction between each nucleotide strand of an input vector and a probe pair of a weight vector, a step of extracting the input-probe hetero duplex, and a step of measuring intensities of two different emission indicating signals which respectively represent positive and negative components in the extracted duplex to obtain a weighted sum computation result.
Abstract:
PURPOSE: A DNA computing method for supplying a solution of theorem proving is provided to experimentally implement a theorem proving solution in parallel using the resolution refutation. CONSTITUTION: A predetermined DNA sequence is allocated in one positive literal. A negative literal is expressed as a complementary sequence of the DNA sequence. One clause is expressed as a molecule combined by at least one DNA sequence. DNAs which each clause are mixed(1). A hybrid is formed with respect to a mixture of DNAs which express each clause(2). A nick of the hybrid-formed DNA is combined using a ligase(3). A PCR is executed based on the DNA(4). A size of the PCR product is checked(5).