Abstract:
PURPOSE: A prediction device predicting an important part from amino acid or nucleic acid sequences and a method thereof are provided to detailedly and accurately measure an important part of a life molecule sequence, thereby reducing costs and time required for discovering the important part. CONSTITUTION: A sequence database(130) stores information of an amino acid or nucleic acid sequence. A multi sequence arranging means(120) searches and arranges sequences related to the inputted amino acid or nucleic acid sequence in the sequence database. A multi sequence arrangement post-processing means(140) controls redundancy of a similar sequence based on multi sequence arrangement. A sequence profile calculating means(150) calculates a sequence profile based on multi sequence arrangement post-processing. A joint probability calculating means(160) calculates a joint probability of the amino acid and the nucleic acid based on the multi sequence arrangement post-processing means and the sequence profile calculating means. [Reference numerals] (110) Input means; (120) Multi sequence arranging means; (130) Sequence database; (140) Multi sequence arrangement post-processing means; (150) Sequence profile calculating means; (160) Joint probability calculating means; (170) Coevolution analyzing means; (180) Essential portion selecting means; (190) Output means
Abstract:
본 발명은 단백질의 아미노산 서열로부터 삼차 구조를 예측하기 위한 장치 및 이의 예측 방법에 관한 것으로, 구체적으로 입력수단; 상기 입력수단에서 입력된 미지 단백질 서열을 전처리하는 수단; 주형 단백질 데이터베이스; 짝 비교 수단; 단백질 유사도 네트워크 데이터베이스; 상기 단백질 유사도 네트워크 데이터베이스에 기초하여 미지 단백질과 주형 단백질을 전역적으로 비교하는 전역 비교 수단; 주형 선택 수단; 모델링 수단; 상기 예측된 단백질 구조를 검증하는 검증 수단; 및 출력수단을 포함하여 이루어지는 미지 단백질의 삼차 구조 예측 장치 및 이의 예측 방법에 관한 것이다. 본 발명은 기존의 단백질 예측 방법들보다 정확하고 정밀하게 단백질의 삼차 구조를 예측해줌으로써, 실험적으로 단백질 구조를 밝히는데 소비되는 비용과 시간을 절감하는 효과가 있으므로 각종 질병을 치료를 위한 연구 분야에 유용하게 사용될 수 있다. 단백질, 삼차 구조, 예측 방법, 단백질 유사도 네트워크 데이터베이스
Abstract:
본 발명은 아미노산 또는 핵산 서열로부터 중요부위를 예측하기 위한 장치 및 예측방법에 관한 것으로, 구체적으로 아미노산 또는 핵산 서열이 입력되는 입력수단; 상기 입력수단에서 입력된 아미노산 또는 핵산 서열과 진화적으로 관련 있는 서열들을 검색하고 이들을 서로 정렬하는 다중서열정렬 수단; 아미노산 또는 핵산 서열의 정보가 저장된 서열 데이터베이스; 상기 다중서열정렬에 기초하여 유사한 서열의 중복성을 조정하는 다중서열정렬 후처리수단; 상기 다중서열정렬 후처리수단에 기초하여 서열 프로파일을 계산해주는 서열프로파일 계산수단; 상기 다중서열정렬 후처리수단과 상기 서열프로파일 계산수단에 기초하여 아미노산 또는 핵산의 결합 확률을 계산해주는 결합확률 계산수단; 상기 결합확률 계산수단에 기초하여 서열상의 서로 다른 위치 사이의 연관성을 측정하는 공진화 분석수단; 상기 공진화 분석수단에 기초하여 미지 서열의 중요부위를 예측하는 중요부위 선택수단; 및 상기 예측된 중요부위를 출력하는 출력수단;을 포함하여 이루어지는 아미노산 또는 핵산 서열로부터 중요부위를 예측하는 예측장치에 관한 것이다.
Abstract:
A device and a method for predicting a tertiary structure from amino acid sequences of protein are provided to reduce a cost and time for experimentally declaring a structure of the protein by predicting the tertiary structure of the amino acid sequences of the protein correctly/precisely more than usual prediction methods. A sequence preprocessor(100) preprocesses unknown protein sequences inputted from an input device(10). A mold protein database(102) stores information of mold protein. A matching comparator(101) compares unknown protein with the mold protein based on the mold protein database. A protein similarity network database(104) stores structure similarity among the mold proteins. A global comparator(103) compares the unknown protein with the mold protein globally based on the protein similarity network database. A mold selector(105) selects more than one of the mold proteins having a structure similar to the unknown protein based on a result of the matching comparator and the global comparator. A modeler(106) predicts a 3D(Dimensional) structure of the unknown protein based on the result of the mold selector. A verifier(107) verifies the predicted protein structure. An output part(20) outputs the predicted protein structure.