결제안내
 

Home > 분석서비스 > 분석게시판

크게 작게 인쇄

[eMass Tech Note] 단백질의 시료 특성 별 아미노산 서열 분석 접근 가이드

그림) 단백질의 서열 분석의 기본 과정
개요
 
단백질(protein)을 연구 소재로 연구를 하는 다양한 실험실에서 여러 가지 다양한 실험 조건에서 분리된 단백질(protein)에 대한 서열 확인은 중요한 실험의 진행 방향을 결정 짓는 요소로 작용합니다. 특히, 천연의 단백질(protein) (native protein)의 경우 참고할 정보가 거의 전무한 상태에서 서열 분석을 시도하는 경우 보다 치밀하고 전략적인 접근이 없이 시작하는 경우, 높은 빈도의 실패를 경험하고 다시 초기 단계로 돌아가 반복적인 실험을 수행하는 치명적인 실수를 경험할 때가 많습니다. 따라서 본 자료는 단백질(protein) (이하 펩티드(peptide)도 포함)에 대한 서열 분석을 보다 효율적인 접근을 필요로 할 때, 일반적인 기술 지원의 성격으로 가이드를 하고자 기초적인 관점에서 접근할 때 참고 자료로서 활용되길 바랍니다.
 
 
천연 단백질(protein)/펩티드(peptide)( 서열에 대한 정보가 없는 경우 ) :
 
 
 
포 분비 단백질(protein) - mature form
 
 
단백질(protein)의 생물학적 source 가 동일한 단백질(protein)이라고 할 수 있습니다. 지구상 모든 생명체들은 생물학적 항상성을 유지하기 위하여 다양한 기능을 가지는 단백질(protein) pre-cursor 또는 mature form 의 형태로 세포 밖 (Extra-cellular) 으로 분비하게 됩니다. 이런 단백질(protein)의 대부분의 경우, 대부분이 signal peptide 가 분비되는 과정에서 cleavage 되어 N 말단 부분의 펩티드(peptide) 사슬이 flexible 한 구조로 존재하게 됩니다.
우선, protein ID 를 통하여 public sequence DB(blast, swissprot..)등에 등재되지 않은 단백질(protein) (novel protein)인지 아니면 다른 연구자의 연구를 통해 규명된 단백질(protein) 인지 확인하기 위해서는 전체 아미노산 서열정보를 확인하기 보다는 N 말단의 10~20 mer 가량의 아미노산 서열을 Edman Sequencing 분석을 통한 서열 확인을 통해 정보를 얻을 수 있습니다. 이때 필요한 단백질(protein) 양은 4~6ug 정도의 양이 분석에 필요한 양이며 정제가 완전히 되지 않은 상태이더라도 단백질(protein) 전기영동 Electro-blotting (PVDF membrane) → staining destaining 과정을 통해transfer 된 단백질(protein)을 확인하고 그 부분의 membrane piece 를 아미노산 서열 분석기에 주입하여 분석합니다.
 
 
포 분비 단백질(protein) - precursor form
 
 
단백질(protein)이 세포 밖으로 분비될 때 주변환경에 따라 쉽게 단백질(protein)의 기능이 활성화(activation)가 유도되는 경우 전체 시스템의 불안정을 야기할 수 있습니다. 따라서, 이러한 최종 신호전달 체계 또는 기능성 단백질(protein) N 말단 부분에서는 pre-peptide 가 일종의 cap 역할을 수행하여 미리 활성화를 방지하는 역할을 합니다. 이러한 단백질(protein) N 말단은 pre-peptide 에 의해 blockage 된 형태가 되어 있어 직접적인 Edman Sequencing 을 수행하기 어렵습니다. 이런 경우, signal cascade 반응의 활성화를 유도하여 final protein 의 활성화를 유도한 조건을 유도한 다음, 단백질(protein) 전기영동을 수행하여 활성화된 형태(active-form)의 단백질(protein)을 확인하고 기존의 N 말단 서열 분석을 위한 시료 준비과정을 진행하여 분석을 수행합니다. (유사 반응 시스템 : 혈액 응고 반응. Complement 활성화 반응. 무 척추 동물의 체내 멜라닌 합성 반응 등.)
 
 
포 분비 단백질(protein) - 저분자 단백질(protein)(펩티드(peptide))
 
 
저분자 단백질(protein)들은 생물학적 기능별로 다양하게 나눌 수 있지만 구조적으로linear-form cyclic-form으로 나눌 수 있습니다. Linear form 의 단백질(protein)은 길이가 짧은 경우 10 mer 내외의 아미노산으로부터 긴 경우에는 50~60 mer 에 이르는 경우가 있습니다. 30~40 mer 이내의 경우, HPLC RP C18 column 등을 이용한 정제를 거친 다음 최종 약 1~2ug 정도의 양이 있는 경우 Edman Sequencing 을 통한 분석이 가능하며 > 35 mer 인 긴 peptide 의 경우 Lys C protease 등과 같은 single cleavage site에 대한 가수 분해반응이 가능한 효소를 이용하여 저분자의 펩티드(peptide)로 나누고 LC-Q-TOF 또는 LC-MS 장비를 이용하여peptide fragment 에 대한 각각의 MS/MS sequencing 분석을 수행하여 결과 데이터를 얻습니다. 반면 cyclic peptide 의 특성은 일반적으로 amino acid 간의 disulfide bond 가 아닌 thio-ester bond 를 형성하는 등 결합을 끊어 환원시키는 방법이 제한적이므로 MS/MS sequencing 분석과 함께 NMR 등의 분석을 통해 세부적인 아미노산 조성의 분석도 함께 수행되어야 합니다. 이와 같은 대표적인 펩티드(peptide)는 미생물이 생산하는 항균펩티드(peptide)가 실 예로 들 수 있습니다.
 
 
천연 단백질(protein)/펩티드(peptide)
 
포 내 단백질(protein)
 
 일반적으로 세포 내 수용성 단백질(protein) (cytosolic protein)의 형태로 미량으로 다양한 세포 소기관 내에 존재하며 다양한 세포 내 신호전달 및 세포의 항상성 (homeostasis)를 유지하는 역할을 수행합니다. 최근 가장 관심 있는 분야는 signaling 과 관련한 new marker protein 으로 주로protein-protein interaction 을 통하여 신호를 전달하므로 항체를 이용한 IP 또는 Co-IP 방법을 통하거나 pull-down assay 를 통한 단백질(protein) 부분 정제를 통해 얻어진 단백질(protein)인 경우가 대다수 입니다. 이런 조건에서 얻어진 단백질(protein)의 양은 극히 제한적일 수 밖에 없으므로 대부분 초기단계에는 서열을 확인하는 목적 보다는 protein ID 에 초점을 맞추고 접근하는 방향을 선택하는데 이때, 범용적으로 분석하는 방법이 peptide mapping 을 통한 MS 분석 또는 MS/MS 분석을 수행한다. 인간 또는 마우스 그리고 식물에서는 Aradopsis 와 같은 유전자 정보가 체계적으로 확인된 모델군인 경우protein ID 의 성공확률이 높은 반면, 상대적으로DB poor 한 생물군의 경우 현재까지 제한적인 성공률을 보이고 있습니다보통 MS 분석이나 MS/MS 분석에서 얻어진 sequence coverage 를 보고 sequencing 확인으로 오인하는 경우가 종종 있으나 본 결과는 protein ID 에 해당하는 제한적인 결과임을 명심해야 합니다.
 
 
재조합 단백질(protein)/펩티드(peptide) (서열에 대한 정보가 있는 경우)
 
 
 대부분의 재조합 단백질(protein)은 고유의 단백질(protein) 발현 시스템에서 보다 향상된 발현 효율과 부가적인 결과를 얻기 위하여 개량된 생물종의 cell line 을 이용하여 과 발현(over-__EXPRESSION__)을 통하여 얻는 경우가 대다수 입니다. 이런 경우, 대부분은 초기 발현 단계에서는 발현의 조건을 최적화 (optimization)을 위하여 다양한 조건의 실험에서 발현된 단백질(protein)의 안정성 테스트 (protein stability)를 확인하기 위한 것이 주 서열 분석의 주 목적입니다. 따라서, target protein 으로 생각되는 정제된 단백질(protein) N-말단의 10개 미만의 아미노산 서열 분석을 통하여 protein 의 발현 성공률을 평가하는 기준으로 삼아 연구를 진행합니다. 따라서 질량 분석기(mass spectrometer)를 이용한 분석은 직접적인 intact protein 수준에서의 서열 분석이 제한적인 관계로 Edman Sequencing 을 이용한 N 말단 부분 서열 확인을 통하여 단백질(protein) 발현 조건의 안정성 테스트를 수행합니다. QC 단계에서는 단백질(protein)의 생물학적 동질성 평가를 위한 항목 중 단백질(protein)의 물리화학적 특성을 평가하는 항목 중 단백질(protein)의 전체 서열 결정이 있는데 이때에는 N 말단 뿐만 아니라 C 말단 그리고 peptide mapping 을 통한 서열 확인을 거치게 됩니다. 이 과정에서는 Edman Sequencing 분석법과 질량 분석기를 이용한 MS/MS sequencing 분석과정을 총괄하여 얻어진 데이터를 수집하여 최대한의 효율적인 sequence 분석결과를 확인하게 됩니다.
 
특히, 최근 들어 바이오 의약품과 같이 규제 대상의 단백질(protein)인 경우에는 보다 엄격하고 세밀한 sequence 분석 결과를 식약처 (KFDA)등과 같은 감독 기관이 요구하는 추세입니다. 합성 펩티드(peptide) 분야는 크게 약물 펩티드(peptide)와 연구용 펩티드(peptide)로 나눌 수 있으며, 약물인 펩티드(peptide)의 경우 현재까지 약전과 같은 규제 시험법이 확립되지는 않았지만 기본적으로 서열분석은 Edman Sequencing 을 통한 분석과 MS/MS sequencing 을 통한 서열 분석이 병행적으로 사용되고 있는 추세입니다. 반면, 연구용 펩티드(peptide)의 경우 linear form peptide 의 경우는 기존의 Edman Sequencing 분석법을 통한 서열결정도 유효하나 최근 들어cyclic form 의 경우 보다 안정된 서열 분석을 위해 MS/MS 분석을 권장하고 있는 추세입니다.
 
 
PTMs 유도 단백질(protein)/펩티드(peptide) (서열에 대한 정보가 있는 경우)
 
대부분은 세포 내에서 일어나는 경우의 빈도가 높으나 부분적으로는 분비되는 단백질(protein)에도 해당되기도 합니다. 특히 glycosylation 이 대표적인 PTMs 의 예가 되는데, 단백질(protein)의 아미노산의 기본 골격이 변하는 것이 아닌 상태로 당쇄(glycan)가 부착되는 특성이므로 일반적으로 bottom-up 방식으로 접근하는 MS/MS 분석이 주요한 접근법입니다. 그 외 phosphorylation 등과 같은 경우에는 단백질(protein) 내에 random 하게 일어난 경우에는 예측이 정확하지 않는 경우가 있으므로 예상되는 아미노산 (Serine, Threonine, Tyrosine) 과 같은 곳에 예상 변형을 예측하여 참고되는 mass 값과 실제 측정된mass 값의 일치점을 확인하여 PTMs 이 포함된 서열을 확인합니다. 대부분 정확성을 높이기 위해서는 1D SDS-PAGE 보다는 2D SDS-PAGE 를 수행하여 얻어진 정제된 단백질(protein) 시료를 준비 할 것을 권장합니다. 그리고 이런 특정 변형된 아미노산은 종종 서열 결정 이외에도 정량적인 분석을 통해 신호의 전달 (signal on)의 강도를 측정하고자 합니다. 이때에는 서열이 동일한 펩티드(peptide)를 합성하여 신호전달 시스템과 동일한 조건하에서 assay 를 수행하여 얻어진 펩티드(peptide) reference 로 이용하여 검량곡선 (standard curve)를 작성하고 시료 단백질(protein)의 동일 서열에 해당하는 펩티드(peptide)를 이온화 값 (XIC)를 측정하여 상대적인 정량을 수행하는 방법이 있습니다. 이와 같은 분석으로 접근하기 위해서는 이미 PTMs 이 일어날 site 의 정확한 서열 분석이 미리 수행되어야 합니다. 참고로 Edman Sequencing 분석법은 PTMs 이 유도된 변형된 아미노산의 분석과 식별은 cysteine 을 제외하고는 제한적인 한계가 있습니다.
 
 
Zymogram 테스트 단백질(protein)
 
가수분해 효소를 단백질(protein) 전기영동의 조건하에서 활성을 테스트 하는 실험법으로 단백질(protein)의 비활성화를 방지하기 위하여 일반적으로 반응 기질이 포함된native-PAGE 전기영동을 수행하여 활성을 가수분해 기질의 색의 변화를 통하여 활성 있는 단백질(protein)을 검출하는 방식입니다. 종종, 이들 단백질(protein)ID 를 위하여 protein sequencing 을 수행하는 경우에는 아래와 같은 방법으로 진행하기를 권장합니다. 대부분 초기 total protein full fraction 상태이므로 target 단백질(protein)의 순도는 상당히 낮은 수준입니다. 따라서 이들 기질이 가장 강하게 발색한 영역을 gel-elution 을 통하여 단백질(protein)을 추출하여 SDS-PAGE 를 수행하여 얻어진 단백질(protein) band 를 기존의 protein sequencing 을 통하여 확인하면 됩니다. 가급적 zymogram 을 수행할 때, coomassie blue staining 을 통하여 분리/순도 등을 체크한 후 단백질(protein)의 양적인 부분을 가늠하여 gel-elution 을 진행합니다. 참고로 최근 gel 로 부터 direct 하게 단백질(protein)을 분리하는 kit 가 판매되므로 이용하는 것도 한가지 방법입니다.
코멘트 0