육종가(Breeding Value)
- 23시간 전
- 5분 분량
정의
유전학과 육종학에서 육종가(또는 유전가, breeding value)는 한 개체가 다음 세대에 전달할 수 있는 유전적 잠재력을 의미한다. 이 글에서는 육종가의 개념을 이해하는 데 필요한 기본 이론과 함께, 전통적인 BLUP 방법에서 GBLUP 및 Bayesian 방법으로 이어지는 계산 방법의 발전을 개념 위주로 소개한다. 또한 표현형과 유전형의 관계, 유전력(heritability)의 의미, 그리고 실무에서 자주 발생하는 오해를 짚어본다.
개념과 중요성

육종가는 개체가 부모로서 갖는 가치를
숫자로 표현한 것이다. 미국 퍼듀 대학에서는 육종가를 모든 형질에 대해 해당 동물이 가진 유전자의 효과를 합산한 값으로 정의하며,
한 동물이 유전자로 인해 부모로서 어느 정도의 가치를 지니는지를 나타내는 지표라고 설명한다. 유전자는 한 쌍씩 존재하고, 자손에게는 부모로부터 절반씩 전달되므로 개체의 육종가의 절반이 바로 전달능력(transmitting ability)이 된다. 개체의 자손이 얼마나 우수한 성적을 나타낼지 예측하려면 부모의 육종가를 평균하면 된다.
표현형과 유전형의 차이
개체의 표현형(phenotype) 은 유전형(genotype)과 환경 요인이 결합한 결과다. 따라서 몸무게, 성장률과 같이 눈으로 보거나 측정할 수 있는 값은 유전적 요인뿐 아니라 사육 환경, 영양, 질병 등 다양한 환경 요인에 의해 영향을 받는다. 육종가를 추정하는 목적은 이러한 환경 효과를 제거하고 유전형의 가치를 파악하는 것이다.
호주 Sheep Genetics가 제공하는 ‘유전 평가 이해하기’ 자료에서는 유전 평가가 개체의 족보와 성적, 친척들의 성적, 그리고 가능한 경우 유전체 정보까지 활용하여 많은 비교를 수행하는 과정이라고 설명한다. 이 자료에서는 육종가를 통해 “동물이 크거나 우수한 이유가 사료 때문인지 유전 때문인지”를 구별할 수 있다고 강조한다. 또한 집단 내 개체들의 표현형 차이는 유전적 요인과 환경적 요인의 결과이며, 분석에서는 출생 유형과 같이 반복 가능한 환경 요인을 고정효과로 처리함으로써 유전적 차이를 더 정확하게 추정한다고 설명한다.
유전력(heritable)에 대한 이해
육종가를 정확히 추정하려면 유전력(heritability) 의 개념을 이해해야 한다. 퍼듀 대학 자료에 따르면, 유전력은 개체 간 성적 차이 중 유전적 차이에 의해 설명되는 비율을 의미하며, 이 값은 0부터 1까지의 범위를 가진다. 유전력이 높을수록 개체의 표현형이 실제 육종가와 더 잘 일치한다는 것을 의미하고, 유전력이 낮을수록 환경 요인의 영향이 크기 때문에 표현형이 육종가를 잘 반영하지 못한다. 예를 들어 성장률이나 등지방 두께처럼 유전력이 높은 형질은 개체의 실제 성적이 유전자의 효과를 잘 나타내므로 개체 하나의 기록만으로도 어느 정도 육종가를 추정할 수 있다. 반면 산자수처럼 유전력이 낮은 형질은 환경 영향을 크게 받으므로 개체 본인의 기록만으로는 육종가를 추정하기 어렵고, 친척들의 정보까지 활용해야 한다.
유전력은 또한 부모 성적의 우수함(선발차, selection differential)이 자손에게 얼마나 전해질지를 나타낸다. 퍼듀 대학 자료는 “유전력은 부모의 우수성이 자손의 우수성으로 얼마나 실현될 것인지에 대한 비율”이라고 설명한다. 따라서 유전력이 높은 형질에서는 선발 효과가 빠르게 나타나지만, 낮은 형질에서는 환경 개선이 더 효과적일 수 있다. 또한 유전력은 집단, 환경, 관리 수준에 따라 달라질 수 있으며, 사육 환경을 동일하게 관리하고 비유전적인 변이를 교정할수록 추정 정확도가 높아진다.
BLUP: 전통적인 육종가 추정 방법
BLUP(Best Linear Unbiased Prediction) 은 육종 프로그램에서 널리 사용되는 혼합모형 기반 통계 방법이다. BLUP은 개체의 표현형 데이터와 족보(혈연) 정보를 결합하여 무작위 유전 효과를 예측하는 방법으로, 1960~70년대 동물육종에서 개발되어 현재는 식물 및 수산 육종에도 폭넓게 활용된다.
∙ 원리: BLUP은 고정효과(예: 시험연도, 장소)와 무작위 유전효과(개체의 육종가)를 동시에 추정하는 혼합모형을 사용한다. 페디그리 기반 BLUP은 마커 데이터가 없는 상황에서 혈연관계 행렬을 활용하여 개체 간 공분산을 정의하며, 여러 세대와 환경에 걸친 데이터를 통합하여 선택 정확도를 최대화한다. 이 방법은 여러 정보원을 동시에 활용하여 선발 정확도를 높이고 환경효과를 보정할 수 있기 때문에 육종가 추정에서 표준으로 자리잡았다.
∙ 실무 적용: BLUP 기반 유전 평가에서는 개체의 본인 성적뿐 아니라 부모·형제·자손의 성적, 관련 형질 간 상관관계 등이 함께 분석된다. 미국 퍼듀 대학 자료는 육종가를 직접 알 수 없기 때문에 개체 자신의 성적과 친척 정보를 이용해 육종가를 추정해야 한다고 강조한다. 추정된 육종가가 바로 추정 육종가(EBV)이며, 같은 품종 내에서 개체를 비교할 수 있는 가장 정확한 도구로 활용된다.
GBLUP: 유전체 정보의 도입
유전체 BLUP(GBLUP) 은 BLUP을 확장하여 DNA 마커 데이터를 이용한 유전적 유사도를 사용한다. gBLUP은 페디그리 기반 혈연행렬 대신 단일염기다형성(SNP) 마커로부터 계산한 유전체 관계행렬(genomic relationship matrix) 을 이용해 개체 간 공분산을 정의한다. 이 행렬은 족보에서 기대되는 유사도(부모 자식, 형제 관계) 대신, 실제 마커 유사도를 기반으로 하므로 육종가 예측 정확도가 더 높아진다. 연구에서는 gBLUP이 전통적인 BLUP보다 20–50% 높은 정확도를 제공하며, 젖소 등 여러 가축에서 부모 평균 기반 예측보다 16–33% 높은 신뢰도를 달성했다고 보고한다.
또한 gBLUP은 모든 SNP의 효과 분산을 동일하게 가정하고, 각 마커의 효과를 무작위 효과로 포함하여 육종가를 추정한다. 마커 수가 형질 관측 수보다 훨씬 많을 때, SNP 효과를 무작위로 처리하는 방법(RR-BLUP 또는 SNP-BLUP)과 동일하다는 점도 알아두자.
Bayesian 방법: 마커별 가중치를 고려한 현대적 접근
gBLUP의 가정은 모든 마커가 동일한 분산을 갖고 형질에 기여한다는 것이다. 그러나 현실에서는 소수의 QTL이 큰 효과를 가지는 형질도 많다. 이런 경우 Bayesian 방법이 더 적합할 수 있다.
최근 연구에서는 BLUP 계열과 Bayesian 계열을 비교하며, 두 접근법의 차이를 다음과 같이 정리했다. BLUP 계열(GBLUP, CBLUP, SBLUP)은 모든 마커가 형질 변이에 기여한다고 가정하고, 마커 효과가 정규분포를 따라 모든 마커에 동일한 분산을 부여한다. 반면 Bayesian 방법은 일부 마커만 효과가 있다고 가정하여 각 마커의 분산에 서로 다른 가중치를 부여하거나 일부 마커의 효과를 0으로 축소(shrink)한다.
Bayesian 방법에는 여러 변형이 있다. BayesA는 모든 마커가 효과를 갖되 마커별 분산이 서로 다르다고 가정한다. BayesB는 일부 마커는 효과가 없고 나머지 마커만 서로 다른 분산을 가진다고 가정한다. BayesC는 효과를 가진 마커만 공통 분산을 갖도록 가정한다. 또 Bayesian LASSO(BL)와 Bayesian Ridge Regression(BRR)은 마커 효과를 정규분포로 가정하면서 가중치 축소를 통해 중요하지 않은 마커를 0에 가깝게 만든다.
실험 결과에 따르면, Bayesian 방법은 몇몇 큰 효과 QTL에 의해 조절되는 형질이나 유전력이 높은 형질에서 BLUP보다 더 높은 예측 정확도를 제공하며, 많은 작은 효과 QTL이 형질을 조절할 때는 gBLUP이 더 우수하거나 비슷한 성능을 보인다. 따라서 형질의 유전적 구조(유전자의 영향 개수와 크기)와 유전력을 고려하여 적절한 모델을 선택하는 것이 중요하다.
실무에서 자주 생기는 오해
육종가와 유전력에 대한 이해가 부족하면 잘못된 해석이 발생할 수 있다. 다음은 실무에서 자주 발생하는 오해와 그 해설이다.
1. “표현형이 우수한 개체 = 육종가가 우수한 개체”
앞서 보았듯이 표현형은 유전형과 환경 효과의 합이다. 퍼듀 대학 자료에서는 개체의 성적만으로 육종가를 정확히 알 수 없으며, 친척의 성적까지 활용해야 정확한 추정이 가능하다고 강조한다. 특히 유전력이 낮은 형질에서는 환경의 영향이 크기 때문에 우수한 성적이 환경 요인 때문일 수 있다. 따라서 육종가는 EBV와 같은 과학적 평가를 통해 비교해야 하며, 단순히 눈으로 보는 성적에 의존해서는 안 된다.
2. “유전력이 높으면 환경을 신경 쓸 필요 없다”
유전력이 높다는 것은 집단 내 변이 중 유전적 요인이 차지하는 비중이 크다는 의미일 뿐, 환경이 형질에 영향을 미치지 않는다는 뜻은 아니다. 퍼듀 대학 자료는 유전력이 집단과 환경 수준에 따라 달라질 수 있으며, 사육 환경과 기록 관리가 불완전하면 유전 차이를 감추어 추정이 부정확해진다고 경고한다. 따라서 환경을 균일하게 관리하고 비유전적 변이를 교정하는 것이 육종가 추정 정확도를 향상시키는 핵심이다.
3. “모든 EBV는 직접 비교할 수 있다”
EBV는 특정 품종의 기준과 단위로 표현되기 때문에 같은 품종 내에서만 비교할 수 있다. FutureBeef 자료는 EBV가 개체의 유전적 잠재력이 기준 집단과 얼마나 차이가 있는지를 나타낸 값이며, 품종 간 EBV는 비교할 수 없음을 주의해야 한다고 설명한다. 또한 EBV의 정확도(accuracy) 를 함께 고려해야 신뢰할 수 있는 선택이 가능하다.
마치며
육종가 계산은 전통적인 통계 모형에서 시작하여 유전체 데이터와 고급 베이즈 추정법까지 발전해 왔다. BLUP은 표현형과 족보 정보를 이용해 무작위 유전효과를 추정하는 기본 방법이며, GBLUP은 DNA 마커에서 파생된 유전체 관계행렬을 도입하여 예측 정확도를 크게 향상시켰다. Bayesian 방법은 마커별 가중치를 달리하여 소수의 큰 효과 유전자가 존재하는 형질에서 더 높은 예측력을 보여준다. 그러나 모든 방법은 표현형이 유전적 효과와 환경 효과의 합이라는 사실과 유전력이 집단·환경에 따라 달라진다는 점을 전제로 한다. 다양한 정보원을 적절히 통합하고 모델의 가정을 이해한다면, 육종가는 육종 프로그램에서 가장 중요한 의사결정 도구가 될 것이다.




댓글