doi: 10.15389/agrobiology.2015.5.571rus

УДК 575.17:575.118.5:575.162:57.087.1

Работа выполнена при частичной поддержке РФФИ (грант № 13-04-00128-а).

ОЦЕНКА МЕРЫ ИНФОРМАЦИОННОГО ПОЛИМОРФИЗМА
ГЕНЕТИЧЕСКОГО РАЗНООБРАЗИЯ

Ю.В. ЧЕСНОКОВ, А.М. АРТЕМЬЕВА

Одна из основных целей генетики растений и животных — это идентификация и картирование генов. При определении генетического сцепления обычно стараются установить, какие маркерные локусы (маркеры) имеют аллели, косегрегирующие с аллелями желаемого локуса. Пригодность маркера для указанных целей зависит от числа аллелей, которые имеет этот маркер, и их соответствующих относительных частот. Количественно степень полиморфизма обычно измеряется двумя различными величинами, или показателями (мерами), — гетерозиготностью (heterozygosity, Н), для которой объективный алгоритм оценки и формула изменчивости хорошо известны (M. Nei с соавт., 1974; M. Nei с соавт., 1979), и величиной информационного полиморфизма (рolymorphism information content, PIC) (D. Botstein с соавт., 1980). Исходя из этого в работе на основе данных литературы описаны статистические подходы, применяемые для анализа информационного полиморфизма. Рассмотрены меры информационного полиморфизма, гетерозиготности и некоторых сопутствующих величин, определяемых при оценке генетического разнообразия как на межвидовом, так и на внутривидовом популяционном уровне. Мера, или величина, информационного полиморфизма (PIC) определяется способностью маркера устанавливать полиморфизм популяции в зависимости от числа обнаруживаемых аллелей и распределения их частот (D. Botstein c соавт., 1980). Таким образом, PIC выявляет дискриминационную способность маркера, фактически зависит от числа известных (устанавливаемых) аллелей и распределения их частот и тем самым эквивалентна генному разнообразию. Для доминантных маркеров максимальное значение PIC составляет 0,5. Следует отметить, что в случае маркеров с равным распределением частот внутри популяции величина PIC выше. Маркеры с множественными аллелями имеют еще большие значения этого показателя, однако при этом величина PIC также зависит от распределения частот аллелей. С помощью 21 пары SSR (simple sequence repeats) и 12 пар S-SAP (sequence specific amplified polymorphism) праймеров у 96 образцов Brassica rapa L. из стержневой коллекции ВИР мы обнаружили 135 SSR и 123 S-SAP полиморфных маркера. Среднее значение PIC для обоих типов маркеров — 0,316, тогда как для микросателлитных маркеров — 0,257, для S-SAP маркеров — 0,379, то есть в среднем на 50 % выше. Ожидаемую (HE) гетерозиготность обычно определяют, когда описывают генетическое разнообразие, поскольку она менее чувствительна к размеру выборки, чем наблюдаемая гетерозиготность (НO). Если HO и HE схожи (достоверно не различаются), скрещивание в популяции происходит практически случайно. При HO < HE, популяция инбредная. Если HO > HE, то в популяции система случайного скрещивания преобладает над инбридингом. Эффективное мультиплексное отношение (effective multiplex ratio, EMR) определяют как произведение общего числа полиморфных локусов (на праймер) и доли полиморфных локусов от их общего числа (W. Powell с соавт., 1996; J. Nagaraju с соавт., 2001). Маркерный индекс (marker index, MI) — статистическая величина, используемая для оценки суммарной пригодности маркерной системы (чем выше значение MI для методики, тем она лучше) (W. Powell с соавт., 1996; J. Nagaraju с соавт., 2001). Чтобы отразить способность сочетания «праймер—применяемая методика» устанавливать различия между большим числом генотипов, используют показатель разрешающей способности (resolving power, Rp) (J.E. Gilbert с соавт., 1999; A. Prevost с соавт., 1999). Представлена информация о некоторых продуктах программного обеспечения, которое может быть использовано для расчета величины информационного полиморфизма и гетерозиготности. Приведены формулы для установления эффективного мультиплексного отношения, маркерного индекса и показателя разрешающей способности комбинации «праймер—применяемая методика». 

Ключевые слова: гетерозиготность, величина информационного полиморфизма, эффективное мультиплексное отношение, маркерный индекс, показатель разрешающей способности, программное обеспечение.

 

Полный текст

 

EVALUATION OF THE MEASURE OF POLYMORPHISM
INFORMATION OF GENETIC DIVERSITY

Yu.V. Chesnokov, A.M. Artemyeva

Gene identification and mapping are one of the main goals of plant and animal genetics. Upon verifying genetic linkage it is usually found which marker loci (markers) possess alleles co-segregated with the alleles of the desired locus. Marker utility for these purposes depends on the number of alleles, which the marker possesses, and their relative rates. There are two indexes, or measures, usually used for the polymorphism degree evaluation. They are the heterozygosity (Н) for which the evaluation method and variability formula are well known (M. Nei et al., 1974, 1979), and polymorphism information content (PIC) (D. Botstein et al., 1980). Based on published data, we described the statistical approaches which are used for analysis of polymorphism information. Herein, the value of polymorphism information content, heterozygosity and some associated values detected upon evaluation of genetic diversity on interspecific and intraspecific population levels are considered. PIC shows haw the marker can indicate the population polymorphism depending on the number and frequency of the alleles (D. Botstein et al., 1980). So the PIC reflects a discriminating ability of the marker and, in fact, depends on the number of known alleles and their frequency distribution, thus being equal to genetic diversity. PIC maximal value for dominant markers is 0.5. Note, that for the markers with equal distribution in the population the PIC values are higher. They are much higher for markers with multiple alleles, and, however, also depend on the frequency distribution of the alleles. Using 135 SSR (simple sequence repeats) and 123 S-SAP (sequence specific amplified polymorphism) primers, we found 135 SSR и 123 S-SAP polymorphic markers among 96 Brassica rapa L. samples from the VIR (N.I. Vavilov Institute of Plant Genetic Resources) core collection. The PIC values for both markers, SSR and S-SAP markers were 0.316, 0.257 and 0.379 (50 % higher on average), respectively. Expected heterozigosity (HE) is usually used to describe the genetic diversity because it is less sensitive to the sample size compared to observed heterozigosity (HO). The  crossings in the population are occasional, if HO and HE are similar (i.e., no reliable differences found). They are related as HO < HE in inbred population, and as HO > HE in case of occasional crossing prevailing compared with inbreeding. Effective multiplex ratio (EMR) is calculated as total number of polymorphic loci per primer multiplied by the rate of polymorphic loci from their total number (W. Powell с соавт., 1996; J. Nagaraju с соавт., 2001). Marker index (MI) is a statistical parameter used to estimate total utility of the maker system; the higher MI, the better method is used) (W. Powell et al., 1996; J. Nagaraju et al., 2001). Resolving power (Rp) is a parameter characterizing ability of the primer/marker combination to detect differences between large numbers of genotypes (J.E. Gilbert et al., 1999; A. Prevost et al., 1999). The information about some software which can be used for calculation of polymorphism information content value and heterozygosity is also summarized. The formula for effective multiplex ratio, marker index calculation, and resolving power calculation are shown.  

Keywords: heterozygosity, polymorphism information content value, effective multiplex ratio, marker index, resolving power, software.

 

ФГБНУ ФИЦ Всероссийский институт генетических ресурсов растений им. Н.И. Вавилова (ВИР),
190000 Россия, г. Санкт-Петербург, ул. Большая Морская, 42-44,
e-mail: yu.chesnokov@vir.nw.ru

Поступила в редакцию
26 февраля 2015 года

 

Оформление электронного оттиска

назад в начало