Главное меню

Полногеномное исследование ассоциаций для выявления локусов количественных признаков и позиционных генов-кандидатов, влияющих на показатели продуктивности свиноматок пород ландрас и йоркшир

10.03.2026 171

В современном свиноводстве показатели пожизненной продуктивности свиноматок (Sow Lifetime Productivity, SLP) играют ключевую роль в оценке репродуктивной эффективности стада и являются основными критериями при выбраковке животных. К числу важнейших индикаторов относятся общее количество опоросов за жизнь (Lifetime Number of Litters, LNL) и общее количество поросят, рожденных за жизнь (Lifetime Production of Pigs, LPP). Эти комплексные показатели напрямую коррелируют с экономической эффективностью производства, так как высокий уровень выбраковки свиноматок с низкой продолжительностью продуктивного использования увеличивает потребность в ремонтном молодняке, что ведет к росту производственных затрат.

Несмотря на свою значимость, генетическое улучшение признаков SLP представляет собой сложную задачу. Эти показатели имеют низкую наследуемость и могут быть точно оценены только после завершения продуктивной жизни животного, что затрудняет ранний отбор. В таких условиях метод полногеномного поиска ассоциаций (GWAS) становится незаменимым инструментом, позволяющим выявить локусы количественных признаков (QTL) и специфические генетические варианты, лежащие в основе сложных фенотипов. Предыдущие исследования идентифицировали ряд генов-кандидатов (FUT9, SLC22A18, P2RY6, KCNC2, MEGF11), однако они часто были ограничены анализом отдельных пород или признаков, что не давало полной картины генетической архитектуры SLP.

В основу настоящего исследования легла гипотеза о том, что варианты ДНК, влияющие на признаки SLP, наследуются по полигенной модели. В то же время, длительная селекция, специфичная для каждой породы, могла привести к накоплению в определенных локусах аллелей с небольшими, но детектируемыми эффектами. Целью работы стал поиск породоспецифичных генетических вариантов и соответствующих позиционных генов-кандидатов, связанных с LNL и LPP, в популяциях свиней пород ландрас и йоркшир, а также последующий анализ биологических путей, лежащих в основе репродуктивных механизмов.

Материалы и методы

Характеристика животных и фенотипических данных

В исследовании были использованы фенотипические данные 3912 свиноматок, включая 1043 головы породы ландрас и 2869 голов породы йоркшир. Животные происходили с нескольких ферм, участвующих в Корейской национальной системе генетической оценки свиней. Для расчета показателя LPP использовалось количество живорожденных поросят.

Статистический анализ включал такие фиксированные эффекты, как год рождения свиноматки (с 2006 по 2016 для ландрас и с 2006 по 2017 для йоркшир) и комбинацию «стадо-год-сезон» на момент последнего опороса (81 градация для ландрас и 139 для йоркшир). Первичный описательный анализ данных выполнен с использованием программного обеспечения R.

Генотипирование и контроль качества

Генотипирование всех животных проведено с использованием чипа Illumina Porcine SNP60K BeadChip. Контроль качества маркеров осуществлялся в программе PLINK 1.9. Критериями исключения однонуклеотидных полиморфизмов (SNP) являлись: частота минорного аллеля менее 1%, частота ошибок генотипирования более 10% и отклонение от равновесия Харди-Вайнберга с уровнем значимости менее 10⁻⁶. После фильтрации для дальнейшего анализа в популяции ландрас осталось 42 712 SNP-маркеров, а в популяции йоркшир — 41 047 SNP-маркеров, распределенных по 18 аутосомам.

Проведение полногеномного поиска ассоциаций

Основным методом GWAS выбран алгоритм FarmCPU (Fixed and random model Circulating Probability Unification), реализованный в пакете rMVP. Данный метод итеративно чередует использование моделей с фиксированными и случайными эффектами, что позволяет эффективно контролировать ложноположительные ассоциации, вызванные популяционной структурой, и повышает разрешающую способность картирования.

В модели с фиксированными эффектами каждый маркер тестировался индивидуально. Для учета популяционной структуры у свиней породы ландрас в качестве ковариат было включено 39 главных компонент (PC), что позволило удержать коэффициент геномной инфляции (λ) на уровне, близком к 1. Для популяции йоркшир включение PC не потребовалось, так как значения λ указывали на адекватный контроль ложноположительных результатов и без этой коррекции. Модель со случайными эффектами оптимизировала набор псевдо-QTL для учета полигенного фона.

Для сравнения эффективности также использовалась смешанная линейная модель (MLM) с матрицей геномных отношений. Для коррекции множественных сравнений применялся строгий критерий Бонферрони. Порог значимости для ландрас составил P = 1.17 × 10⁻⁶ (0.05 / 42,712), а для йоркшир — P = 1.22 × 10⁻⁶ (0.05 / 41,047). Долю фенотипической дисперсии, объясняемую каждым значимым маркером (%VARSNP), рассчитывали с помощью SAS v9.4. Для визуализации результатов использовались пакеты snp.plotter и CMplot.

Имитационное моделирование

Для оценки точности и мощности метода FarmCPU было проведено стохастическое моделирование с использованием программного обеспечения QMSim. Моделировалась популяция сельскохозяйственных животных с признаком, ограниченным полом (фенотипы только у самок). Историческая популяция (800 голов) развивалась на протяжении 200 поколений для установления равновесия по неравновесному сцеплению (LD). Затем 50 самцов и 500 самок были случайным образом отобраны для формирования пяти дискретных поколений под действием отбора.

Геном модели состоял из четырех хромосом с 12 000 равномерно распределенных SNP. На этих хромосомах было размещено 10 QTL с аддитивными эффектами, в совокупности объясняющих 40% фенотипической дисперсии (наследуемость = 0.4). Отбор проводился на основе оценки племенной ценности по BLUP. Было создано 100 независимых реплик для сравнения методов FarmCPU и MLM по таким показателям, как чувствительность, специфичность, уровень ложноположительных результатов (FPR) и уровень ложных открытий (FDR).

Функциональная аннотация и анализ биологических путей

Позиционные гены-кандидаты аннотировались с использованием базы данных Ensembl (сборка генома Sus scrofa 11.1). Для подтверждения ранее известных QTL использовалась база PigQTLdb. Для анализа биологических путей были отобраны гены, расположенные в радиусе ±1.5 кб от SNP-маркеров с уровнем значимости P < 0.01. Такой порог был выбран для того, чтобы захватить гены с потенциальным, но еще не выявленным биологическим эффектом, и обеспечить достаточное количество генов для анализа обогащения. Сам анализ выполнен с использованием набора данных KEGG в инструменте Enrichr. Значимыми считались пути с номинальным P < 0.05.

Результаты

Описательная статистика

Анализ фенотипических данных выявил различия между породами. У свиней породы ландрас показатель LNL варьировал от 1 до 8, а LPP — от 3 до 111. В популяции йоркшир размах LNL составил от 1 до 8, а LPP — от 1 до 126. Средние значения LNL для ландрас и йоркшир составили 4.11 и 4.66 соответственно. По показателю LPP средние значения также различались: 44.73 у ландрас против 54.29 у йоркшир. Двухвыборочный t-критерий подтвердил статистическую значимость различий между породами как по LNL, так и по LPP (P < 0.001). Распределение признаков у ландрас имело правостороннюю асимметрию с концентрацией значений в нижней части шкалы, в то время как у йоркшир распределение обоих фенотипов было близко к нормальному, что может быть частично связано с эффектом размера выборки.

Результаты полногеномного поиска ассоциаций

Применение метода FarmCPU позволило идентифицировать ряд SNP-маркеров, достигших уровня значимости. На Манхэттенских графиках наблюдались характерные для этого метода острые изолированные пики, что свидетельствует о высокой разрешающей способности алгоритма. Это контрастировало с результатами MLM, где сигналы были представлены широкими областям, что характерно при учете корреляций между маркерами в состоянии неравновесного сцепления.

В общей сложности было выявлено 10 значимых SNP-маркеров. В популяции ландрас четыре маркера на хромосомах 1, 5, 6 и 17 (rs81235993, rs81273963, rs81393111, rs81466633) были ассоциированы с признаком LNL, объясняя от 2.0% до 3.2% фенотипической дисперсии. Значимых маркеров для LPP у ландрас обнаружено не было.

В популяции йоркшир три маркера (rs80942643 на SSC4, rs81230488 на SSC8 и rs80815144 на SSC14) были связаны с LNL, объясняя от 0.5% до 0.9% дисперсии. Еще три маркера (rs80898085 на SSC4, rs81419745 на SSC9 и rs81326127 на SSC13) показали ассоциацию с LPP, с вкладом в фенотипическую дисперсию от 0.7% до 1.3%. Среди всех идентифицированных SNP, rs80815144 и rs81419745 представляют собой новые маркеры, ранее не описанные в контексте репродуктивных признаков или SLP.

Анализ распределения фенотипов в зависимости от генотипа по ведущим маркерам показал аддитивный характер эффектов. Например, у маркера rs80815144 (связан с LNL у йоркшир) наблюдалось увеличение среднего значения признака с ростом числа аллелей A, и различия между всеми тремя генотипами были статистически значимы. Для маркера rs80898085 (связан с LPP у йоркшир) гомозиготный генотип BB значимо отличался от AA и AB, демонстрируя эффект доминирования.

Результаты имитационного моделирования

Сравнение методов на смоделированных данных подтвердило превосходство FarmCPU. В то время как MLM показывала широкие пики с множеством ложных сигналов вокруг истинных QTL, FarmCPU генерировал острые пики, точно указывающие на позиции QTL, даже в регионах с высоким LD.

Оценка точности показала, что оценки эффектов, полученные методом FarmCPU, были ближе к истинным значениям, а их стандартные ошибки были на 40–50% ниже по сравнению с MLM. В 100 повторностях метод FarmCPU продемонстрировал минимальное смещение оценок и значительно более высокую эффективность. Чувствительность FarmCPU составила 0.886 против 0.761 у MLM. Уровень ложноположительных результатов (FPR) был снижен на 85% (0.0002 против 0.0013), а частота ложных открытий (FDR) — почти в 3.7 раза (0.1804 против 0.6735). Эти данные подтверждают, что изолированные сигналы в результатах FarmCPU отражают высокую точность идентификации, а не являются артефактом метода.

Результаты анализа биологических путей

Анализ обогащения генов, расположенных вблизи значимых и предположительно значимых маркеров, выявил ряд биологических путей, потенциально связанных с репродуктивной функцией.

Для признака LNL у ландрас были идентифицированы три значимых пути, включая метаболизм холестерина и PPAR-сигнальный путь. Для LNL у йоркшир обнаружено восемь путей, среди которых холинергический синапс, сигнальные пути цГМФ-ПKG и MAPK. Наиболее богатым на результаты оказался анализ LPP у йоркшир, где было выявлено 19 значимых путей. Ключевыми среди них, имеющими прямое отношение к репродукции, являются:

- Сигнальный путь кальция: критически важен для мышечных сокращений матки и процессов имплантации эмбриона.

- Сигнальный путь окситоцина: играет центральную роль в регуляции родовой деятельности и лютеолизе.

- Молекулы клеточной адгезии (Cell adhesion molecules): необходимые для имплантации бластоцисты и формирования тканей гонад. В этом пути обнаружен ген Jam2, который также был идентифицирован как позиционный кандидат для маркера rs81326127.

- Глутаматергический синапс: вовлечен в регуляцию секреции гонадолиберина (GnRH) и, следовательно, всей эндокринной репродуктивной оси.
Выявление путей, связанных с сердечно-сосудистой системой (гипертрофическая/дилатационная кардиомиопатия), указывает на возможные новые, ранее недооцененные взаимосвязи, требующие дальнейшего изучения.

Обсуждение

Полученные результаты подтверждают исходную гипотезу о полигенной природе признаков SLP, поскольку каждый из идентифицированных маркеров объясняет лишь малую долю фенотипической дисперсии (0.5–3.2%). Тем не менее, сам факт обнаружения этих маркеров на фоне строгой бонферроновской коррекции свидетельствует о том, что длительная породоспецифичная селекция привела к консолидации определенных аллелей, эффекты которых стали детектируемыми.

Часть идентифицированных SNP (rs81393111, rs81230488, rs80942643) ранее уже упоминалась в исследованиях, связывающих их с общим числом рожденных поросят, емкостью матки или количеством желтых тел. Это согласуется с литературными данными о высокой генетической корреляции между показателями многоплодия и долголетием свиноматок, предполагая наличие общих генетических механизмов.

Наибольший интерес представляют новые гены-кандидаты, обнаруженные в настоящем исследовании. Ген WDR11, ассоциированный с маркером rs80815144 у йоркшир, известен своей ролью в развитии врожденного гипогонадотропного гипогонадизма и синдрома Каллмана у человека. Мутации в этом гене нарушают функцию гонадолиберина, что приводит к задержке полового созревания и бесплодию. Учитывая, что возраст первого осеменения напрямую влияет на пожизненную продуктивность, WDR11 становится крайне перспективной мишенью для селекции.

Другой новый ген, TENM4 (маркер rs81419745), кодирует белок, необходимый для эмбрионального развития. Исследования на мышах показывают, что полный дефицит TENM4 летален на ранних стадиях из-за нарушения развития плаценты. Это позволяет предположить, что менее выраженные варианты данного гена могут влиять на выживаемость эмбрионов и, как следствие, на размер гнезда и общий выход поросят.

Функциональная роль других генов также хорошо вписывается в контекст репродуктивной биологии. PTPRT, обнаруженный в нетранслируемой области гена у ландрас, участвует в дефосфорилировании STAT3 — сигнальной молекулы, критически важной для функции плаценты. RAB25 (маркер rs80898085) регулирует мембранный транспорт и поляризацию эпителиальных клеток, процессы, необходимые для создания рецептивности эндометрия и успешной имплантации. Ген Jam2 (маркер rs81326127) кодирует белок клеточной адгезии, экспрессирующийся в эндометрии в период «окна имплантации». Ряд маркеров (rs81235993, rs81393111, rs80942643) оказались связаны с длинными некодирующими РНК, которые в последнее время признаны важными регуляторами экспрессии генов в яичниках и других репродуктивных тканях.

Результаты анализа биологических путей не только подтвердили известные механизмы (метаболизм стероидов, передача сигналов кальция и окситоцина), но и указали на сложные межсистемные взаимодействия. Например, пути цГМФ-ПKG и MAPK являются универсальными сигнальными каскадами, вовлеченными во множество клеточных процессов, включая пролиферацию, дифференцировку и апоптоз в тканях репродуктивного тракта. Обнаружение путей, ассоциированных с работой сердца и сосудов, может отражать общие потребности в энергообеспечении и ангиогенезе, которые интенсивно протекают в плаценте и матке во время беременности.

Заключение

В данном исследовании с помощью метода GWAS на основе алгоритма FarmCPU впервые проведен сравнительный анализ генетической архитектуры признаков пожизненной продуктивности свиноматок у двух крупных пород — ландрас и йоркшир. Имитационное моделирование подтвердило высокую точность и мощность использованного подхода, гарантируя, что выявленные изолированные сигналы отражают истинные локусы количественных признаков.

В результате работы идентифицировано 10 породоспецифичных SNP-маркеров и ряд новых позиционных генов-кандидатов, включая WDR11, TENM4, PTPRT, RAB25 и Jam2, которые ранее не рассматривались в контексте SLP. Функциональная аннотация этих генов и анализ обогащения биологических путей подтвердили их вовлеченность в ключевые репродуктивные процессы: гормональную регуляцию, эмбриональное развитие, имплантацию и поддержание беременности.

Полученные результаты существенно расширяют понимание генетических механизмов, контролирующих продуктивное долголетие свиноматок. После необходимой валидации на независимых популяциях идентифицированные маркеры могут быть интегрированы в программы геномной селекции. Их использование позволит вести более точный отбор ремонтного молодняка, направленный на повышение продолжительности и эффективности продуктивного использования животных, что в конечном итоге повысит экономическую рентабельность свиноводства.

Исследование: Animal

Комментарии
Укажите имя
Напишите комментарий
Статьи по теме