Расчёт племенной ценности животных с применением метода битовой фазификации на основе нечётких множеств Stukalin Fuzzy Index (SFI)
Оценка племенной ценности животных является важной задачей в современном животноводстве. Правильная стратегия в отборе племенных особей позволяет повысить продуктивность стада, улучшить генетическое здоровье популяции, что ведёт к повышению экономической эффективности хозяйств. Однако традиционные методы оценки племенной ценности ограничены строгими статистическими подходами, которые не всегда учитывают сложность и вариативность фенотипических характеристик.
В современном животноводстве широко применяются индексы TPI (Total Performance Index) и NM$ (Net Merit Dollars), основанные на анализе родословных данных, фенотипических признаков и экономической значимости характеристик. Эти индексы позволяют проводить сравнительный анализ животных внутри популяции, однако они имеют ряд недостатков, таких как фиксированные весовые коэффициенты, строгие пороговые значения и отсутствие гибкости в интерпретации характеристик животных.
В данной работе вводится новый метод анализа нечётких данных – Метод битовой фазификации (Fuzzy Bit Encoding). Этот метод позволяет преобразовывать нечёткие множества в бинарное представление, обеспечивая компактность хранения, удобство математического анализа и возможность быстрого сравнения фазифицированных признаков.
Одновременно предлагается практическое применение метода битовой фазификации для оценки племенной ценности животных. В основе данного подхода лежит созданный автором индекс SFI (Stukalin Fuzzy Index), основанный на методе битовой фазификации. Эти данные формируют нечёткие битовые векторы (Fuzzy Bit Vector), состоящие из нечётких битовых слотов (Fuzzy Bit Slot). Таким образом, предложенный метод битовой фазификации является не только инструментом для анализа племенной ценности животных, но и универсальным способом обработки нечётких данных в бинарной форме.
Применение нечётких битовых слотов и нечёткого битового вектора позволяет:
• Гибко анализировать фенотипические характеристики животных без строгих пороговых значений.
• Компактно представлять информацию о признаках с возможностью эффективного хранения и передачи данных.
• Упрощать процесс сравнения животных за счёт битового кодирования, где каждый нечёткий битовый вектор можно интерпретировать как числовое значение.
• Адаптировать индекс к потребностям конкретного хозяйства, племени, региона, породы или даже страны, позволяя учитывать локальные особенности селекции и экономической значимости характеристик.
В данной статье также вводятся новые понятия для теории нечётких множеств, такие как Нечёткий битовый слот (Fuzzified Bit Slot) и Нечёткий битовый вектор (Fuzzy Bit Vector), которые формализуют процесс бинарного кодирования фазифицированных данных. Эти понятия открывают новые возможности в обработке нечётких данных, упрощая их анализ и сравнение с использованием битовых операций.
Предложенная методика расчёта индекса позволяет более точно и адаптивно оценивать племенную ценность животного, обеспечивая удобную интерпретацию результатов и их применение в селекционных программах.
Дополнительным преимуществом является возможность применения данного метода не только в оценке племенной ценности животных, но и в других областях анализа данных, где требуется работа с нечёткими множествами и бинарным кодированием.
Нечёткий битовый слот и нечёткие битовые вектора.
Для дальнейшего описания метода вводятся новые для теории нечётких множеств понятия: нечёткий битовый слот (Fuzzy Bit Slot) и нечёткий битовый вектор (Fuzzy Bit Vector).
Нечёткий битовый вектор (далее – битовый вектор) – это битовое представление фазифицированных данных, в частности фазифицированных фенотипических признаков. Он представляет собой упорядоченный набор нечётких битовых слотов, в котором позиция слота отражает значимость (вес) соответствующего признака.
Нечёткий битовый слот (далее – битовый слот) – это бинарное представление одного нечётко определённого признака в составе битового вектора. Длина слота определяется размерностью нечёткого множества, что определяет число возможных состояний признака.
Свойства нечёткого битового вектора и нечётких слотов.
1) Упорядоченность по важности признаков.
Каждый нечёткий битовый слот представляет нечёткое значение из нечёткого множества, а его вес определяется установленными старшими битами – чем старше биты, тем более значимый признак они кодируют.
Внутри нечёткого битового вектора каждый слот также имеет позиционный вес, зависящий от его расположения в векторе. Чем старше слот (расположен левее), тем более важный признак он содержит.
Это свойство позволяет сравнивать векторы не только по конкретным значениям, но и по их структуре приоритетов, обеспечивая более точную и гибкую интерпретацию данных.
Это свойство позволяет сравнивать векторы не только по конкретным значениям, но и по их структуре приоритетов, обеспечивая более точную и гибкую интерпретацию данных.
Нечёткий битовый профиль позволяет эффективно находить и сравнивать интересующие группы признаков в различном сочетании, например с использованием битовых масок.
2) Алгебраическая структура профиля
Профиль можно описать как элемент булева полукольца, где операции объединения (дизъюнкции) и пересечения (конъюнкции) позволяют работать с множествами фазифицированных данных.
Это делает систему математически строго формализуемой, а сам индекс – легко адаптируемым к различным алфавитам и системам кодирования.
Битовый вектор можно конвертировать в любой алфавит, включая латиницу, кириллицу, Base32, Base58, а также числовые и гибридные кодировки.
Это делает систему универсальной для хранения, передачи и анализа данных.
Для SFI предлагается использовать Base12, основанный на буквах латинского алфавита, имеющих графические аналоги в кириллице (ABCEHKMOPTXY).
Метод битовой фазификации
Метод битовой фазификации (Fuzzy Bit Encoding) представляет собой способ бинарного кодирования нечётких данных, в котором фазифицированные значения признаков переводятся в нечёткие битовые векторы, состоящие из нечётких битовых слотов.
Такой подход позволяет работать с нечёткими множествами в бинарной форме, обеспечивая их компактное представление, эффективное сравнение и анализ.
В отличие от классического подхода к фазификации, где каждому элементу нечёткого множества сопоставляется степень принадлежности в интервале [0,1], в методе битовой фазификации после классической фазификации используется структурированное бинарное кодирование нечётких значений.
Это позволяет не только учитывать вариативность характеристик, но и делать данные удобными для математического анализа с применением булевых операций.
Фазификация — это процесс преобразования чётких значений в нечёткие, при котором числовые данные интерпретируются как элементы нечёткого множества.
В отличие от традиционных дискретных классификаций, фазификация позволяет учитывать степень принадлежности объекта к нескольким категориям одновременно.
Для описания степени принадлежности элементов к нечётким множествам используются функции принадлежности.
Функция принадлежности f(A, x) принимает значения в интервале [0, 1], где:
• 0 – означает, что элемент x не принадлежит множеству A;
• 1 – означает полную принадлежность x множеству A;
• Все иные значения между 0 и 1 отражают степень частичной принадлежности элемента x к множеству A.
Формальная постановка задачи
Пусть дано нечёткое множество F, состоящее из конечного числа элементов { A1, A2, ..., An }, где каждый элемент Ai имеет нечёткое значение, соответствующее фазифицированному признаку.
Также для работы алгоритма требуется задание приоритета для каждого из элементов множества F, определяющего его значимость относительно других элементов.
Метод битовой фазификации включает следующие шаги:
1. Фазификация данных.
• Определение нечётких множеств F1, F2, ..., Fk, к которым могут принадлежать элементы исходных данных.
• Выбор функции принадлежности f(A, x) для каждого множества.
• Вычисление степени принадлежности f(A, x) для каждого значения x на основе выбранной функции.
• Формирование фазифицированного представления, где каждый элемент получает принадлежности к нескольким множествам с разной степенью уверенности.
2. Кодирование нечётких множеств.
• Каждому нечёткому множеству Fi ставится в соответствие уникальный бинарный код длины m.
• Битовое кодирование признаков – каждому значению Ai из множества F сопоставляется бинарный код длины m, где m определяется размерностью множества нечётких значений.
3. Формирование нечётких битовых слотов.
• Каждый фазифицированный элемент представляется в виде нечёткого битового слота, где заданное количество битов определяет размер памяти для хранения бинарного кода нечёткого значения.
• Опционально: в ситуациях, когда нечёткие значения имеют более высокий приоритет в рамках контекста, вводится дополнительное ранжирование значений внутри нечёткого множества.
• В рамках нечёткого битового вектора битовые слоты упорядочиваются в соответствии с их приоритетами: признаки с более высокой значимостью располагаются в старших битах, а менее значимые — в младших.
4. Кодирование нечёткого битового вектора с использованием Base-форматов.
• Для уменьшения размера хранения данных и повышения удобства передачи нечёткие битовые векторы могут быть закодированы с использованием систем Base-кодирования (например, Base32 или Base58).
• Base-кодированные векторы сохраняют возможность булевых операций, так как при декодировании обратно в бинарный формат вся структура нечётких битовых векторов восстанавливается без потерь.
В результате применения метода битовой фазификации наборы данных, содержащие нечёткие множества, представляются в бинарной форме, сохраняя информацию о значимости признаков и обеспечивая возможность эффективного анализа и обработки данных.
Существующие методики расчёта традиционных индексов с примерами
TPI (Total Performance Index)
Применяется в молочном скотоводстве и основывается на взвешенной сумме различных характеристик животного.
TPI = (0.46 × PTAмолоко) + (0.20 × PTAжир) + (0.14 × PTAбелок) + (0.10 × долговечность) + (0.10 × здоровьевымени)
Формула 1. Расчёт индекса TPI (Total Performance Index)
Где:
• PTA (Predicted Transmitting Ability) – прогнозируемая передача признака, рассчитываемая на основе родословных данных.
• PTAмолоко (кг) – прогнозируемый удой молока.
• PTAжир (% жирности) – прогнозируемое содержание жира в молоке.
• PTAбелок (% белка) – прогнозируемое содержание белка в молоке.
• Долговечность (месяцы) – продолжительность продуктивной жизни коровы.
• Здоровье вымени (баллы) – показатель устойчивости к маститу.
Пример расчета:
Предположим, что у коровы значения PTAмолоко = 1000 кг, PTAжир = 3.8%, PTAбелок = 3.2%, долговечность = 36 месяцев, здоровье вымени = 7 баллов.
Тогда TPI будет рассчитываться следующим образом:
TPI = (0.46 × 1000 кг) + (0.20 × 3.8 %) + (0.14 × 3.2) + (0.10 × 36) + (0.10 × 7) = 465.508
Формула 2. Пример расчёта по индексу TPI
Таким образом, TPI ≈ 465, что указывает на среднюю племенную ценность данной коровы.
NM$ (Net Merit Dollars)
Экономический индекс, выраженный в долларах, учитывает ожидаемый доход от животного за его продуктивную жизнь. Рассчитывается Советом по селекции молочных пород КРС в США (CDCB). Прогнозирует чистую прибыль, получаемую от усредненной по определённым показателям коровы на протяжении её жизни.
Формула расчёта:
NM$ = (0.40 × доход от молока) + (0.20 × фертильность) + (0.15 × здоровье) + (0.15 × продуктивное долголетие) + (0.10 × устойчивость к маститу)
Формула 3. Расчёт индекса экономического NM$ (Net Merit Dollars)
Где:
• Доход от молока (USD/год) – средний годовой доход от реализации молока.
• Фертильность (баллы) – способность животного к размножению.
• Здоровье (баллы) – общий показатель устойчивости к заболеваниям.
• Продуктивное долголетие (годы) – среднее число лет продуктивного использования коровы.
• Устойчивость к маститу (баллы) – параметр, оценивающий вероятность возникновения мастита.
Пример расчета:
Допустим, доход от молока = 3000 USD, фертильность = 5, здоровье = 7, продуктивное долголетие = 5 лет, устойчивость к маститу = 8.
Тогда NM$ будет рассчитан следующим образом:
NM$ = (0.40 × 3000) + (0.20 × 5) + (0.15 × 7) + (0.15 × 5) + (0.10 × 8) = 1203,6
Формула 4. Пример расчёта индекса NM$ (Net Merit Dollars)
Таким образом, NM$ ≈ 1 204 USD, что говорит о высокой экономической ценности животного.
Проблемы традиционных индексов
Основные недостатки – зависимость от рыночных условий, влияющих на экономическую значимость параметров.
Несмотря на широкое распространение TPI и NM$, их применение имеет ряд ограничений:
• Жёстко заданные пороговые значения, не учитывающие плавные границы между уровнями продуктивности.
• Фиксированные весовые коэффициенты, не адаптирующиеся к изменяющимся условиям.
• Отсутствие компактного кодирования, что усложняет идентификацию и передачу данных о животном.
Референсные значения показателей
Для корректного расчета индексов используются следующие референсные диапазоны значений:
Молочные породы (Голштинская, Джерсейская):
• Удой: 5 000–15 000 кг
• Содержание жира: 2.5%–5.5%
• Содержание белка: 2.8%–4.0%
• Долговечность: 24–60 месяцев
• Здоровье вымени: 5–10 баллов
Мясные породы (Абердин-ангус, Шароле):
• Скорость роста: 0.8–2.5 кг/день
• Живая масса: 500–1 400 кг
• Фертильность: 3–9 баллов
• Качество туши: 5–10 баллов
Обе методики используют жёстко заданные веса для оценки каждого признака, что снижает их адаптивность и точность в изменяющихся условиях. Это и является одной из ключевых проблем традиционных индексов.
Применение метода битовой фазификации для формирования SFI
В ходе исследования автор выявил, что метод битовой фазификации эффективно решает задачу создания племенного индекса животных, обеспечивая более гибкую и адаптивную систему оценки по сравнению с традиционными методами. В отличие от строгих пороговых значений, используемых в классических индексах, предложенный подход позволяет учитывать вариативность фенотипических признаков и адаптировать систему селекции под специфические условия хозяйства, породы или региона.
Одним из ключевых преимуществ метода является его способность работать с фазифицированными данными, что устраняет необходимость в точных значениях фенотипических характеристик. В традиционных индексах каждое животное оценивается на основе фиксированных количественных показателей, что не всегда отражает реальную биологическую сложность. Например, разница между удоем 8 000 и 8 100 кг имеет минимальное значение с точки зрения племенной ценности, однако традиционные системы могут воспринимать её как существенную.
Метод битовой фазификации позволяет объединять животных с похожими характеристиками в нечёткие множества, что даёт возможность более объективно учитывать их селекционный потенциал.
Дополнительным преимуществом является возможность динамического расширения нечётких множеств. Для каждого фенотипического признака можно задать нефиксированное количество уровней, что позволяет гибко адаптировать модель под конкретные задачи. Например, если стандартное разбиение по удою включает три категории (низкий, средний, высокий), то при необходимости можно добавить промежуточные уровни (очень низкий, выше среднего и т.д.), увеличивая точность оценки без усложнения математической модели.
Предлагаемый метод обеспечивает не только компактное бинарное представление племенной ценности животного, но и высокую адаптивность к изменениям в селекционной программе. Кодирование фенотипических признаков в виде нечётких битовых векторов делает процесс сравнения и анализа более удобным, а использование Base-кодирования позволяет эффективно хранить и передавать полученные индексы.
Формирование перечня фенотипических признаков
Для построения племенного индекса животного на основе метода битовой фазификации необходимо предварительно определить перечень фенотипических признаков с учётом половой принадлежности животного. Каждому признаку присваивается приоритет, который определяет его значимость при формировании нечёткого битового вектора. Более важные признаки занимают старшие биты в векторе, обеспечивая приоритетность их учёта при сравнении особей.
Определение нечётких множеств и функций принадлежности *
Каждому фенотипическому признаку сопоставляется функция принадлежности и нечёткое множество значений, позволяющее оценивать его в рамках нечёткой логики. Это позволяет учитывать плавные переходы между категориями и обеспечивать более точную селекцию.
Функции принадлежности обладают различными свойствами, которые определяют их применение в зависимости от особенностей фенотипического признака. Они могут быть подобраны опытным путём, в зависимости от требований, предъявляемых к оценке признака. Рассмотрим основные типы функций принадлежности и их свойства:
• Треугольная функция принадлежности применяется, когда необходимо выделить основную зону значений, в пределах которой признак проявляется наиболее выраженно.
• Трапециевидная функция принадлежности – подходит для гибридных категорий, где существует диапазон значений с максимальной принадлежностью.
• Гауссовская функция принадлежности – применяется для плавных переходов между значениями.
• Сигмоидальная функция принадлежности – используется для учёта порогового эффекта.
• Z-образная и S-образная функции принадлежности – применяются для асимметричных характеристик.
Таблица 1. Примеры фенотипических признаков КРС
Преобразование фенотипических данных в нечёткий битовый индекс
После определения нечётких множеств и функций принадлежности, фенотипические данные каждого животного фазифицируются и преобразуются в бинарный вид. Этот процесс включает несколько этапов:
1. Фазификация признаков:
• Каждое числовое значение сопоставляется нечёткому множеству с определённой степенью принадлежности.
• Например, корова с удоем 8 000 кг будет отнесена к значению «Средний» в множестве значений этого показателя в соответствии с функцией принадлежности.
• Аналогично, животное с живой массой 700 кг попадает в категорию «Средний» по показателю живой массы.
• Для показателей скорости роста 1.5 кг/день, содержания белка 3.8% и темперамента (2 балла) также определяется принадлежность к категории «Средний».
2. Кодирование нечётких множеств в битовые слоты:
• Каждому значению из нечёткого множества присваивается бинарный код (например, «Низкий» = 00, «Средний» = 01, «Высокий» = 10).
• Таким образом, после фазификации удой 8 000 кг кодируется как 01.
• Остальные признаки животного также получают код 01, поскольку они относятся к категории «Средний».
3. Упаковка индекса:
• Для учета типа животного добавляется 2-битное кодирование, определяющее категорию: 00 – Молочная порода, Корова; 01 – Молочная порода, Бык; 10 – Мясная порода, Корова; 11 – Мясная порода, Бык.
• Полученный код помещается в старший слот битового вектора перед кодированием признаков.
4. Формирование нечёткого битового вектора:
• Бинарные коды всех признаков объединяются в единый нечёткий битовый вектор, расположенный в порядке значимости признаков.
• Например, для молочной коровы битовый вектор примет вид «000101010101».
5. Преобразование битового вектора в компактный индекс SFI:
• Бинарный вектор кодируется с использованием Base-алфавита (ABCEHKMOPTXY) для уменьшения его размера и упрощения хранения.
• В результате кодирования битового вектора «000101010101», итоговый племенной индекс животного (SFI) принимает вид «AKXA».
Пример профиля животного:
• Тип: Молочная порода, Корова → 00
• Удой за 305 дней: 8 000 кг → «Средний» 01
• Живая масса: 700 кг → «Средний» 01
• Скорость роста: 1.5 кг/день → «Средний» 01
• Содержание белка в молоке: 3.8% → «Среднее» 01
• Темперамент: 2 балла → «Средний» 01
Объединяя все эти признаки в битовый профиль «000101010101» и кодируя в Base-алфавит, мы получаем окончательный племенной индекс SFI: AKXA.
Этот индекс легко интерпретируется, компактен и может быть использован для эффективного сравнения племенных животных.
Упаковка индекса
Для удобства хранения и использования племенной ценности животного, нечёткий битовый вектор может быть закодирован в Base-алфавит для сокращения его длины.
Преобразование битового вектора в Base-формат:
• Биты группируются и переводятся в систему кодирования, например Base32 или Base58.
• Для упрощения восприятия индекс может быть представлен символами алфавита ABCEHKMOPTXY, исключающего визуально схожие символы.
Сравнительный анализ различных методов оценки
Метод битовой фазификации позволяет оценивать не только племенную ценность животных, но и применять его в других областях, где необходимо ранжирование объектов с нечёткими признаками.
Рассмотрим три потенциальные области применения:
• Индекс оценки профиля знаний ученика (SFI-Knowledge)
• Индекс оценки сотрудника (SFI-Employee)
• Индекс цифровой зрелости предприятия/региона (SFI-Digital)
Каждый индекс будет строиться на основе фазифицированных признаков, сгруппированных в нечёткие битовые слоты.
Заключение
Предложенный метод битовой фазификации для оценки племенной ценности животных представляет собой новое направление в области селекции.
В отличие от традиционных подходов, он позволяет учитывать вариативность фенотипических признаков без привязки к жёстким пороговым значениям.
Он также упрощает хранение и обработку информации за счёт бинарного кодирования.
Метод позволяет формировать нечёткий битовый индекс SFI, который отражает комплексную племенную ценность животного в удобном бинарном формате.
Использование нечётких множеств и битового кодирования минимизирует потери информации и создаёт универсальную систему оценки, адаптируемую под различные виды, породы, регионы и селекционные программы.
Исследование не выявило аналогичных методик, использующих сочетание нечёткой логики и битового кодирования для представления племенных признаков.
Это подтверждает новизну предложенного метода, который может быть использован как альтернативный инструмент оценки племенной ценности животных и адаптирован для решения задач в смежных областях.