domingo, 1 de agosto de 2021

4. Principios de estadística básica para genética | 🧬 Genética clásica | Joseleg

(Ciencias de Joseleg) (Biología) (Teoría de la Biología) (Genética clásica) (Ejercicios resueltos) (1-Introducción)  (2-Genética premendeliana)  (3-Gregor Mendel)  (4-Probabilidad y estadística)  (5-Diseño experimental mendeliano)  (6-Resultados del cruce monohíbrido)  (7-Ley de la segregación independiente) (8-El cuadro de Punnett)  (9-Como resolver el cruce monohíbrido)  (10-Comparando experimento vs teoría)  (11-Ley de la distribución independiente)  (12-Resolviendo dihíbridos y trihíbridos)  (13-Los microscopistas)  (14-Los mendelianos 1)  (15-Los mendelianos 2)  (16-Teoría cromosómica de la gerencia)  (17-El señor de las moscas)  (18-Mendelismo no mendeliano)  (19-Polimorfismo genético)  (20-Dominancia incompleta)  (21-Codominancia)  (22-Letalidad genética)  (23-Ligamiento al sexo)  (24-Las epistasis) (25-Penetrancia, expresividad y pleiotropía) (24-Análisis de pedigrí)  (ref-Referencias bibliográficas)  

 Según Galileo Galilei 1564-1642 las matemáticas poseen una autoridad que solo podría ser superada por la de Dios en persona, mientras que Lord Kelvin 1824-1907 opinaba que la única manera de conocer algo de manera satisfactoria era a través de las matemáticas, prácticamente una ciencia solo se reconoce como tal, al emplear un núcleo matemático, que es en principio simple. De hecho, la biología no fue reconocida como una ciencia a la par de la física hasta que se logró un fundamento matemático fuerte, sin embargo, los biólogos pre-mendelianos se oponían a este esfuerzo, pues consideraban que la física y la biología eran ciencias completamente diferentes. Los primeros en cuestionar esta separación fueron los mendelianos, que iniciaron con el arduo trabajo de introducir una teoría matemática en los fenómenos de la vida. El primero en hacer esto fue Gregor Mendel 1822-1884, aunque el enfoque de su investigación y la actitud anti-matemática en la biología de la época hicieron que su trabajo fuera irrelevante por 34 años.

Justo al inicio del siglo XX la comunidad científica se dio cuenta de las posibilidades que ofrecía el cálculo de probabilidades y el álgebra simple para entender el comportamiento de la herencia de rasgos de caracteres en los seres vivos. Este esfuerzo fue posteriormente llevado a su máxima expresión en la Teoría Sintética de la Evolución, punto en el cual el modelo matemático se extendió a la herencia y cambio de los caracteres en poblaciones completas. En la actualidad, si bien los principios siguen siendo simples, la enorme cantidad de interacciones hace que los procesos matemáticos sean más pesados, por lo que se requieren de supercomputadoras para hacer el trabajo predictivo que inicialmente era realizado con lápiz y papel.

Hay dos conceptos que nos importan a la hora de formular modelos matemáticos son los del azar y el determinismo. El determinismo se define generalmente como eventos que pueden predecirse de manera determinada, sin embargo, esta noción solo es correcta para sistemas simples donde se tiene el control de todas las variables, cuando un sistema determinista se hace complejo, la interacción de sus componentes lo hacen caótico y difícil de predecir, dando nacimiento a procesos azarosos de tipo clásico. El azar por otro lado se define como un sistema difícil de predecir, pero nuevamente esto solo aplica para sistemas simples con pocos eventos, ya que cuando se analiza un sistema complejo con muchos eventos, pero perfectamente aleatorio, este se hace predecible hasta cierto punto.

La fluidez de los anteriores conceptos hace que sea muy importante la formulación de medios para medirlos sin tantas ambigüedades, y la ciencia que se encarga de esto es la estadística, la cual a su vez se fundamenta en el cálculo diferencial.

Número de entidades

El número de entidades (Nj) es el número entero (cuantizado o sin decimales) obtenido por conteo de entidades, que suelen ser moléculas, átomos o iones; pero que puede ser cualquier entidad discreta cuantizada como el número de papas, el número de personas, o el número de semillas de un determinado color. El parámetro número de entidades se considera adimensional, y por ende no le vamos a asociar unidades.

Figura 41. Un parámetro dado o medición puede realizarse a una amplia variedad de entidades u objetos, de allí que se requiera del símbolo de entidad contada y medida para indicar cual es el objeto al cual estamos haciendo referencia.

No No todas las áreas de conocimiento manejan el mismo tipo de nomenclatura, por ejemplo en estadística el parámetro se denomina como frecuencia absoluta, de la cual tendremos dos divisiones dependiendo de cómo estemos analizando el sistema.

👉 la frecuencia absoluta total, frecuencia acumulativa o número de entidades total (N): representa la suma de objetos que pueden ser contados.

👉 la frecuencia absoluta de subgrupo o número de entidades j-ésimo (NJ): representa la cantidad de objetos que cumplen una determinada característica que los distingue de otros objetos semejantes al interior del sistema de estudio.

Ejemplo. Cuente los siguientes objetos y exprese su valor como un parámetro matemático.

Ejemplo. Cuente los siguientes objetos y exprese su valor como un parámetro matemático.

Ejemplo. Cuente los siguientes objetos y exprese su valor como un parámetro matemático.

Ejemplo. Cuente los siguientes objetos y exprese su valor como un parámetro matemático.

La frecuencia absoluta total y la frecuencia absoluta de un subgrupo se relacionan por medio de la siguiente ecuación:

Ejemplo. Cuente los siguientes objetos y calcule el número de entidades de cada color y el número de entidades totales.

Ejemplo. En un sistema de 300 semillas amarillas y el resto verdes; y 400 semillas totales, ¿Cuál es la cantidad de semillas amarillas?

Ejemplo. Sabemos que en una cohorte de moscas alrededor de 15 presentaron la mutación de ojos blancos, ¿Cuál será la cantidad de moscas de ojos rojos si sabemos que el número total de moscas es de 48?

Ejemplo. Determinar el número de semillas de tipo D si se contaron en total 3002, tenga en cuenta que Semilla A 1688, semilla B 562, semilla C 564.

Frecuencia relativa empírica

La probabilidad empírica (PJ), la frecuencia relativa o la probabilidad experimental de un evento es el cociente entre la frecuencia de subgrupo (NJ) sobre la frecuencia acumulativa (N). Un problema que nos encontraremos frecuentemente con las frecuencias relativas, es el hecho de que el símbolo P se empezará a repetir mucho, sin portar información relevante, lo que aumenta de manera innecesaria la carga simbólica de algunos axiomas, es por eso que podemos emplear una solución semejante a la que se usa en química del equilibrio con la concentración molar, y emplear corchetes para inferir de manera implícita que estamos calculando una frecuencia relativa o probabilidad.

La probabilidad empírica estima las probabilidades a partir de la experiencia y la observación. Dado un evento A en un espacio muestral J (ejemplo, evento: semilla amarilla; en espacio muestral: color de semilla), la frecuencia relativa de A será un cociente entre el número de objetos que cumple la cualidad A dividido en el número total de objetos, siendo un valor que va desde 0 a 1.

Ejemplo. Determine la frecuencia o probabilidad experimental mediante la siguiente figura.

Ejemplo. Determine la frecuencia o probabilidad experimental mediante la siguiente figura.

Ejemplo. Determine la frecuencia o probabilidad experimental mediante la siguiente figura.

Ejemplo. En un dado de 6 caras, la cara 5 ha aparecido 7 veces de 42 lanzamientos. ¿Cuál es la probabilidad experimental de la cara 5?

Frecuencia teórica o estándar

Las frecuencias no solo se obtienen de contar objetos, sino al realizar un proceso analítico sobre un sistema antes de realizar el propio experimento o conteo real. Simbolizaremos las frecuencias teóricas adicionando el símbolo 0 o 0 que deberá leerse como teórico o estándar para evitar adicionar símbolos como (teo) que aumentan la carga simbólica de los términos algebraicos. La frecuencia absoluta de subgrupo teórico (Nj°) representa el número de veces que se repite una opción dentro de un conjunto de posibilidades de un sistema. En este caso la frecuencia acumulativa teórica vuelve a ser la suma de las frecuencias de subgrupo teóricas.

El cociente de las frecuencias teóricas de subgrupo y la frecuencia acumulativa teórica genera la frecuencia relativa teórica, o simplemente la probabilidad teórica.

Ejemplo. Determine las frecuencias relativas teóricas de un dado ideal de 4 caras, donde cada faceta está marcada con las caras I, II, III, IV.

Ejemplo. Determine las frecuencias relativas teóricas de un dado ideal de 6 caras, donde cada faceta está marcada con las caras I, II, II, IV, VI, VI.

Ejemplo. Calcular la frecuencia acumulativa teórica de 500 semillas amarillas cuya probabilidad teórica era de 0.75

Ejemplo. Calcular la frecuencia acumulativa teórica de 30 moscas de ojos blancos cuya probabilidad teórica era de 0.25

Porcentajes y radios

Las probabilidades pueden expresarse de tres maneras:

👉 Frecuencias relativas: son valores con un rango entre 0 y 1, donde 0 representa que el evento no puede suceder y 1 que el evento es inevitable. Aunque tendemos a pensar que los números entre 0 y 1 son todos decimales, es conveniente tener en cuenta que algunos números fraccionarios representarán probabilidades comunes, por lo que es importante memorizarse algunos de estos cocientes notables y su interconversión a valores decimales.

👉 Porcentajes: Los porcentajes representan la frecuencia aplicada a una frecuencia acumulativa estándar de 100 unidades, por ende, se define matemáticamente como el producto entre la frecuencia relativa por la constante de porcentaje que es 100 %, donde el símbolo % es igual a 10-2. Debido a que 100 % es igual a 100 (10-2) y por ende igual a 1, podemos concluir que una frecuencia relativa 1 adimensional es igual a 100 %.

Los porcentajes son la forma más común de representar una probabilidad en textos de todo tipo, sin embargo, son términos complejos en manipulaciones algebraicas, es por ende que se aconseja convertir los porcentajes a frecuencias cuando se hacen manipulaciones con las leyes de la probabilidad dividiendo los porcentajes entre 100 %.

Ejemplo. Convierta los siguientes porcentajes a frecuencias: 75 % 25 % 33 % 50 %.

Ejemplo. Empleando la tabla de cocientes notables convierta las siguientes probabilidades porcentuales a frecuencias expresadas con una fracción de dos números enteros pequeños: 75 % 25 % 33 % 50 %.

Ejemplo. Convierta la siguiente frecuencia relativa a porcentaje: 2/4, 2/8, 6/8, 4/6, 2/6, 4/16.

👉 Radio: son comparaciones de frecuencias absolutas de subgrupo, sean estas teóricas o experimentales. Por ejemplo, para la moneda teórica el radio de cara a sello se expresa como 1:1. Para el dado de cuatro caras teórico el radio de expresa como 1:1:1:1. Un radio se puede expresar también como un evento dado con respecto a la suma de las más posibilidades, así el radio de la cara II del dado de 6 caras teórico será de 1:5. En ocasiones los radios pueden expresarse como polinomios, donde los coeficientes algebraicos representan el número de entidades. Tenga en cuenta que, por reglas del álgebra, los coeficientes 1 están implícitos, por lo que no se muestran, pero si estarán presentes.

Ejemplo. La probabilidad de cierto calculo teórico se describe mediante el siguiente polinomio 3a + b. Calcular la frecuencia teórica de cada término, expresarla como un fraccionario y un porcentaje.

Ejemplo. La probabilidad de cierto calculo teórico se describe mediante el siguiente polinomio a + 2b + c. Calcular la frecuencia teórica de cada término, expresarla como un fraccionario y un porcentaje.

Ejemplo. La probabilidad de cierto calculo teórico se describe mediante el siguiente polinomio 9a2 + 3ab + 3cd + d2. Calcular la frecuencia teórica de cada término, expresarla como un fraccionario y un porcentaje.

Propiedades de las probabilidades

Las probabilidades vistas hasta el momento son individuales, sin embargo, cuando tenemos sistemas compuestos por más de un elemento aleatorio, podemos expresar propiedades emergentes que surgen de su interacción de las partículas en el sistema. Tenga en cuenta que dependiendo de la interacción deberemos ejecutar diferentes operaciones matemáticas, desde sumas y restas hasta potencias y factoriales. Adicionalmente, dado que estructuralmente las probabilidades teóricas y experimentales poseen ecuaciones semejantes, definiremos las siguientes probabilidades solo para las probabilidades experimentales, pero estas aplicarán de igual forma a las probabilidades teóricas.

La probabilidad total.

Al igual que la frecuencia absoluta aditiva o total es la suma de las frecuencias de subgrupo, la frecuencia relativa aditiva o total (P) es la suma (∑) a las frecuencias relativas parciales (Pj). Sin embargo, a diferencia de la frecuencia absoluta aditiva que puede tener un valor arbitrario que dependerá del sistema de estudio, la frecuencia relativa aditiva siempre tiene un valor de 1 o del 100% cuando se expresa como un porcentaje.

La probabilidad total igual a 1 es un instrumento de corrección útil a la hora de finalizar un ejercicio de lápiz y papel, pues si la suma de probabilidades parciales no es 1 o significativamente cercana a 1 (ejemplo 0.9999, o 1.0001) entonces significa que se cometieron errores en los cálculos.

Ejemplo. La probabilidad parcial experimental de plántulas de tallo alto fue de 74 % mientras que la de las plántulas de tallo enano fue de 26 %. Calcule la probabilidad total y determine si el cálculo estuvo bien hecho.

Ejemplo. La probabilidad parcial teórica de plántulas de tallo alto fue de 3/4 mientras que la de las plántulas de tallo enano fue de 1/3. Calcule la probabilidad total y determine si el cálculo estuvo bien hecho.

Ejemplo. La probabilidad parcial experimental de vainas verdes-lisas fue de 56 %, la de vainas verdes-arrugadas 18 %, la de vainas amarillas-lisas 16 %, y la de vainas amarillas-arrugadas 6 %. Usando la propiedad de probabilidad total ¿Qué puede concluir sobre la confiabilidad de estos datos?

Ejemplo. Las probabilidades de cuatro tipos de semilla deben expresarse en el resultado, sin embargo, solo contamos con los valores de los primeros tres tipos, la semilla A tiene una probabilidad teórica de 9/16, las semillas de tipo B y C tienen una probabilidad teórica de 3/16, ¿Cuál es la probabilidad teórica de la semilla de tipo D?

Ejemplo. Una pareja de moscas presenta crías con dos tipos de ojos, rojos y blancos. Si la probabilidad experimental de las crías de ojos blancos fue del 24% ¿Cuál es la probabilidad teórica de las crías de ojos rojos?

Probabilidad de dos o más eventos opcionales.

En este caso, queremos saber qué tan probable es que dos eventos independientes sucedan sin importar que sea simultáneo, en este orden de ideas planteamos los dos eventos buscados como opciones, y queremos saber qué tan probable es acertar a cualquiera de las dos opciones. En este caso se emplea generalmente el conector “o” de opción “P(A o B)”. Para este caso, la solución aritmética es la suma de probabilidades, por lo que también podemos emplear la notación “P(A más B)”, lo cual implica que debemos sumar las probabilidades del evento A y del evento B. En caso de que el valor de P sea un decimal o un porcentaje se efectúa una suma simple, pero en el caso de que P sea un fraccionario, debemos ejecutar una suma de fraccionarios, aunque por lo general dado que ambas P tienen el mismo denominador, la expresión de la suma es sencilla.

Ejemplo. ¿Cuál es la probabilidad de que en un dado de 4 caras aparezca un I o un III? Exprese el resultado como frecuencia relativa y porcentaje.

Ejemplo. Cuál es la probabilidad de que en un solo lanzamiento de un dado de 20 caras aparezca cualquier número par. Exprese el resultado como frecuencia relativa y porcentaje.

Ejemplo. Cuál es la probabilidad de que en el siguiente lanzamiento aparezca cualquier número impar en un dado de 6 caras. Exprese el resultado como frecuencia relativa y porcentaje.

Ejemplo. En la ley de la genética clásica llamada “dominancia completa” se dice que dos tipos de tipos genéticos o “genotipos” que llamaremos tipo A y tipo B, los cuales pueden generar el mismo tipo de cuerpo que llamaremos dominante D. Si la probabilidad de las formas genéticas A y B son del 25 % y el 50 %, ¿cuál es la probabilidad del cuerpo de tipo dominante D? Exprese el resultado como un porcentaje y un número racional/fracción.

Probabilidad de que no ocurra j.

Evidentemente el conector aquí es el “no”. Estos casos se basan en determinar qué tan probable es que no aparezca un determinado subgrupo j. Y para hacerlo aplicamos la siguiente fórmula.

Ejemplo. En un solo dado de 6 caras, ¿Cuál es la probabilidad de que en el próximo lanzamiento no aparezca el número 5?

Ejemplo. Cierta enfermedad de la sangre tiene una probabilidad de 25% de manifestarse, ¿Cuál es la probabilidad de que el siguiente hijo o hija nazca sano?

Probabilidad de dos eventos simultáneos o dependientes.

En este caso, queremos saber qué tan probable es que dos eventos independientes-simultáneos o dependientes sucedan al mismo tiempo, simultáneamente, para esto generalmente empleamos el conector “y” de inclusión, y para resolver esto, debemos multiplicar las dos probabilidades involucradas, de allí que la notación sea P(AB)

Ejemplo. ¿Cuál es la probabilidad de que al arrojar dos dados de 4 caras ideales me aparezca un doble III?

Ejemplo. ¿Cuál es la probabilidad de que al arrojar tres dados de 6 caras ideales me aparezca un triple VI?

Ejemplo. En la ley de la genética clásica se la “distribución independiente” se dice que dos características A y B dadas se transmiten independientemente y al azar. Si la probabilidad de la característica A es de ¾ y la probabilidad de la característica B es de ¼, ¿Cuál es la probabilidad de que ambas características coincidan al azar en un individuo dado? Exprese el resultado como una frecuencia y un porcentaje.

 

Recuperar un número de eventos buscados i calculados a partir de una probabilidad teórica y el número total experimental.

Resulta común tener que comparar probabilidades, pero algunas técnicas de comparación nos exigirán emplear número de entidades en lugar de las frecuencias relativas. En tal caso, debemos poder expresar una frecuencia relativa teórica ([j]0) como una frecuencia absoluta teórica (Nj°) empleando la frecuencia aditiva experimental (N).

Ejemplo. Si la probabilidad de un dado ideal para la cara II es de 1/4, y además lo lanzara unas 60 veces, ¿Cuál sería el número de veces que debería aparecer el número II?

Ejemplo. Si la probabilidad de cierto grupo genético que llamaremos A es de 33 %, ¿Cuál va a ser el número esperado de portadores de ese grupo genético si analizamos a 1584 individuos elegidos al azar?

Probabilidades ordinales y permutaciones.

Las probabilidades condicionales encierras más trucos que el solo hecho de tener que multiplicarlas, por ejemplo, si tenemos un par enfermo/sano, y nos piden calcular las probabilidades de una serie: sano, sano, sano, enfermo; entonces la probabilidad no podrá calcularse con la mera multiplicación, púes la multiplicación de probabilidades solo nos dará la probabilidad de en cualquier orden sin una organización predeterminada.

Para poder calcular la probabilidad de una determinada serie organizada deberemos emplear una permutación. La permutación es una técnica de conteo que permite calcular las posibles ordenaciones de los elementos de un conjunto o número de elementos del espacio muestral de un experimento aleatorio. En esta técnica de conteo se considera que existe el orden en la muestra, pero no es posible repetir ningún elemento de la población en su conformación.

La fórmula de la permutación nos permitirá obtener la probabilidad de una determinada serie organizada dentro de un conjunto de series posibles, sin tener que realizar un proceso de descarte manual:

Ejemplo. Cuál es la probabilidad que de 5 hijos, los primeros cuatro sean normales mientras que el último manifieste una enfermedad congénita que tiene una probabilidad de manifestarse del 0.25

 

No hay comentarios:

Publicar un comentario