Beca para Doctorado en Biología – Universidad de St. Andrews


El big data en diversos campos es un recurso en crecimiento y un desafío creciente. La disponibilidad de grandes conjuntos de datos heterogéneos a nivel individual que vinculan datos a través de diversos dominios, como indicadores de felicidad y genómica microbiológica, tienen el potencial de desentrañar la compleja interacción entre estos innumerables elementos en el curso de vida individual y en la sociedad en general. Para maximizar este potencial, es urgente el desarrollo de métodos avanzados para analizar estos datos complejos.
Esta estudiante de doctorado unirá experiencia en modelización computacional y biología (supervisor principal Smith) con ciencias sociales, demografía epidemiológica (cosupervisor Keenan), y genómica y resistencia a los antibióticos (cosupervisor Holden) para desarrollar enfoques analíticos para hacer frente a los desafíos en la integración de big data sobre factores sociales y conductuales con datos (micro)biológicos y biomédicos.
En este doctorado, explorará las redes bayesianas como un mecanismo para integrar las ciencias sociales y los datos biológicos. Las redes bayesianas son una herramienta estadística flexible capaz de modelar las relaciones más directas entre una colección de variables. Las redes bayesianas se pueden utilizar tanto de forma predictiva, por ejemplo, dado un conjunto conocido de relaciones y algunos valores conocidos, proporcionan estimaciones para valores desconocidos (inferencia variable), y como método para las interacciones desconocidas de ingeniería inversa en un sistema basado en datos (aprendizaje de estructura).
Los datos de ciencias sociales suelen ser observacionales, sin capacidad para manipular variables experimentalmente, sin embargo, hay un gran interés en recuperar interacciones funcionales y causales para explicar cómo surgen ciertos comportamientos o situaciones. Además, los análisis estadísticos aplicados tradicionalmente a menudo luchan contra los datos que pueden ser ruidosos y el ruido no aleatorio. Los cuestionarios a menudo se responden de una manera sistemáticamente sesgada, y la auto-información de ciertos aspectos está sujeta a una mala memoria, sesgo de conveniencia o autoestimación inexacta. Los datos también a menudo vienen en formas categóricas, en lugar de numéricas, lo que puede ser problemático para algunas formas de modelado estadístico. Por último, los datos que faltan, en términos de respuestas faltantes y desgaste longitudinal es común. Todas estas características son poco adecuadas para los métodos estadísticos tradicionales que asumen ruido aleatorio y se basan en ecuaciones que relacionan valores numéricos.
Las redes bayesianas tienen potencial para abordar todos estos problemas. Pueden modelar fácilmente en un análisis muchos tipos de variables, que van desde continuas hasta categóricas. Su marco probabilístico es excelentemente adecuado para manejar el ruido, incluido el ruido distribuido no normalmente. Las redes bayesianas también pueden incluir “nodos ocultos” que representan variables latentes no medidas, cuya influencia en las variables medidas se puede aprender, por ejemplo, revelando sesgo no aleatorio en el ruido. Por último, la inferencia variable en las redes bayesianas presenta un método natural de imputación de datos que faltan de una manera sensata e informativa durante el proceso de aprendizaje.
Sin embargo, a pesar de su idoneidad teórica, las redes bayesianas aún no se han aplicado ampliamente en las ciencias sociales. Esto se debe en parte a que es necesario desarrollar tanto la metodología práctica como los avances teóricos específicos antes de que sean un enfoque verdaderamente utilizable. En este doctorado, desarrollarás estas innovaciones metodológicas y aplicarás tu trabajo a dos cuestiones apremiantes: resistencia antibacteriana y envejecimiento saludable.
Fecha cierre convocatoria beca 6 enero 2020
Mayores informes beca

Deja un Comentario