-
Notifications
You must be signed in to change notification settings - Fork 0
crisale84/labgen
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
a) La carpeta RADcap, contiene los scripts para hacer un ensamble de secuencias de ADN asociadas a los sitios de restricción enzimática (RADseq), de tipo RADcap, estos scripts se ejecutan en Miztli o en cualquier computadora con sistema operativo linux. d) Análisis de estructura poblacional usando el software Structure en la supercomputadora Miztli: 1.- Copia la carpeta software_structure de mi $HOME a tu espacio de trabajo. 2.- Dentro de la carpeta encontrarás la consola que contiene los siguientes archivos: extraparams mainparams pops2numb.sh structure structure.sh El archivo pops2numb.sh te permitirá cambiar la notación de missing data a la reconocida por Structure (-9), por lo que primero deberás copiar el archivo populations.structure a esta consola: cp ~/populations_output/populations.structure . Y posteriormente ejecutar : ./pops2numb.sh En la pantalla observarás el número de loci que contiene tu archivo populations.structure 3.-Abre mainparams con nano y deberás reemplazar: #define MAXPOPS XX // por el número de poblaciones totales que se analizaron en tus datos y se define desde tu popmap.tsv de Stacks // puedes usar: cat populations.structure | cut -f2 |sort |uniq #define BURNIN 100000 // cien mil réplicas de burning #define NUMREPS 200000 // doscientos mil iteraciones #define NUMLOCI XXX //por el número de loci que arrojó pops2numb.sh #define NUMINDS XXX //por el número de individuos en tu archivo, que es igual al número de columnas en populations.structure.modified.tsv entre dos Guarda este archivo sobre-escribiendo el nombre mainparams 4.- Ejecuta: cat populations.structure| cut -f2 | sort |uniq y utiliza ese output para llenar el apartado 3 de pop2numb.sh Con nano, abre: pops2numb.sh nano pops2numb.sh y, en la sección 3, cambia el nombre de las poblaciones por los números que serán reemplazados, observa que existe un 'tab' antes y después de cada población: cat populations.structure.tsv | sed -E \ -e 's/ BocadeCamichin / 1 / ' \ -e 's/ Chametla / 2 / ' \ -e 's/ Cuautla / 3 / ' > populations.structure.modified.tsv Ejecuta: $./pops2numb.sh 5.- Por ultimo, con nano abre structure.sh nano structure.sh En el encabezado, seguido de el signo de gato (#) están los parámetros que leerá Miztli a través de bsub, puedes cambiar todo, aquí te dejo lo básico de básicos, para mayor información puedes seguir la guía de Miztli: #!/bin/bash #BSUB -J strkBco <---- Nombre del Job, solo te permite 10 dígitos #BSUB -q q_residual <---- Nombre de la cola, opciones: q_residual, q_16p_256g , q_32p_256g , q_gpu , q_hpc #BSUB -oo salida.p1 <----- aquí se guarda tu output, si no cambias el nombre se sobre-escribe, por favor cámbialo. #BSUB -eo error.p1 <----- aquí se guardan los errores en tu output, lo mismo, si no cambias el nombre se sobre-escriba, por favor cámbialo. #BSUB -n 6 <----- Número de nodos, nuestro máximo son 32 #BSUB -R "span[hosts=1]" <------ NUNCA LO CAMBIES NI MUEVAS, ESTA LÍNEA CONVERGE TODO EL ANÁLISIS A UN PUNTO DE ENTRADA PARA EL OUTPUT Y QUE NO SE DIFUMINE LA INFORMACIÓN POR DOQUIER, CAMBIARLO PUEDE CAUSAR ERRORES EN LA EJECUCIÓN DE TU SCRIPT EN EL CUERPO DE structure.sh: Cambia el numero de poblaciones por las poblaciones contadas+uno Si gustas puedes aumentar el número de réplicas, yo trabajo con 3! NO CAMBIES NADA MÁS! Guarda con Ctrl+O Ahora si, ejecuta: $bsub < structure.sh Todos los parámetros serán leídos por bsub y ejecutados en Miztli, dependiendo de la cantidad de burning, réplicas que hayas pedido en mainparams y el número de cores y la cola a la que hayas enviado tu trabajo, este script puede tardar algún tiempo... puedes consultar el avance de tu trabajo con: $bjobs o bien, $bjobs 885413 <-------- con el número del Job Una vez terminado se guarda el Job en una carpeta: results_DIA_MES_AÑO.zip Esta la puedes descargar a tu computadora personal y ver los resultados en línea # upload the results.zip file to the web page: http://taylor0.biology.ucla.edu/structureHarvester/ # example of an aplication to obtain a structure plot http://omicsspeaks.com/strplot2/ También puedes ir a esta página http://pophelper.com/ y subir tus archivos .meanQ para obtener los resultados graficados en html :)
About
Genómica Poblacional con RADs, cluster Miztli, UNAM
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published