Annotation

Anotación de variantes (archivos vcf) con Annovar

Este pipeline realiza la anotación de variantes a partir de archivos VCF.

Nota: Para poder utilizar annovar es necesario conseguir tu propia liga en el siguiente link y descargar tus propias bases de datos para realizar la anotación.

Instrucciones de uso

Preparar el ambiente de trabajo

Te debes asegurar de contar con las siguientes herramientas informaticas: - NextFlow (22.10.7) - Docker (23.0.5) - Imagen de docker pipelinesinmegen/pipelines_inmegen:public, la puedes clonar con el comando:
```
 docker pull pipelinesinmegen/pipelines_inmegen:public
```
Asegurarse de contar con las siguientes bases de datos, necesarias para el pipeline:
- refGene
- ensGene
- avsnp150
- clinvar
- gnomad312_genome
- cosmic92
- dbnsfp33a

Consulta esta liga para más información.

Ejecutar el flujo de trabajo

Para correr este pipeline se deben de ejecutar las siguientes instrucciones:

Generar el archivo sample_info.tsv con la información que se describe en la sección - Formato del archivo con la información de las muestras -
Editar el archivo de nextflow.config con la siguiente información:
- Ruta de los archivos vcf
- En caso de utilizar un vcf producto del llamado conjunto de variantes [VC-Germinal] seleccionar multiple_samples=true
- Ruta del directorio de salida de nextflow
- Nombre del proyecto
- Ruta de la referencia
- Ruta del archivo sample_sheet.tsv
- Nombre de la referencia
- Ruta del directorio de annovar
- Número de núcleos por proceso (parámetro runOptions)
- Número de procesos que se ejecutarán de forma simultánea (parámetro queueSize)
Ejecutar el comando correspondiente a cada subflujo de trabajo:
```
bash run_nextflow.sh /path/to/out/dir
```

Formato del archivo con la información experimental

Para tener un buen control de los archivos a procesar (formato vcf), el archivo sample_info.tsv debe de incluir la siguiente información por columna:

Sample	Path	Index
Sample_name	/paht/to/vcf_file	/path/to/vcf_index

Sample = Nombre completo de los archivos vcf, se recomienda el formato [nombre de la muestra - número de muestra]
Path = Ruta absoluta del archivo vcf de la muestra sample

Las herramientas utilizadas para correr este flujo de trabajo son:

GATK (4.2.6.1)
Bcftools (1.14.0)
Annovar

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
main.nf		main.nf
nextflow.config		nextflow.config
run_nextflow.sh		run_nextflow.sh
sample_info.tsv		sample_info.tsv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Annotation

Annotation

README.md

Anotación de variantes (archivos vcf) con Annovar

Instrucciones de uso

Preparar el ambiente de trabajo

Ejecutar el flujo de trabajo

Formato del archivo con la información experimental

Las herramientas utilizadas para correr este flujo de trabajo son:

Files

Annotation

Directory actions

More options

Directory actions

More options

Latest commit

History

Annotation

Folders and files

parent directory

README.md

Anotación de variantes (archivos vcf) con Annovar

Instrucciones de uso

Preparar el ambiente de trabajo

Ejecutar el flujo de trabajo

Formato del archivo con la información experimental

Las herramientas utilizadas para correr este flujo de trabajo son: