Construcción De Una Base De Datos Genómica Y Su Empleo Mediante Una Aplicación De Análisis De Secuencias

Jorge J. Rangel L. 1 , Pedro Linares H 2
1Departamento de Biología, Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
2Centro Multidisciplinario de Visualización y Cómputo Científico (CeMViCC), Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
Autor de Correspondencia: jjrangel1@uc.edu.ve, plinares@uc.edu.ve

Ver Arhivo PDF

Resumen

Se desarrolló una aplicación de software de análisis de secuencias biológicas. Este incluye funciones básicas relacionadas con el flujo de información genética, tales como: Replicación, secuencias invertidas, transcripción, transcripción inversa y traducción. La aplicación GCMP (Siglas en inglés de “Programa Manipulador del Código Genético”) contiene una implementación del algoritmo de alineamiento global, Needleman-Wunsch, tanto para proteínas como para ADN. También se implementó el algoritmo Smith-Waterman para comparación de pares de secuencias o de una secuencia con una base de datos (BD) local. Dicha BD contiene el genoma de 21 microorganismos procariotas, además de los siguientes eucariotas: Homo sapiens, Mus musculus, Drosophila melanogaster, Caenorhabditis elegans, y Pan troglodytes. Los alineamientos locales encontrados en la BD pueden ser redirigidos directamente por el programa hacia un visualizador de genes en Internet. El método de búsqueda separa los genomas de la BD en cadenas del doble del tamaño de la secuencia a comparar, y además solapa partes de dos cadenas consecutivas con el propósito de realizar una comparación exhaustiva. GCMP consta de una interfaz gráfica amigable, escrito el lenguaje de programación Python.


Palabras claves:

Construction of a Genomic Database and Its Use by a Sequence Analysis Application 

Jorge J. Rangel L. 1 , Pedro Linares H , 2
1Departamento de Biología, Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
2Centro Multidisciplinario de Visualización y Cómputo Científico (CeMViCC), Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
Autor de Correspondencia: jjrangel1@uc.edu.ve, plinares@uc.edu.ve

Ver Arhivo PDF

Abstract

We have developed a software application for biological sequence analysis. The program includes basic functions related to the genetic information flow, such as: Replication, inverted sequences, transcription, reverse transcription and translation. GCMP (Genetic Code Manipulating Program) contains a global alignment implementation, the Needleman-Wunsch algorithm, for proteins as well as DNA. The Smith-Waterman algorithm was also implemented, which allows pairwise sequence comparison or a local database (DB) search. This DB includes genomes of 21 prokaryote microorganisms, as well as the following eukaryotes: Homo sapiens, Mus musculus, Drosophila melanogaster, Caenorhabditis elegans, and Pan troglodytes. Local alignments found in the DB can be redirected by the program to an internet gene viewer. The search method splits genomes in strings twice the size of the query sequence, and it also overlaps consecutive string fragments with the intention of performing an exhaustive comparison. GCMP possess a friendly graphic interface, it is written in the programming language Python.


Keywords: