Las secuencias biológicas se pasan al software en un formato estandarizado denominado FASTA. FASTA es un formato de texto plano que se puede leer en cualquier editor de texto (TextEdit, Bloc de notas,...Las secuencias biológicas se pasan al software en un formato estandarizado denominado FASTA. FASTA es un formato de texto plano que se puede leer en cualquier editor de texto (TextEdit, Bloc de notas, VIM, etc). Los ácidos nucleicos (ADN y ARN) y las proteínas están representados por nucleótidos de una sola letra (A, T, C, G) o aminoácidos de una sola letra (20 aminoácidos). Las secuencias FASTA comienzan con un carácter > en la primera línea y pueden contener múltiples entradas de secuencia tod