Un polimorfismo dun só nucleótido, polimorfismo dun único nucleótido, polimorfismo de nucleótido único ou polimorfismo de nucleótido simple, abreviado como SNP polas súas siglas en inglés (Single-Nucleotide Polymorphism), é unha variación na secuencia de ADN que consiste en que hai unha diferenza dun só nucleótido (A, T, C ou G) do xenoma (ou outra secuencia compartida) entre membros dunha especie biolóxica ou entre os cromosomas pares humanos. Por exemplo, dous fragmentos de ADN similar secuenciados en diferentes individuos que son AAGCCTA e AAGCTTA, teñen unha diferenza dun só nucleótido. Neste caso diremos que son dous alelos. Case todos os SNPs comúns teñen só dous alelos. Os SNP constitúen ata o 90% de todas as variacións xenómicas humanas, e aparecen cada 1.300 bases como media, ao longo do xenoma humano. Dous terzos dos SNP corresponden á substitución dunha citosina (C) por unha timina (T). Estas variacións na secuencia do ADN poden afectar á resposta dos individuos a enfermidades, bacterias, virus, produtos químicos, fármacos etc. Xeralmente considérase que unha destas variacións deben darse polo menos nun 1% da poboación para ser consideradas como un SNP; se a porcentaxe é inferior considéranse mutacións puntuais. Algúns autores consideran que os cambios duns poucos nucleotidos (non só os dun nucleótido) e pequenas insercións e delecións (indeis) poden considerarse tamén dentro da familia dos SNP, pero neste artigo consideraranse só os dun nucleótido.
A distribución xenómica dos SNPs non é homoxénea; xa que os SNPs xeralmente aparecen máis frecuentemente en rexións non codificantes do xenoma que nas rexións codificantes ou, en xeral, onde a selección natural está actuando e fixando o alelo do SNP que supoña a adaptación xenética máis favorable. Outros factores como a recombinación xenética e a taxa de mutación, poden tamén determinar a densidade dos SNP.
A densidade de SNP pode predicirse pola presenza de microsatélites: en particular, os microsatélites AT son preditores poderosos da densidade de SNP, e os tramos con repeticións (AT)(n) longas tenden a encontrarse en rexións onde a densidade de SNPs é significativamente reducida e o contido GC é baixo.
Dentro dunha poboación pode asignárselles aos SNPs unha frecuencia alélica menor (a menor frecuencia alélica nun locus que se observa nunha determinada poboación). Hai variacións de frecuencia entre as poboacións humanas, polo que un alelo de SNP que é común nunha área xeográfica ou grupo étnico pode ser máis raro noutro.
Estas variacións xenéticas entre individuos (especialmente en partes non codificantes dun xenoma) aprovéitanse para obter as impresións dactilares do ADN, que se utilizan en ciencia forense para distinguir individuos. Ademais, estas variacións xenéticas subliñan diferenzas na nosa susceptibilidade á enfermidade. A gravidade dunha enfermidade e o modo en que o noso corpo responde aos tratamentos son tamén manifestacións de variacións xenéticas. Por exemplo, as mutacións dunha soa base no xene da APOE (apolipoproteína E) están asociadas cun maior risco de padecer a enfermidade de Alzheimer.
Tipos de SNPs |
---|
|
Os SNPs poden encontrarse en secuencias codificantes de xenes, en secuencias non codificantes de xenes (intróns), ou nas rexións interxénicas (entre os xenes). Os SNPs que están dentro dunha secuencia codificante non cambian necesariamente a secuencia de aminoácidos da proteína que se produce, debido á dexeneración do código xenético.
Os SNPs das rexións codificantes poden ser de dous tipos, sinónimos e non sinónimos. Os SNPs sinónimos non afectan á secuencia de proteínas mentres que os non sinónimos cambian a secuencia de aminoácidos da proteína. Os SNPs non sinónimos son, á súa vez, de dous tipos: con cambio de sentido e sen sentido.
Os SNPs que non están nas rexións que codifican proteínas poden afectar ao splicing xénico, unión de factores de transcrición, degradación do ARN mensaxeiro, ou á secuencia dun ARN non codificante. A expresión xénica afectada por este tipo de SNPs denomínase eSNP (expression SNP) e pode producirse augas arriba ou augas abaixo do xene.
As variacións nas secuencias de ADN humanas poden afectar ao desenvolvemento de enfermidades e a resposta a patóxenos, substancias químicas, medicamentos, vacinas e outros axentes. As SNPs son tamén fundamentais para aplicar a medicina personalizada. Porén, a súa principal importancia na investigación biomédica é comparar rexións do xenoma entre cohortes estatíticas (como cohortes coincidentes con ou sen unha enfermidade) en estudos de asociación de xenoma completo.
O estudo dos SNPs é tamén importante nos programas de agricultura e gandaría. No xenotipado de SNPs hai varios métodos para identificar SNPs.
Os SNPs son xeralmente bialélicos, polo que poden probarse doadamente. Un só SNP pode causar unha enfermidade xenética mendeliana. Nas enfermidades complexas os SNPs non funcionan xeralmente de forma individual, senón que adoitan funcionar en coordinación con outros SNPs para manifestar unha enfermidade, como pode verse na osteoporose.
En xuño de 2012, a base de datos dbSNP listaba 53.558.214 SNPs en humanos.
Os SNPs foron utilizados en estudos de asociación de xenoma completo (GWAS), como marcadores de alta resolución no mapado de xenes relacionados con enfermidades ou os caracteres normais. O coñecemento de SNPs axudará ao coñecemento da farmacocinética ou a farmacodinámica, é dicir, como actúan os fármacos en individuos con diferentes variantes xenéticas. Unha ampla gama de enfermidades humanas como o cancro, enfermidades infecciosas (SIDA, lepra, hepatite etc.) autoinmunes, neuropsiquiátricas, anemia falciforme, β-talasemia e fibrose quística poderían orixinarse por SNPs. Enfermidades con diferentes SNPs poden chegar a ser inportantes dianas farmacoxenómicas para a terapia con fármacos. Algúns SNPs están asociados co metabolismo de distintos fármacos. Os SNPs que non teñen un impacto observable no fenotipo son tamén útiles como marcadores xenéticos en estudos de asociación de xenoma completo, debido á súa cantidade e herdanza estable co paso das xeracións.
Igual que ocorre para os xenes, existen tamén bases de datos bioinformáticas para os SNPs. dbSNP é unha base de datos de SNP do National Center for Biotechnology Information (NCBI). SNPedia é unha base de datos de estilo wiki para axudar á anotación xenómica persoal, interpretación e análise. A base de datos OMIM describe a asociación entre os polimorfismos e enfermidades (por exemplo, dá as enfermidades en forma de texto), a Human Gene Mutation Database proporciona as mutacións de xenes que causan ou están asociadas con enfermidades conxénitas humanas e SNPs funcionais, e GWAS Central permite aos usuarios interrogar visulamente os datos dun ou máis estudos de asociación no xenoma. O grupo de traballo International SNP Map mapou a secuencia que flanquea cada SNP por aliñamento á secuencia xenómica de clons de inserción grande en Genebank. Estes aliñamentos foron convertidos nas coordenadas cromosómicas que se mostran na Táboa 1 Outra base de datos é o International HapMap Project, no que os investigadores están identificando SNP etiqueta (Tag SNP) para poder determinar a colección de haplotipos presentes en cada suxeito.
Cromosoma | Lonxitude (bp) | Todos os SNPs | SNPs TSC | ||
---|---|---|---|---|---|
SNPs | kb por SNP | SNPs | kb por SNP | ||
1 | 214.066.000 | 129.931 | 1,65 | 75.166 | 2,85 |
2 | 222.889.000 | 103.664 | 2,15 | 76.985 | 2,90 |
3 | 186.938.000 | 93.140 | 2,01 | 63.669 | 2,94 |
4 | 169.035.000 | 84.426 | 2,00 | 65.719 | 2,57 |
5 | 170.954.000 | 117.882 | 1,45 | 63.545 | 2,69 |
6 | 165.022.000 | 96.317 | 1,71 | 53.797 | 3,07 |
7 | 149.414.000 | 71.752 | 2,08 | 42.327 | 3,53 |
8 | 125.148.000 | 57.834 | 2,16 | 42.653 | 2,93 |
9 | 107.440.000 | 62.013 | 1,73 | 43.020 | 2,50 |
10 | 127.894.000 | 61.298 | 2,09 | 42.466 | 3,01 |
11 | 129.193.000 | 84.663 | 1,53 | 47.621 | 2,71 |
12 | 125.198.000 | 59.245 | 2,11 | 38.136 | 3,28 |
13 | 93.711.000 | 53.093 | 1,77 | 35.745 | 2,62 |
14 | 89.344.000 | 44.112 | 2,03 | 29.746 | 3,00 |
15 | 73.467.000 | 37.814 | 1,94 | 26.524 | 2,77 |
16 | 74.037.000 | 38.735 | 1,91 | 23.328 | 3,17 |
17 | 73.367.000 | 34.621 | 2,12 | 19.396 | 3,78 |
18 | 73.078.000 | 45.135 | 1,62 | 27.028 | 2,70 |
19 | 56.044.000 | 25.676 | 2,18 | 11.185 | 5,01 |
20 | 63.317.000 | 29.478 | 2,15 | 17.051 | 3,71 |
21 | 33.824.000 | 20.916 | 1,62 | 9.103 | 3,72 |
22 | 33.786.000 | 28.410 | 1,19 | 11.056 | 3,06 |
X | 131.245.000 | 34.842 | 3,77 | 20.400 | 6,43 |
Y | 21.753.000 | 4.193 | 5,19 | 1.784 | 12,19 |
RefSeq | 15.696.674 | 14.534 | 1,08 | ||
Totais | 2.710.164.000 | 1.419.190 | 1,91 | 887.450 | 3,05 |
A nomenclatura dos SNPs pode ser confusa: para un determinado SNP poden existir diversas variacións e non se chegou a un consenso. Un enfoque é escribir os SNPs cun prefixo, un punto e o signo "maior que" (>) para indicar o tipo salvaxe e o nucleótido ou aminoácido alterado; por exemplo, c.76A>T. Os SNPs desígnanse con frecuencia polo seu número dbSNP rs, como no exemplo anterior.
Entre os métodos analíticos para descubrir novos SNPs e detectar SNPs xa coñecidos están:
(subtitle) Medical applications are where the market's growth is expected