UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS BIOLÓGICAS TESIS DOCTORAL MEMORIA PARA OPTAR AL GRADO DE DOCTOR PRESENTADA POR Cristina Gamba DIRECTORES: Eduardo, dir Arroyo Pardo Eva, dir Fernández Domínguez Madrid, 2015 © Cristina Gamba, 2012 Aplicaciones del DNA antiguo a muestras humanas : relaciones familiares y estudios poblacionales diacrónicos Departamento de Bioquímica y Biología Molecular I UNIVERSIDAD COMPLUTENSE UNIVERSIDAD COMPLUTENSE DE MADRID -R. ' FACULTAD DE CIENCIAS BIOLOGICAS Departamento De Bioquimica y Biologia Molecular I Aplicaciones del DNA antiguo a muestras humanas: relaciones familiares y estudios poblacionales dlacronicos 5 - TESIS DOCTORAL BIBLIOTECA Cristina Gamba Madrid, 2011 Este trabajo de tesis se ha realizado gracias a la financiaciôn de los siguientes proyectos de investigaciôn y la siguiente beca predoctoral: Proyectos: Estudio de la transiciôn Mesolitico-Neoiitico en la Cuenca Mediterrânea mediante el analisis de muestras biolôgicas antiguas (CGL2009-07959). Ministerio de Ciencia e Innovaciôn (2009-2011). Investigador Principal: Eduardo Arroyo Pardo. Estudio del poblamiento del noreste Peninsular mediante el analisis de la diversidad de ADN mitocondrial de muestras biolôgicas antiguas procedentes de yacimientos de época Calcolitica. Universidad Complutense de Madrid- Comunidad Autônoma de Madrid (2009-2010). Investigador Principal: Eva Fernandez Dominguez. Estudio de la Neolitizaciôn de la Cuenca Mediterrânea mediante analisis de la variabilidad genética de muestras biolôgicas antiguas (CGL2006-07828/BOS). Ministerio de Educaciôn y Ciencia (2006-2009). Investigador Principal: Eduardo Arroyo Pardo. Identificaciôn de las secuencias genéticas en los enterramientos multiples de época Calcoiftica en Castellôn (ADN mitocondrial). Fundaciôn Dâvalos-Fletcher (Castellôn) (2006-2007). Investigador principal: Arturo Oliver Foix. - Analisis de polimorfismos genéticos autosômicos, de Cromosoma Y y de ADN mitocondrial en muestras biolôgicas (Art.83 L.O.U) (2005-actualidad). Investigador principal: Eduardo Arroyo Pardo. El muestreo ha sido realizado gracias a los siguientes proyectos: - The last hunter-gatherers and the first farming communities in the south of the Iberian Peninsula and north of Morocco: a socio-economic approach through the management of production instruments and exploitation of the domestic resources (I&D-PTDC/HAH/64548/2006). Fundaçao para a Ciencia e a Tecnologia-FCT (Portugal) (2008-2011). Investigador Principal: Juan Francisco Gibaja Bao. - El yacimiento prehistôrico de Sant Pau del Camp. Institute Cultura de Barcelona (Ayuntamiento de Barcelona) (2007-2008). Investigador principal: Miquel Molist Montana. Beca: F.P.U. (Formaciôn del Personal Universitario), AP2006-01586. Ministerio de Educaciôn. A mi familia Navigia atque agri culturas moenia leges arma vias vestes et cetera de genere horum, praemia, delicias quoque vitae funditus omnis, carmina, picturas et daedala signa polita usus et impigrae simul experientia mentis paulatim docuit pedetemptim progredientis. Titus Lucretius Corus, De rerum natura (Liber V) [Naves, cultives de los campos, fortiflcaciones, I eyes, / armas, caminos, vestidos y demàs beneficios de este tipo, / también los goces de la vida completamente todos, / poemas, pinturas y artisticas estatuas pulidas, / el uso y, al mismo tiempo, la experiencia de su espiritu active / poco a poco ensenô a los hombres, que avanzaban paso a paso. Tito Lucrecio Caro, La naturaleza de las casas (Libre V)] En este trabajo se han implicado muchas personas a las que querria agradecer. En primer lugar, me gustaria agradecer a mis directores de tesis el Dr. Eduardo Arroyo Pardo y la Dra. Eva Fernandez Dominguez por darme la posibilidad de realizar este trabajo de tesis en lo que me gusta. Muchas gracias por vuestras ensehanzas y vuestro apoyo constante durante estas ahos. Gracias por confiar en mi, animarme y creer en este trabajo. En segundo lugar querria agradecer a mis tutores durante las estancias en el extranjero y a sus colaboradores. A Marie-France Deguilloux y Marie-Hélène Pemonge por su disponibilidad y ayuda durante mi estancia en su laboratorio. A Lounès Chikhi y Rita Rasteiro por introducirme en el complicado mundo de las simulaciones de manera sencilla. Gracias a todos ellos por querer mantener una colaboraciôn estricta y confiar en este trabajo de tesis. Este trabajo multidisciplinar no habria sido posible sin la confianza depositada por parte de los arqueôlogos, antropôlogos y especialistas que han cedido las muestras para su anâlisis genético y que han colaborado en la realizaciôn de este estudio y en la interpretaciôn de los resultados. Muchas gracias por su colaboraciôn a: Miquel Molist, Arturo Oliver, Pilar Utrillo, Vicente Baldellou, Manuel Edo, Anna Blasco, Pepa Villalba, Teresa Cabellos, Antonio Carvalho, Juan Gibaja, Eulalia Subira, Jordi Ruiz, Vàngelis Villar, Francisco Pastor, Alejandro Pérez, Ferràn Estebaranz, Laura Martinez, Josep Anfruns, Mohaammad AIrousan, Joao Zilhôo, Daniel Turbôn, José Ramos, Ângel Esparza, German Delibes, José Antonio Sânchez, Didier Binder, Henry Duday, Carmen Olaria, Maria del Carmen Molestina, Chema Lôpez y Domingo Martinez. Querria también agradecer a los equipos de investigaciôn de Trinidad de Torres y de Terry Brown que han mantenido una colaboraciôn con nuestro grupo de investigaciôn a lo largo de estos ahos. Gracias a mi tutor Antonio Tormo por su disponibilidad y por demostrar interés en este trabajo. Gracias a Manuel Guzmôn por su asesoramiento en lafase fina l de este trabajo de tesis. Gracias a mis compaheros Carlos Baeza, Ana Maria Lôpez, Jorge Abarca, Maria Ruiz-Herrera, César Yoshi y Sara Palomo. Màs especialmente a Mirian Tirado, por su contribuciôn en la realizaciôn de este trabajo. Gracias a todos los miembros del departamento de Antropologia de la UCM, del Grupo de Genética de Poblaciones y Conservaciôn del Instituto Gulbenkian (Oeiras, Portugal) y del laboratorio LAPP - PACEA de la Universidad de Burdeos 1 (Talence, Francia). Gracias a todos los profesores que me han introducido en el mundo de la genética de poblaciones, especialmente a mis directoras del trabajo de fin de carrera: Maria Soledad Mesa, Patrizia Malaspina y Ana Maria Lôpez. El animo y el apoyo de mis padres en esta aventura lejos de casa han sido fondamentales. Grazie davvero Ugo e Giusy. Muchas gracias a mi hermana, por estar siempre pendiente de m i y ser también una gran amiga. Grazie Chiara! Estos ahos en Madrid no habrian sido tan bonitos sin mis amigos siempre a mi lado. Muchas gracias a Bea, Manu, David, Pedro, Maria José, Pabio, Jésus, Cristina, Alberto, Diego, Maria y David por apoyarme y compartir supermartes, fiestas, cumpleahos, conciertos, o unas simples cahas conmigo. Un agradecimiento especial a mi directora Eva, por su sincera amistad. Fuera de Madrid, gracias a mis amigos de Bergamo, especialmente a Chiara y Guido, a m i querida amiga de Roma, Anna, a Carolina por hacerme sentir en mi casa en Oeiras y a Giuseppe, en Burdeos. Y dejo por ultimo el que en mi vida es el primera. Muchas gracias Juan, por estar siempre a mi lado. INDICE GENERAL INDICE GENERAL INDICE DE FIGURAS__________________________________________________________ vi INDICE DE TABLAS___________________________________________________________ /X ABREVIATURAS______________________________________________________________xi RESUMEN (Espahol)__________________________________________________________ 1 ABSTRACT (English)__________________________________________________________ 3 INTRODUCClÔN_____________________________________________________________ 7 1.1 Justificaciôn de! trabajo__________________________________________________ 7 1.2 Marcadores genéticos en el estudio de! ADN antiguo 1.2.1 El ADN mitocondrial___________________________________________________________ 10 1.2.1.1 Caractehsticas del ADN mitocondrial_________________________________________ 12 1.2.1.2 Variabilidad genética del ADN mitocondrial____________________________________ 14 1.2.2 El ADN nuclear _______________________________________________________________ 17 1.2.2.1 Marcadores autosômicos___________________________________________________18 1.2.2.1.1 El cromosoma Y_______________________________________________________ 19 1.2.2.1.2 Variabilidad genética del Cromosoma Y___________________________________ 19 1.2.2.2 El cromosoma X___________________________________________________________ 22 1.3 El ADN antiguo; historia y problematicas asociadas a su analisis________________ 24 1.3.1 Historia del ADN antiguo _______________________________________________________24 1.3.2 Factores de degradaciôn del ADN antiguo_________________________________________ 27 1.3.2.1 Degradaciôn enzimética e hidrôlisis__________________________________________ 28 1.3.2.2 Oxidaciôn________________________________________________________________ 32 1.3.2.3 Puentes cruzados o "crosslinks"_____________________________________________ 33 1.3.3 Problematicas de los estudios de ADN antiguo_____________________________________ 33 1.3.3.1 Jumping PCR_____________________________________________________________ 33 1.3.3.2 Inhibidores de la reacciôn de PCR____________________________________________ 34 1.3.3.3 Contaminaciôn y criterios de autenticidad_____________________________________ 34 1.3.3.4 Influencia de los factores ambientales y del entorno de deposiciôn sobre la preservaciôn del ADN antiguo________________________________________________________________ 41 1.3.3.5 Limite de preservaciôn del ADN antiguo_______________________________________ 42 1.4 Aplicaciones del ADN antiguo______________________________________________44 1.4.1 Estudios diacrônicos en Europa y la Peninsula Ibérica, desde el Neolitico hasta la Edad del H ie rro___________________________________________________________________________ 44 1.4.1.1 Marco histôrico___________________________________________________________ 44 1.4.1.1.1 El Neolitico___________________________________________________________ 47 1.4.1.1.2 Transiciôn a la Edad de los Meta les y la Edad del Cobre_______________________ 52 1.4.1.1.3 Edad del Bronce ______________________________________________________ 55 1.4.1.1.4 Edad del H ierro_______________________________________________________ 57 1.4.1.2 Datos genéticos de la poblaciôn moderna_____________________________________ 59 1.4.1.3 Datos genéticos de las poblaciones antiguas___________________________________ 69 1.4.2 Relaciones familiares e Identificaciôn _____________________________________________74 OBJETIVOS (Espahol)________________________________________________________ S3 AIMS AND SCOPE (English)__________________________________________________ 87 ARTICULOS/ARTICLES______________________________________________________ 91 ARTICULO 1 / ARTICLE 1 ____________________________________________________________ 93 Resumen (Espanol)______________________________________________________________ 93 Anexo - ARTICULO 1_____________________________________________________________ 97 Appendix - ARTICLE 1____________________________________________________________ 98 ARTICULO 2 / ARTICLE 2 ____________________________________________________________ 99 Resumen (Espanol)______________________________________________________________ 99 ARTICULO 3 / ARTICLE 3 ___________________________________________________________ 103 Resumen (Espanol)_____________________________________________________________ 103 Supplementary Material ________________________________________________________ 117 Table S I____________________________________________________________________117 Table S2____________________________________________________________________118 Table S3___________________________________________________________________ 119 Table S4____________________________________________________________________122 Table S5____________________________________________________________________123 Table SB___________________________________________________________________ 124 Table S7____________________________________________________________________125 Figure S I __________________________________________________________________ 126 ARTICULO 4 / ARTICLE 4 ___________________________________________________________ 127 Resumen (Espanol)_____________________________________________________________ 127 Actualizaciôn - ARTICULO 4 ______________________________________________________ 133 Tablas______________________________________________________________________134 Anexo I_____________________________________________________________________135 Anexo I I ___________________________________________________________________ 138 Update - ARTICLE 4_____________________________________________________________ 139 Tables______________________________________________________________________140 Appendix I _________________________________________________________________ 141 Appendix II_________________________________________________________________ 144 ARTICULO 5 / ARTICLE 5 ___________________________________________________________ 147 Resumen (Espanol)_____________________________________________________________ 147 Supplementary M ate ria l________________________________________________________ 157 Figure S I __________________________________________________________________ 158 Samples pictures____________________________________________________________ 159 Table 51___________________________________________________________________ 160 Figure S 2__________________________________________________________________ 161 Table S2___________________________________________________________________ 161 DISCUSIÔN_______________________________________________________________ 165 Consideraciones generates___________________________________________________ 165 DISCUSIÔN DE LOS OBJETIVOS - METODOLOGÎA Y VALIDAClÔN DE LOS RESULTADOS _ 166 D.l Comparaciôn de diferentes metodologias disponibles en la literatura de ADN antiguo y forense para el aislamiento y la amplificaciôn de ADN de muestras arqueolôgicas. Selecciôn de aquellos protocoles mâs eficientes y que se ajustan a las caracten'sticas de las muestras disponibles y a las finalidades concretas del estud io.___________________________________________________ 166 D.1.1 Comparaciôn de diferentes metodologias para la extracciôn de ADN (ARTICULO 1)___ 167 D.1.2 Comparaciôn de diferentes metodologias para la amplificaciôn de ADN (ARTICULOS 2-5) _____________________________________________________________________________ 173 D .l.2.1 Amplificaciôn del ADN nuclear mediante el kit MiniFiler______________________176 D .l.2.2 Amplificaciôn del ADN mitocondrial mediante el kit Multiplex de Qiagen_______ 178 D.1.3 Selecciôn de las muestras y de la metodologia adecuada en funciôn de las finalidades del estudio (ARTICULOS 3-5 )________________________________________________________ 181 D.2 Evaluaciôn de la posibilidad de recuperar ADN a partir de muestras antiguas en funciôn de diferentes variables como son el estado de preservaciôn, la procedencia, la antigüedad, las III caractensticas morfolôgicas del tejido y el contenido de ADN en los extractos estimado mediante métodos espectrofotométricos._____________________________________________________ 187 D.2.1 Procedencia y antigüedad de las muestras (Articules 1, 3 y 4 )_____________________ 187 D.2.2 Caracten'sticas de las muestras (Articules 1 y 5 ) ________________________________ 189 D.2.3 Evaluaciôn de las medidas de absorbancia (Articule 1)___________________________ 192 D.3. Validaciôn de los resultados de ADN mitocondrial y nuclear obtenidos a partir de muestras histôricas y prehistôricas mediante los pertinentes criterios de autenticidad, aceptados internacionalmente.______________________________________________________________ 195 D.3.1 Detecciôn y control de la contaminaciôn durante la extracciôn y la amplificaciôn (Articules 3-5)__________________________________________________________________________195 D.3.1.1 Contaminaciôn en los blancos de extracciôn_______________________________ 196 D.3.1.2 Contaminaciôn en los blancos de PCR____________________________________ 197 D.3.1.3 Contaminaciôn no detectada en los blancos_______________________________199 D.3.2 Replicaciôn de los analisis en un segundo laboratorio ___________________________ 204 D.3.3 Consideraciones générales sobre la validaciôn de los resultados___________________207 DISCUSIÔN DE LOS OBJETIVOS ESPECIFICOS - ESTUDIO DIACRÔNICO-POBLACIONAL _ 2 0 9 D.4 Estimaciôn de la continuidad/discontinuidad genética entre los pobladores prehistôricos (neoliticos, calcoliticos, de la Edad del Bronce e iberos) y actuales del noreste de la Peninsula Ibérica (Comunidad Valenciana, Cataluna y Aragôn) y evaluaciôn del impacto genético del Neolitico en esta misma area. ______________________________________________________ 209 D.4.1 Comparaciôn de la composiciôn de haplotipos y haplogrupos de las poblaciones neoliticas, calcoliticas, de la edad del Bronce e iberas del noreste peninsular entre si y con otras poblaciones, antiguas y actuales, de la misma regiôn (Articules 3 y 4 ) __________________ 209 D.4.1.1 Composiciôn haplotipica de las poblaciones_______________________________ 213 D.4.1.2 Composiciôn de haplogrupos de las poblaciones___________________________ 215 D.4.2 Utilizaciôn de métodos filogenéticos, estadisticos y computacionales para la Interpretaciôn de los resultados, que incluyen la estimaciôn de la continuidad/discontinuidad genética entre diferentes périodes y la evaluaciôn del impacto del Neolitico en la regiôn estudiada (Articules 3 y 4 )_______________________________________________________ 225 D.4.2.1 Comparaciôn entre distancias genéticas observadas y simuladas_____________ 228 D.4.2.2 Selecciôn del modelo mâs adecuado_____________________________________ 236 DISCUSIÔN DE LOS OBJETIVOS - RELACIONES FAMILIARES________________________ 239 D.5 Verificaciôn de las hipôtesis de parentesco y de determinaciôn del sexe formuladas a partir de otras disciplinas (arqueologia, historiografia, genealogia, antropologia) mediante el anâlisis IV genético de marcadores nucleares STR en un conjunto de muestras medievales procedentes de sepulturas multiples (Iglesia de San Esteban de Cuéllar, Segovia)._________________________ 239 D.5.1 Interpretaciôn de los perfiles STRs (Articule 5 )_________________________________ 239 D.5.2 Interpretaciôn de los resultados genéticos obtenidos a la luz de hipôtesis arqueolôgicas, valorandolos conjuntamente con la informaciôn genealôgica, histôrica, arqueolôgica y antropolôgica disponible (Articule 5) ______________________________________________243 D.5.2.1 Determinaciôn molecular del sexe_______________________________________ 244 D.5.2.2 Relaciones fam iliares__________________________________________________ 245 CONCLUSIONES (Espahol)__________________________________________________ 251 CONCLUSIONS (English)_____________________________________________________ 259 BIBLIOGRAFIA______________________________________________________________ 267 CD 291 INDICE DE FIGURAS Figura 11 Esquema de la molécula de mtDNA. Se detallan la localizacion del D-Loop y, en su interior, las regiones hipervariables. También se représenta la localizacion de los principales genes a lo largo de la molécula y las mutaciones asociadas a los principales haplogrupos._____________________________ 12 Figura 12 Relaciôn filogenética entre los principales haplogrupos mitocondriales en correspondencia de las regiones geogràficas (imagen modificada a partir de http ://m itom ap.org).____________________ 16 Figura 13 Ârbol filogenético de los haplogrupos del cromosoma Y (imagen de Jobling y Tyler-Simth, 2003).________________________________________________________________________________21 Figura 14 Principales modificaciones post-mortem del ADN. Las fléchas rojas indican los principales sitios de depurinaciôn, las azules los de daho oxidativo y las verdes los de hidrôlisis (imagen modificada a partir de Hofreiter et al. 2001). ___________________________________________________________ 29 Figura 15 Mecanismos de actuaciôn de la desaminaciôn hidrolitica. Se detallan las lesiones de tipo l y d e tipo 2 .________________________________________________________________________________31 Figura 16 Mutaciones asociadas a la desaminaciôn hidrolitica de tipo 1 y 2. Se ilustran los distintos resultados dependiendo de si la Miscoding Lesion tiene lugar en la cadena ligera (CJ o en la pesada (C h) . _____________________________________________________________________________________ 31 Figura 17 Esquema de los posibles movimientos poblacionales que tuvieron lugar en Europa durante la expansiôn del hombre moderno (en rojo), la repoblaciôn de Europa a partir de los refugios paleoliticos (en morado) y la difusiôn de la agricultura (azul). Las fléchas se refieren a los posibles movimientos poblacionales/culturales sugeridos por los datos arqueolôgicos, y los ôvalos se corresponden con el comienzo de coda movimiento. Se sehalan con fléchas bidireccionales los movimientos de contracciôn demogrâfca en los refugios paleoliticos (ôvalos morados), seguidos de una expansiôn poblacional después del ultimo màximo glacial. La flécha discontinua représenta la expansiôn post-glacial desde el réfugia de lafranja cantabrica hacia Europa septentrional (Barbujani y Goldstein, 2004).___________ 46 Figura 18 Mapa en la que se representan las dataciones de las diferentes culturas neoliticas, expresadas en ahos a.C. (imagen modificada a partir de Guilaine 2003).___________________________________ 49 Figura 19 a) Distribuciôn de los monumentos megaliticos en Europa; b) Localizaciôn de algunas de las culturas de la Edad del Cobre y del Bronce: cultura del vaso campaniforme, de ànforas globulares, de la ceràmica cordada y del hacha de combate; c) Difusiôn de la cultura de las culturas herederas de los Campos de Urnas (Urnfield culture) durante el primer milenio AP; d) Mapa de Europa durante el primer milenio a.C.: las influencias célticas y orientales (griegas yfenicias) (imàgenes modificadas a partir de Cavalli-Sforza et al. 1994)________________________________________________________________ 54 VII Figura 110 Mapas sintéticos de la Peninsula Ibérica en la que se representan las primeras très componentes principales del estudio de Bertranpetit y Cavalli-Sforza (1991): a) primera componente principal, asociada a un 27 % de la variabilidad total, b) segunda componente principal, asociada a un 14 % de la variabilidad total, c) tercera componente principal, asociada a un 12% de la variabilidad total. El intervalo entre el valor màximo y el minimo de coda componente principal se ha subdividido en sels rangos iguales. La direcciôn de crecimiento de los valores de coda componente principal fue elegida de manera arbitraria (imagen modificada a partir de Bertranpetit y Cavalli-Sforza 1991).___________ 60 Figura 111 Dataciôn molecular de los principales haplogrupos europeos (imagen modificada a partir de Richards et al. 2000).___________________________________________________________________ 65 Figura D 1 (a) Efîciencia en la amplifîcaciôn ("Eficiencia PCR") frente a los diferentes yacimientos arqueolôgicos analizados, ordenados de la letra "a" a la "g" en orden cronolôgico de màs antiguo a màs redente. (b) Efîciencia en la obtenciôn de resultados replicables (media de la "Efîciencia 3,4" y "Eficiencia S,6")frente al método de extracciôn. (c) Poder inhibidor de los extractos en funciôn del método de extracciôn empleado (N.I.=Sin Inhibiciôn, P.l.=lnhibiciôn Parcial, T.l.=lnhibiciôn Total), (d) Poder de inhibiciôn f rente a los dos métodos de extracciôn basados en el empleo de silica, uno incluye GuSCN y otro NaCI. P/C: protocolo basado en el empleo de fenol/cloroformo (Fernôndez 200S); 5-6. protocole basado en el empleo de silica (Rohiand y Hofreiter 2009); Q; protocolo QIAamp DNA Micro Kit (Qiagen) (Figura 1 del ARTICULO 1).______________________________________________________________ 168 Figura D 2 Gràfîco de la distribuciôn de haplogrupos en las poblaciones antiguas con las que se han corn parada los datos de la présente tesis. Referencias bibliogràfîcas: Calcolltico Centro Europa (CWC) [Haak et al. 2008], Iberos Girona, Espaha [Sampietro et al. 200S], Neolitico Antiguo Centro Europa (LBK) [Haak et al. 200S, 2010], Mesolitico Centro Europa [Bramanti et al. 2009], Neolitico Final Francia [Lacan et al. 2011], Neolitico Medio Barcelona, Espaha [Sampietro et al. 2007], Neolitico Medio Francia [Deguilloux et al. 2011], Mesolitico Norte de Europa [Malmstrôm et al. 2009], Neolitico Norte de Europa [Malmstrôm et al. 2009]._______________________________________________________________ 217 Figura D 3 Probabilidad de obtener FsrSimulados mayores que los Fsrobservados entre parejas de poblaciones en los très modelos explorados (TMP, SM, SDGM). N^: tamaho efectivo poblacional. N^-Neo: rango de Ng. El color bianco se refiere a valores superiores a 0.05 (S %). Gràfîcos incluidos en los ARTICULOS 3 y 4 ._____________________________________________________________________ 231 Figura D 4 Probabilidad de obtener FsrSimulados mayores que los Fsrobservados entre parejas de poblaciones, en correspondencia de los très modelos explorados (TMP, SM, SDGM). Ng. tamaho efectivo poblacional. Ne-Neo: rango de Ng. El color bianco se refiere a valores superiores a 0.05 (S %). Gràfîcos incluidos en el ARTICULO 3 y 4 . __________________________________________________________ 235 VIII INDICE DE TABLAS Tabla D 1 Porcentaje de éxito en el anâlisis de las muestras validadas en los ARTICULOS 3 , 4 y S en funciôn del perfodo analizado. Se aporta también el porcentaje de inhibiciôn de los extractos en los yacimientos en los que fue testado. Debajo de coda perfodo se proporciona la media del éxito de amplificaciôn de los diferentes yacimientos incluidos y los marcadores analizados.________________175 Tabla D 2 Porcentajes de amplifcaciones contaminadas en relaciôn a los perlodos estudiados, el yacimiento, y el tipo de marcadores analizados. Se sehala también el porcentaje de éxito en la obtenciôn y validaciôn de los resultados.___________________________________________________________ 199 Tabla D 3 Porcentajes de muestras que no proporcionaron resultados reproducibles por yacimiento y perfodo cronolôgico analizado. Se distingue entre las diferentes causas defracaso: la ausencia de amplificaciôn y la detecciôn de contaminantes en el analisis de secuencias directas y clones, sehalôndose lafuente de contaminaciôn môs probable._________________________________________________199 Tabla D 4 Relaciôn del numéro de muestras analizados en un segundo laboratorio. Se detallan los porcentajes de replicaciôn exitosos asf como las causas de la ausencia de replicaciôn._____________ 206 Tabla D 5 Tabla resumen de los resultados obtenidos en los ARTICULOS 3 y 4 (respectivamente Tabla A l y Tabla 1). Los haplotipos coïncidentes estàn marcados con el mismo color (dentro de esta tabla y con la Tabla D 6). __________________________________________________________________________ 212 Tabla D 6 Haplotipos compartidos entre las muestras estudiadas y las disponibles en la literatura. Se marcan las coincidencias de haplotipos con los mismos colores empleados en la Tabla D 5 .________ 213 Tabla D 7 Distancias genéticas (Fst) entre las poblaciones analizados (Tabla A2 del Anexo I del ARTICULO 4 ) .________________________________________________________________________ 227 Tabla D 8 Resumen de los resultados obtenidos en las comparaciones entre Fst observadas y simuladas, elaborado a partir de los gràfîcos présenta dos en el présente apartado. Se especifîcan por coda pareja de poblaciones comparadas para qué valores es posible detector Fst simuladas mayores que las observadas en al menas el 5 % de los casos.__________________________________________________________ 229 Tabla D 9 Probabilidad de identificar el modelo de procedencia seleccionando 500 valores al azar dentro del conjunto de datos simuladas (1 millôn) por coda uno de los modelos: TPM (primera Ifnea), SM (segunda Ifnea) y SDGM (tercera Ifnea) (Tabla 54 del ARTICULO 3)._____________________________ 237 Tabla D 10 Perfiles de las muestras amplifîcadas con el kit MiniFiler. Los alelos con un asterisco (en las celdas grises) se refieren al fenômeno del allelic dropout y la presencia de un guiôn, a la ausencia de resultados (locus drop-out)._____________________________________________________________ 242 ABREVIATURAS A ABC a.C. aDNA AP C CNVs CRS D-Loop EUR G GuSCN H HAM HLA HVR HVS kb km L LD LTDNA LGM LUP Mb mg ml mtDNA MUP pi Adenina método computacional de aproximaciôn bayesiana, en inglés ̂ p ro x im a te Bayesion Computation antes de Çristo ADN antiguo, en inglés ancient DNA Antes de! Présente Çitosina variantes de numéro de copias, en inglés Copy Number Variants secuencia de referencia de Cambridge, en inglés Cambridge Reference Sequence, Lazo D o region control del mtDNA, en inglés Displacement Loop o Control Region Paleolitico Superior Inicial, en \ng\és Early Upper Palaeolithic Guanina Tiocianato de Guanidina cadena pesada del ADN mitocondrial, en inglés Heovy Hombre Anatomicamente Moderno antigenos leucocitarios humanos, en inglés Human Leukocyte Antigens Regiones Hipervariables del mtDNA, en inglés Hyperyariable R^egions Secuencias Hipervariables del mtDNA, en inglés Hyperyariable Sequences kilo bases, miles de bases Kilometro cadena ligera del ADN mitocondrial, en \ng\és Light desequilibrio de ligamiento, en mg\és Linkage Disequilibrium bajo numéro de moléculas de ADN molde, en inglés Low Template DNA ultimo màximo glacial, en inglés Last Glacial Maximum Paleolitico Superior Final, en inglés Late Upper Palaeolithic Mega bases, millones de bases miligramos milihtros ADN mitocondrial, en inglés mitochondrial DNA Paleolitico Superior Medio, en inglés Middle Upper Palaeolithic microlitro XI NaCI Ne NGS nm NRY nuDNA NUMTs PAR pb P/C PCA PCR Q rCRS RFLPs S-B SNP SRY STRs T TMRCA UEP YCC Cloruro Sôdico tamano poblacional efectivo técnicas de secuenciaciôn de nueva generaciôn, en inglés Next Generation Sequencing Nanometros region no recombinante del cromosoma Y, en inglés Non Reconmbinig region o f the Y chromosome ADN nuclear, en inglés nuclear DNA pseudogenes del ADN mitocondrial insertados en el ADN Nuclear, en inglés Nuclear mitocondrial DNA region pseudoautosomica, en inglés Pseudo-Autosomic Region gares de bases, en inglés base pairs protocolo de extracciôn de ADN que emplea Fenol Cloroformo, en \ng\és P^henol/Çhloroform anâlisis de las componentes principales, en inglés Principal Component Analysis reacciôn en cadena de la polimerasa, en inglés Polymerase Chain Reaction protocolo de extracciôn de ADN basado en el empleo de kits comerciales de la casa Qiagen. secuencia de referencia de Cambridge revisada, en inglés revised Cambridge Reference Sequence polimorfismos de longitud de los fragmentos de restricciôn, en inglés Restriction Fragment Length Polymorphisms protocolo de extracciôn de ADN basado en el empleo de silica, en inglés Silica-Based polimorfismo de un solo nucleôtido, en inglés S/ng/e Nucleotyde P^olymorphism regiôn del cromosoma Y que détermina el sexo masculine, en 'mg\és Sex-determinig Region o f Y secuencias cortas repetidas en tândem, en inglés Sbort Tandem Repeats Timina tiempo de coalescencia respecte al ancestro comün mâs reciente, en inglés Time to the Most Recent Common Ancestor evento polimôrfico unico, en inglés L/n/gue Event Polymorphisms consorcio del cromosoma Y, en \ng\és Y Chromosome Consortium XII RESUMEN (Espanol) El ADN antiguo es una disciplina de reciente incorporaciôn al campo cientifico y su desarrollo ha sido posible gracias a los avances de las técnicas de genética molecular y forense. El anâlisis de marcadores genéticos de muestras humanas antiguas ofrece una oportunidad ünica para investigar y comprobar hipôtesis planteadas desde la arqueologia, la historiograffa, la antropologia o la genética de poblaciones. Sin embargo, estâ dificultada por la escasez de muestras, la degradaciôn del material genético y los problemas de contaminaciôn. En la présente tesis doctoral se abordan aspectos metodolôgicos y aplicaciones de esta disciplina a restos humanos antiguos de épocas comprendidas entre el Neolitico y la Edad Media. En lo que se refiere a la implementaciôn metodolôgica, la comparaciôn de diferentes métodos de extracciôn descritos en la literatura ha permitido identificar como protocolo mâs eficiente el de Rohiand y Hofreiter (2007), basado en el empleo de silica. Este protocolo ha venido a sustituir a aquel habitualmente empleado por nuestro grupo basado en el empleo de fenol y cloroformo. Las principales ventajas de dicho método consisten en su elevada eficiencia en la obtenciôn de ADN y en la reducciôn de la manipulaciôn y consecuentemente del riesgo de contaminaciôn de las muestras con ADN actual. Por otra parte, en este protocolo no se produce una exposiciôn a sustancias tôxicas volâtiles, como el fenol y el cloroformo. La evaluaciôn de la influencia de diferentes variables en la obtenciôn de resultados ha puesto de manifiesto que la procedencia y el entorno de desposiciôn de las muestras son déterminantes a nivel de su preservaciôn molecular. Sin embargo, su antigüedad y caracteristicas morfolôgicas no parecen jugar un pape! tan importante. Gracias a la citada experimentaciôn metodolôgica y a la validaciôn de los resultados, segùn criterios establecidos internacionalmente, ha sido posible llevar a cabo un estudio poblacional diacrônico y establecer relaciones familiares entre varios individuos procedentes de enterramientos multiples. As I, el analisis del ADN mitocondrial de muestras neoliticas, calcoliticas, de la Edad del Bronce e iberas procedentes del noreste de la peninsula Ibérica ha permitido evaluar el poblamiento de esta region desde un punto de vista diacronico. Mediante la implementaciôn de los resultados obtenidos en simulaciones bayesianas coalescentes ha sido posible destacar los modelos demograficos que màs se ajustan a los resultados genéticos obtenidos. Se ha demostrado que los escenarios panmfcticos no permiten explicar los resultados genéticos obtenidos, mientras que los modelos estructurados muestran un mejor ajuste. Entre las conclusiones màs relevantes merece la pena destacar que los resultados apuntan a una colonizacion pionera de pequehos grupos neoliticos en el noreste de la Peninsula ibérica. Posteriormente, la dériva genética pudo jugar un papel importante, puesto que los periodos sucesivos (Neolitico Medio, Calcolitico, Edad del Bronce y poblaciôn actual) apuntan a la presencia de cierta continuidad genética hasta la actualidad, exceptuando el conjunto de muestras iberas, que présenta cierta diferenciaciôn respecte a todas las demas poblaciones. Por otra parte, se ha empleado una herramienta forense (AmpFBSTR* MiniFiler^'^ PCR Amplification Kit, Applied Biosystems) para el analisis de ADN nuclear de siete individuos medievales enterrados en un conjunto de sepulcros (Iglesia de San Esteban de Cuellar, Segovia). De esta manera ha sido posible asignar el sexo a todos los individuos, rectificando la determinaciôn realizada mediante estudios antropométricos en uno de ellos. Merece la pena destacar también que el analisis de los datos con un program a informatico de analisis de pedrigrees, usualmente empleado en el campo forense, ha permitido excluir la hipôtesis de paternidad entre dos individuos infantiles enterrados junto con un individuo adulto. Por otra parte, ha sido posible establecer una relaciôn paterno-filial asociada a una elevada probabilidad (99,98 %) entre otro espécimen y el individuo adulto mencionado, confirmando una hipôtesis arqueolôgica alternativa basada en inscripciones sépulcrales poco claras. ABSTRACT (English) Ancient DNA is a young field that has only recently joined the scientific community and has undergone rapid advancement thanks to technical innovations in molecular and forensic genetics. The analysis o f genetic markers from ancient human samples provides us with a unique opportunity to test hypotheses from the fields of Archaeology, History, Anthropology and Population Genetics. However, sample availability, degradation of genetic material and contamination problems still represent a major issue. The present PhD thesis explores both the methodological approaches and the applications of ancient DNA studies on human samples spanning from the Neolithic to Middle Ages. A comparison of different DNA extraction methods described in the literature revealed that Rohiand and Hofreiter's (2007) silica-based protocol was the most efficient methodology. This protocol replaced the Phenol/Chloroform DNA extraction method, commonly used in our laboratory. The major advantages of Rohiand and Hofreiter's method are that it is highly efficient in recovering DNA and it reduces the handling of the sample, which leads to lower levels of contamination. Moreover, in this protocol there is no exposure to toxic volatile reagents such as Phenol and Chloroform. A statistical evaluation of the different variables which can influence the results shows that the geographical origin and depositional environment of the sample play an important role in its molecular preservation. In contrast, sample age and morphology do not show a significant influence on DNA integrity. Thanks to this research on methodologies and further validation of results based on internationally established criteria, it has been possible to carry out diachronic population studies and to establish kinship among individuals coming from multiple burials. The settlement of North Eastern Iberia has been explored w ith a diachronic analysis of mitochondrial DNA from Neolithic, Chalcolithic, Bronze Age and Iberian samples. The implementation of Bayesian coalescent simulations has allowed us to determine which demographic models show a better fit with the observed data. It has been demonstrated that panmictic scenarios could not explain the obtained genetic results, while structured models showed a better fit. The conclusions contain notable findings such as an indication that the first colonisation was by small Neolithic groups in North Eastern Iberia. Afterwards, genetic drift probably played an important role, since comparisons among subsequent periods (Middle Neolithic, Chalcolithic, Bronze Age and the modern population) showed a certain degree of genetic continuity until the present. However, Iberian samples exhibited significant differences when compared to all other populations. A forensic tool {AmpF£STR*MiniFiler™ PCR Amplification Kit, Applied Biosystems) has also been used to analyse nuclear DNA from seven medieval individuals buried in four tombs (San Esteban church, Cuellar, Segovia, Spain). With this technique it has been possible to establish the sex of all the individuals, one of which had been previously determined incorrectly using anthropometric methods. It is also worth noting that data analysis using forensic software for the analysis of pedigrees, made it possible to reject the hypothesis of paternity between an adult and two infants buried together. Moreover, this adult showed a significant probability (99.98%) of being paternally related to another individual buried in a different tomb, as some burial inscriptions suggested. INTRODUCCION INTRODUCCION INTRODUCCION 1.1 JUSTIFICACION DEL TRABAJO Desde sus comienzos, el ADN antiguo (en inglés ancient DNA, aDNA) despertô el interés tanto de la comunidad cientifica como de! pùblico general. A principios de los anos noventa diferentes grupos de investigaciôn publicaron resultados muy impartantes a partir de muestras biolôgicas de millones de anos de antigüedad (Golenberg et al., 1990; Woodward et al., 1994). Estos hallazgos inspiraron peliculas y libros en los que el alcance de esta disciplina parecia no tener limite. Sin embargo, en el curso de unos pocos anos, se demostrô que el ADN se dégrada desde el momento de la muerte y que en condiciones ôptimas se puede conservar, si bien muy danado, durante un maximo de 100.000 anos (Lindahl, 1993, 1997), permitiendo una recuperaciôn de informaciôn genética a menudo escasa pero de valor ünico. En el caso de la especie humana el ADN mitocondrial ha sido objeto de estudio en trabajos centrados en la evoluciôn de los hommidos, las poblaciones humanas, su historia y sus relaciones filogenéticas. Este marcador se ha convertido en una herramienta de referenda en el estudio de linajes, debido a que se transmite a lo largo de la linea materna sin recombinacion y tiene una tasa de mutaciôn lo suficientemente elevada, como para adecuarse al estudio de la evoluciôn reciente del hombre. Existen diferentes trabajos que emplearon el ADN mitocondrial para détectar el origen y dispersion del hombre moderno. Entre ellos merece la pena destacar el que realizaron Cann y colaboradores (Cann et al., 1987), que llegaron a identificar una "Eva mitocondriaT, es decir, una variante de ADN mitocondrial que se originô hace unos 200.000 anos en Africa, aportando nuevos datos que apoyaban la hipôtesis de un ünico origen africano del hombre moderno. Esta hipôtesis fue conocida como "out of Cristina Gamba Africa" y, aunque se trata de la teoria actualmente mas aceptada, ha sido objeto de un largo debate. Otro caso muy debatido es el origen de la poblaciôn europea. Se ha pretendido encontrar un consenso en la cuantificaciôn del impacto genético de los pobladores neoliticos y paleoliticos. En este caso, en funcion del método de analisis de datos y del marcador genético empleado (ADN mitocondrial, cromosoma Y o marcadores autosômicos), se obtuvieron resultados discordantes (Richards, 2003; Dupanloup et al., 2004; Barbujani y Chikhi, 2006; Soares et al., 2010). Gracias a las mejoras de las técnicas disponibles y su implementaciôn por parte de equipos especializados, el ADN antiguo se ha convertido en una herramienta muy util para proporcionar informaciôn acerca de cuestiones de diferente indole, que incluyen las arriba mencionadas, asf como aplicaciones mas especificas y concretas, como la determinaciôn del sexo y estudios de identificaciôn y relaciones familiares. La présente tesis doctoral pretende aportar informaciôn acerca de la implementaciôn y mejora de técnicas en el campo del ADN antiguo asi como profundizar en diferentes cuestiones poblacionales, taies como el analisis diacrônico de la poblaciôn de! Levante Espahol desde el Neolitico hasta la época ibera y la determinaciôn molecular del sexo y la estimaciôn de relaciones familiares en un conjunto de sepulcros medievales. INTRODUCCION 1.2 MARCADORES GENETICOS EN EL ESTUDIO DEL ADN ANTIGUO Los marcadores genéticos representan una herramienta muy interesante puesto que permiten estudiar la evoluciôn de los seres vivos y de las poblaciones. Esto résulta posible gracias a la acumulaciôn de cambios aleatorios o mutaciones en el ADN a lo largo del tiempo. El analisis de estas mutaciones en diferentes individuos, poblaciones o especies permite establecer relaciones de parentesco o filogenéticas en funciôn de las muestras empleadas y de los marcadores estudiados. Las posibles aplicaciones abarcan diferentes areas de la biologia, como la genética forense, los estudios de ADN antiguo, los analisis genéticos de asociaciôn con enfermedades, la genética de poblaciones y los estudios evolutivos y de conservaciôn de especies. La evoluciôn de las mutaciones que se détectan a nivel de estos marcadores se debe principalmente al azar y se van acumulando con el tiempo. En funciôn de la aplicaciôn concreta, se pueden emplear marcadores de linajes maternos o paternos, que en el caso de la especie humana se situan respectivamente en el ADN mitocondrial y en el cromosoma Y, o bien secuencias situadas en otros cromosomas. Durante los ültimos veinte anos se ha ampliado muchisimo la informaciôn genética disponible acerca del origen del hombre y de las caracteristicas y relaciones entre las diferentes poblaciones humanas. En el caso de muestras antiguas, el marcador genético mas empleado es el ADN mitocondrial en especies animales y también el ADN présente en los cloroplastos en especies vegetales (Herrmann, 1994). La razôn principal de esta elecciôn se debe a la abundancia de estas moléculas en la célula, que supera la del ADN nuclear en unos cuatro o cinco ôrdenes de magnitud. Debido a la fragmentaciôn y degradaciôn del material genético con el tiempo, su abundancia asegura mayores probabilidades de recuperaciôn y analisis. Cristina Gamba 1.2.1 El AD N m itocondria l El ADN mitocondrial (en inglés mitochondrial DNA, mtDNA) humano es una molécula circular de doble cadena con una longitud de 16569 pb (pares de bases, en inglés base pairs) que se encuentra en el interior de las mitocondrias, organulos celulares encargados de la respiraciôn celular. Se estima que hace unos 2 billones de anos las mitocondrias establecieron una relaciôn simbiôtica con las células procariotas, cediendo posteriormente la mayoria de sus genes al nùcleo (Wallin, 1923). En la actualidad el mtDNA contiene la informaciôn genética para la sintesis de 13 polipéptidos, todos ellos implicados en la fosforilaciôn oxidativa, 2 RNAs ribosomales y 22 RNAs de transferencia. Estos ültimos proporcionan los componentes necesarios para la traducciôn intramitocondrial. Sin embargo, la contribuciôn genética mitocondrial a la fosforilaciôn oxidativa es muy reducida comparada con la del ADN nuclear, cuyas protefnas esenciales son transportadas en el interior de las mitocondrias a través de su membrana (Shoubridge, 2001). El mtDNA contiene varias regiones no codificantes, de las cuales la que présenta mayor tamaho se denomina Regiôn de Control {Control Region o D-Loop, Displacement Loop) y tiene una longitud de 1122 pb (ver Figura I 1). Esta regiôn esta implicada en la regulaciôn de la transcripciôn y de la replicaciôn. En particular aqui se sitüan el origen de replicaciôn de la cadena pesada (O h) y los promotores de las dos hebras (P| y Ph). También existen otros tractos o pares de bases puntuales que no estan directamente implicados en la sintesis de protefnas o de RNAs, como la adenina (A) en la posiciôn 7517 y las 5 pb situadas entre las posiciones 5580 y 5586 (entre los genes tRNATrp y tRNAAla) (Chinnery, 2006). Las dos cadenas de mtDNA tienen una composiciôn asimétrica de las bases, por lo cual se distinguen la cadena pesada (en inglés Heavy, H), rica en guaninas (G), y la cadena ligera (en inglés Light, L), rica en citosinas (G). Por convenciôn, las posiciones del mtDNA humano se numeran de la 1 a la 16569, tomando como referenda la cadena ligera del primer genoma mitocondrial secuenciado (Anderson et al., 1981), denominado CRS {Cambridge Reference Sequence) o secuencia de Anderson; 10 INTRODUCCION posteriormente revisada por Andrews y colaboradores (Andrews et al., 1999) (rCRS, revised CRS). Los polimorfismos del mtDNA, que incluyen cambios de una sola base (SNPs, en inglés Single Nucleotide Polimorphisms) e inserciones/deleciones (indels), se sehalan como diferencias (mutaciones) respecto a la rCRS. La tasa de mutaciôn no es constante a lo largo de la molécula de mtDNA, puesto que es considerablemente mayor en las 1,1 kb (kilo bases) de la regiôn control (bases 16024-576) que en las 15,5 kb de la regiôn codificante (bases 577-16023). Estas diferencias se deben a que la regiôn control, aunque juegue un papel importante en la replicaciôn, no es codificante, por lo que puede acumular mas mutaciones sin que éstas resulten perjudiciales. Existen también tasas de mutaciôn diferenciales entre posiciones nucleotidicas dentro de la regiôn control (Wakeley, 1993). Algunas posiciones, denominadas puntos calientes o hot sposts, son hipermutables (por ejemplo las posiciones 146, 150, 152, 195, 16189, 16311, 16362, 16519), mientras que otras son relativamente estables (por ejemplo las posiciones 477, 493, 16108, 16219). También en la regiôn codificante existen posiciones mas propensas que otras a la mutaciôn (por ejemplo las posiciones 709, 1719, 3010, 5460, 10398, 11914, 13105, 13708, 15884), causando homoplasias (recurrencias) en la filogenia del mtDNA (van Oven y Kayser, 2009). La regiôn control incluye très fragmentes llamados secuencias o regiones hipervariables: HVS-I, HVS-II y HVS-III (en inglés, Hypervariable Sequences, HVS), o HVRl, HVR2 y HVR3 (en inglés, Hypervariable Regions, HVR) (Brandstatter et al., 2004). El rango de cada una de estas regiones varia ligeramente entre la comunidad cientifica del ambito forense (HVS-I: 16024-16365, HVS-II: 73-340 y HVS-III: 438-576) y los estudios de genética de poblaciones, que incluyen ranges mas amplios (HVS-I: 16024- 16400, HVS-II: 44-340, y HVS-III: 438-576) (Chinnery, 2006). De las très regiones, la HVS-I es la mas variable, con una tasa de mutaciôn dos veces mayor que la HVS-II (Meyer et al., 1999). Ûltimamente se viene realizando la amplificaciôn del mtDNA complete o de una amplia bateria de SNPs con fines identificativos y poblacionales, siendo ambas estrategias mucho mas informativas que las regiones hipervariables (Quintans et al., 2004; Soares et al., 2010; Schonberg et al., 2011). Estos enfoques 11 Cristina Gamba resultan prometedores también en el campo del aDNA, especialmente en lo que concierne a la obtenciôn de secuencias mitocondriales complétas mediante el empleo de nuevas técnicas de secuenciaciôn masiva disponibles (Knapp y Hofreiter, 2010; Stoneking y Krause, 2011). Figura I 1 Esquema de la molécula de mtDNA. Se detallan la localizaciôn del D-Loop y, en su interior, las regiones hipervariables. También se représenta la localizaciôn de los principales genes a lo largo de la molécula y las mutaciones asociadas a los principales haplogrupos. 16024 16400 44 340 438 576 HVS-lKHVS-I HVS-I D-Loop G13708A A4529T J T V H.V C16069T C16294T T72C A73GU.K A12308G mtDNA G4580A Cadena Ligera (L) AU 947G A4917G Cadena Pesada (H) T10873C C6371T C7028TK M A10550G C10400T 1.2.1.1 C A R A C T E R IS T IC A S DEL ADN M IT O C O N D R IA L El mtDNA es una potente herramienta de investigaciôn de las poblaciones humanas debido a sus peculiares caracteristicas. Entre ellas destacan el elevado numéro de copias, la heteroplasmia, la ausencia de recombinacion, la herencia materna y la elevada tasa de mutaciôn. A continuaciôn se explica brevemente cada una de estas caracteristicas. 12 INTRODUCCION - Elevado numéro de copias Las células somaticas humanas contienen dos copias de ADN nuclear, heredadas de los progenitores, pero entre centenares y millares de copias de mtDNA (Robin y Wong, 1988). Por ello esta molécula es mas fàcil de analizar en casos de escasez de muestra o degradaciôn, como es el caso de la genética forense o de! ADN antiguo. - Heteroplasmia Teniendo en cuenta la cantidad de moléculas de mtDNA présente en un organismo humano, es posible que no todas las copias sean idénticas. Este fenômeno se conoce como heteroplasmia y se ha estimado que airededor del 14 % de la poblaciôn humana présenta dos variantes de mtDNA con una frecuencia de al menos un 1 % (Tully et al., 2000). Estos datos apuntan a la presencia de un mecanismo muy eficiente de selecciôn de moléculas mitocondriales en los primeros estadios de la oogénesis (Pakendorf y Stoneking, 2005). - Herencia materna La herencia uniparental de este marcador genético, junto con la consecuente falta de recombinaciôn, incluye una serie de ventajas respecto a los marcadores nucleares autosômicos, taies como el estudio de linajes y ancestros poblacionales. Durante muchos anos la herencia exclusivamente materna del mtDNA ha representado un verdadero dogma (Stoneking et al., 1992). Este dogma ha sido revisado desde que se detectô un caso de herencia mitocondrial prevalentemente paterna (Schwartz y Vissing, 2002), poniendo en discusiôn las inferencias poblacionales basadas en la herencia materna del mtDNA. Sin embargo, se trata del ünico caso descrito en la literatura y représenta una rarisima excepciôn a la régla. Numerosos estudios sobre la herencia mitocondrial no han vuelto a evidenciar la presencia de herencia paterna, por lo tanto la herencia materna del mtDNA puede seguir considerandose como una constante (Schwartz y Vissing, 2003). Ademas, se ha demostrado que el mtDNA paterno es selectivamente destruido por el oocito (Manfredi et al., 1997), por lo que su persistencia représenta un suceso muy improbable. 13 Cristina Gamba - Elevado tasa de mutaciôn En su conjunto, el mtDNA es mas sensible al dano oxidativo debido a su localizaciôn fuera del nücleo. Ademas, carece de la cobertura de protefnas como las histonas, que protegen el ADN nuclear. La replicaciôn de esta molécula es Nevada a cabo por una polimerasa mitocondrial propia, que présenta una actividad correctora limitada. Todos los factores citados influyen sobre su tasa de mutaciôn, que es unas 10 veces mayor que la del ADN nuclear. La tasa de mutaciôn en las diferentes regiones del mtDNA no es homogénea, en funciôn de si se trata o no de regiones codificantes. Mientras que la regiôn codificante présenta una tasa de mutaciôn de 1,7 x 10'® sustituciones por sitio y ano (Ingman et al., 2000), la de la regiôn control es aün mayor, estimada entre 7,5 x 10'® (Bandeit et al., 2006) y 3,02 x 10® (Endicott y Ho, 2008) por sitio y ano. 5in embargo, como ya se ha comentado, ese valor varia mucho dependiendo de la posiciôn concreta y de los métodos de estimaciôn. De hecho, a nivel de los hotspots la tasa de mutaciôn puede alcanzar valores entre 4 ô 5 veces mayores respecto a la media de la regiôn control (5toneking, 2000; Malyarchuk et al., 2002). 1.2.1.2 V A R IA B IL ID A D G E N E TIC A DEL ADN M ITO C O N D R IA L Mediante la comparaciôn del mtDNA con la secuencia de referencia (rCR5) se obtiene el haplotipo mitocondrial. Los haplotipos pueden presentar una distribuciôn geografica o étnica especifica y por ello esta informaciôn résulta muy interesante en estudios poblacionales. Los haplotipos se agrupan segün sus relaciones filogenéticas en haplogrupos, que se designan con letras mayüsculas del alfabeto. 5e considéra que las secuencias integradas en un mismo haplogrupo mitocondrial proceden de una ünica molécula ancestral, de la que se han diversificado por mutaciôn. Los primeros haplogrupos se identificaron en un estudio de mtDNA de americanos nativos, y se llamaron A, B, G y D (Torroni et al., 1993). Asf pues los haplogrupos detectados sucesivamente se designaron, por orden, con las restantes letras del alfabeto. En la mayorfa de los casos, la asignaciôn de haplogrupos no se puede basar exclusivamente en los datos proporcionados por la regiôn control (haplotipos), aunque 14 INTRODUCCION existen haplogrupos por los cuales la asignaciôn basada en la mera informaciôn haplotipica puede resultar fiable (por ejemplo los haplogrupos J lb l, Kla9) (van Oven y Kayser, 2009). Por tanto résulta relevante la confirmaciôn del haplogrupo, pronosticado por el haplotipo, mediante SNPs informativos localizados en la regiôn codificante, aunque la identificaciôn de estos SNPs depende de la informaciôn filogenética disponible (van Oven y Kayser, 2009). Los haplogrupos también tienen una distribuciôn étnica y geografica caracteristica. Por lo que respecta a Europa, los principales haplogrupos mitocondriales que se encuentran son: H, J, K, N I, T, U4, US, V, X y W (Loogvali et al., 2004) (ver Figura I 2). Cada haplogrupo puede incluir diferentes sub-haplogrupos (designados por la letra del haplogrupo seguida de un numéro), que a su vez pueden incluir varios sub-linajes (nombrados por la letra del haplogrupo seguida de un numéro y una letra). Por ejemplo, dentro del haplogrupo H se han identificado hasta 39 sub-clusters que van de H1 a H39; el H2 esta a su vez subdividido en H2a y H2b; el primero va desde H2al hasta H2aS (van Oven y Kayser, 2009). Esta compleja nomenclatura que alterna letras y numéros se debe a su estabilidad en el caso de sucesivas modificaciones en la filogenia (Jobling et al., 2003). En la Figura I 2 estan representados los principales haplogrupos dentro de cada continente. Muchos de estos haplogrupos presentan una distribuciôn uniforme en Europa, como el haplogrupo H, que es el mas frecuente en casi todas las poblaciones europeas (40- 60%) (Richards et al., 2000). Por otro lado existen otros haplogrupos con una distribuciôn muy caracteristica, como el haplogrupo J, muy frecuente en Prôximo Oriente, con cierto gradiente de frecuencias decreciente hacia el noroeste de Europa (Richards et al., 2000). Otros haplogrupos, como el V, y ciertos sub-haplogrupos, como el H l, H3 y USb, presentan picos de frecuencia en la franja cantabrica de la Peninsula Ibérica y en el Norte de Europa (Torroni et al., 2006). La frecuencia y distribuciôn de los haplogrupos europeos se ha asociado con los principales eventos migratorios de nuestro continente, como se explicara mas adelante (ver Apartado I.4.1.2). Por esta razôn y gracias a su abundancia en la célula, el mtDNA es ampliamente utilizado en estudios de genética de poblaciones antiguas. 15 Cristina Gamba En los ültimos 20 anos, se han publicado estudios poblacionales humanos que se remontan hasta el mesolitico. A pesar del reducido numéro de muestras estudiadas, de la limitada disponibilidad de restos antiguos y de las dificultades asociadas a su analisis, los resultados obtenidos hasta la fecha han contribuido al conocimiento de la composiciôn genética de nuestros antepasados (ver Apartado I.4.1.3). Figura I 2 Relaciôn filogenética entre los principales haplogrupos mitocondriales en correspondencia de las regiones geogrâficas (imagen modificada a partir de http://m itomap.org). Asia A132C16 A4917G C1M00T T4214C -C 7«2«T-. H V >.Ç14T»6T- A1230M3 AfricaEurope T lM tS C A106SOG C391tA Ademas, el mtDNA permite la reconstrucciôn de genealogias y relaciones familiares a lo largo de la linea materna. Por ello, su analisis puede aplicarse para examinar de manera prospective las relaciones existentes en casos de enterramientos multiples. El estudio del mtDNA permite excluir la hipôtesis de maternidad si se presentan haplotipos diferentes. En la situaciôn opuesta, en funciôn del haplotipo encontrado, es posible calculer la probabilidad de maternidad pero con una probabilidad reducida (ver Apartado 1.4.2). 16 http://mitomap.org INTRODUCCION 1.2.2 El AD N nuclear El ADN nuclear (nuDNA) incluye la mayoria de la informaciôn genética para las funciones vitales de los individuos. Su genoma esta organizado en 22 parejas de cromosomas autosômicos y una pareja de cromosomas sexuales, XX en mujeres y XY en varones. En total suman unas 3.000 Mb (Mega bases o millones de bases), que contienen airededor de 25.000 genes. En funciôn de las aplicaciones concretas, se suelen estudiar diferentes regiones polimôrficas del genoma. Para estudiar relaciones familiares cercanas o identificar un individuo, se analizan marcadores altamente variables repetidos en tandem, como los microsatélites o STRs (en inglés. Short Tandem Repeats), cuya tasa de mutaciôn es de airededor de 10^ - 10 por locus y por generaciôn (Zhivotovsky et al., 2004). Otros marcadores muy empleados son los SNPs, que consisten en mutaciones puntuales a nivel de una base concreta y que tienen una tasa de mutaciôn de airededor de 10^ - 10^ por locus y generaciôn (Jobling et al., 2003). Se han identificado mas de 10 millones de SNPs en el genoma humano, representando la mayor fuente de variabilidad genética, con aplicaciones en diferentes ambitos, como el campo forense, la genética de poblaciones, el estudio y diagnôstico de enfermedades y sobre todo el estudio de asociaciones con enfermedades comunes y caractères complejos (Beckmann et al., 2007). Sin embargo, mas recientemente, se ha demostrado que existe otra fuente responsable por lo menos del 10 % de la variabilidad genômica (Redon et al., 2006; Wong et al., 2007); los CNVs (en inglés. Copy Number Variants), que incluyen modificaciones estructurales de grandes fragmentes del genoma (Beckmann et al., 2007). Se trata de variantes menos frecuentes que los SNPs, pero que implican cambios estructurales importantes, desde 1 Kb hasta varias Mb (Redon et al., 2006; Wong et al., 2007). Asi los CNVs se estan convirtiendo en una herramienta cada vez mas empleada en el estudio de caracteristicas fenotipicas, como los caractères complejos y las enfermedades genéticas (Beckmann et al., 2007). En general, los trabajos relativos al estudio de marcadores nucleares en el campo del aDNA se estan desarrollando cada vez mas gracias a las técnicas especialmente 17 Cristina Gamba enfocadas a la recuperaciôn de ADN degradado y a los avances en genética molecular. Ademas, se han puesto a punto nuevas técnicas de secuenciaciôn masiva, denominadas genéricamente Secuenciaciôn de Nueva Generaciôn {Next Generation Sequencing, NGS) que permiten analizar potencialmente el genoma completo de un organismo de una forma rapida (Knapp y Hofreiter, 2010). Dichas técnicas permiten obtener gran cantidad de informaciôn genética a partir de muy bajas concentraciones de ADN original. Sin embargo, el analisis de los resultados suele complicarse a la hora de separar el ADN endôgeno del contaminante, especialmente en el caso del ADN humano, y de identificar las lesiones post-mortem (Millar et al., 2008). Aunque sus aplicaciones en el campo del aDNA estan todavia en una fase inicial, ya se han publicado algunos trabajos de gran relevancia, como por ejemplo el estudio de gran parte del genoma del hombre de Neandertal (Green et al., 2010) y del mamut (Poinar et al., 2006). Mediante técnicas similares, también ha sido posible recuperar una proporciôn muy elevada del genoma procedente de un individuo siberiano de hace 4.000 anos (Rasmussen et al., 2010) y de un hombre arcaico de las mismas regiones, el hommido de Denisova (Krause et al., 2010). 1.2.2.1 M AR C AD O R ES AU TO S O M IC O S Los marcadores autosômicos se sitüan en las 22 parejas de cromosomas heredados de los progenitores. Debido al proceso de recombinaciôn al que estan sometidos entre generaciones, résulta muy complicado reconstruit el pasado de las poblaciones mediante una filogenia, como en el caso de los marcadores uniparentales (del mtDNA y el cromosoma Y). En general, los marcadores autosômicos mas empleados en el campo de! aDNA se pueden agrupar en dos categorias: aquellos relacionados con caractères fenotipicos (por ejemplo, con enfermedades) y los marcadores neutres, que se emplean con una finalidad identificativa. En el primer caso, uno de los marcadores mas estudiados en especimenes humanos antiguos es el gen de la lactasa, cuya difusiôn esta relacionada con una ventaja evolutiva en poblaciones productoras de productos lacteos (Burger et al., 2007; Malmstrôm et al., 2010; Lacan et al., 2011; Nagy et al., 2011). En el segundo 18 INTRODUCCION caso, estos marcadores hacen posible la identificaciôn de relaciones familiares cercanas, como la paternidad, la maternidad o la hermandad, proporcionando probabilidades elevadas. Se trata de los mismos sistemas empleados en el campo forense, que actualmente es posible analizar gracias a kits especialmente disenados para muestras muy degradadas (ver Apartado 1.4.2). 1.2.2.1.1 EL CROMOSOMA Y El cromosoma Y représenta tan solo el 2-3 % del genoma humano haploide y posee muy pocos genes codFicantes: los de la fertilidad masculina (DAZ y RBMY), el gen SRY (en inglés Sex-determinig Region o f Y) y otros situados en la PAR (region pseudoautosômica), la ünica que présenta un homôlogo en el cromosoma X. El cromosoma Y es en esencia un marcador de linaje, puesto que toda su porciôn no recombinante (NRY, en inglés Non Reconmbinig region o f the Y chromosome) se transmite de forma invariable a lo largo de la linea paterna, variando exclusivamente a través del acümulo progresivo de mutaciones. Como en el caso del mtDNA, también se habla de haplotipos del cromosoma Y, que en este caso se basan en la informaciôn proporcionada por una bateria de STRs. Asimismo, para el analisis filogenético de este marcador, es importante completar esta informaciôn con aquella proporcionada por sistemas con una tasa de mutaciôn menos elevada, los SNPs (Jobling y Tyler-Smith, 2003). 1.2.2.1.2 VARIABILIDAD GENETICA DEL CROMOSOMA Y Para el cromosoma Y, el esfuerzo conjunto de diferentes grupos de investigaciôn del consorcio YCC {Y Chromosome Consortium, 2002, http://ycc.biosci.arizona.edu) permitiô définir el arbol filogenético de este cromosoma, basado en marcadores bialélicos (SNPs). En concrete, se seleccionaron aquellos SNPs mas estables, denominados UEPs (en inglés. Unique Event Polymorphisms). Gracias al empleo de 19 http://ycc.biosci.arizona.edu Cristina Gamba estos sistemas fue posible définir los principales haplogrupos del cromosoma Y, representados en la Figura I 3 (Jobling y Tyler-Smith, 2003). La nomenclatura del Cromosoma Y incluye haplogrupos que van desde el A hasta el T. En este caso, a diferencia del mtDNA, el orden alfabético refleja la profundidad filogenética, siendo el haplogrupo A el antecesor comun de los demas haplogrupos. Sin embargo, los linajes mas antiguos (A y B) estan muy poco representados en poblaciones africanas actuales, donde el haplogrupo mas frecuente es el U, que se ha asociado tradicionalmente a la expansion Bantu durante la Edad del Hierro (Jobling y Tyler-Smith, 2003). En lo que concierne a Europa, los principales haplogrupos son el Rib, el Rla, el I, el N, el E lb lb l y el J. El primero de ellos (Rib) es el mas comun de todo el continente, especialmente en la parte occidental (Semino et al., 2000; Balaresque et al., 2010; Myres et al., 2011). Su frecuencia es mayor en las areas atlânticas y disminuye hacia Europa central y oriental, donde el Rla présenta frecuencias mayores (Semino et al., 2000; Passarino et al., 2001; Pericic et al., 2005). El haplogrupo N es comün solo en el noreste europeo mientras que ciertos sub-haplogrupos del E lb lb l caracterizan a regiones especificas, como la Peninsula Ibérica y Kosovo. El haplogrupo I présenta diferentes focos de frecuencias elevadas (Rootsi et al., 2004), mientras que el J présenta cierta clina sureste noroeste (Semino et al., 2004). 20 INTRODUCCION Figura I 3 Ârbol filogenético de los haplogrupos del cromosoma Y (imagen de Jobling y Tyler-Simth, 2003). K?1 M l » n P * P# K S m M l tTtm VTi vap M131 &B17 P44 SRV,om 10*2 ‘̂ 2U41i2 M » SRYm , P29 Fi M is MIS MM3 MHÎ7 21 Cristina Gamba En el campo de la genética de poblaciones actuales se han descrito las distribuciones y dataciones moleculares de los haplogrupos del cromosoma Y. Estos datos han contribuido al conocimiento del pasado de las poblaciones humanas desde el punto de vista de los linajes masculines. En lo que respecta a las aplicaciones de este marcador en el campo del aDNA, éstas estan limitadas por su escasa abundancia en la célula y por la falta de kits comerciales de amplificaciôn especialmente disenados para muestras muy degradadas. El cromosoma Y représenta un marcador de gran interés en este campo, puesto que permite sondear procesos migratorios desde la perspectiva de linajes paternos. Por otra parte, dado que el cromosoma Y incluye también marcadores con elevada tasa mutacional (los STRs), su estudio permite establecer relaciones de parentesco a lo largo de la linea paterna asociadas a probabilidades mucho mas elevadas que en el caso del mtDNA. 1.2.2.2 EL C R O M O SO M A X El cromosoma X présenta un mayor tamaho respecto al cromosoma Y y contiene unas 153 Mb, representando airededor del 5 % del genoma. Aunque se présente en doble copia en las mujeres, existe un mecanismo de compensaciôn por el que solamente uno de los dos cromosomas queda activado. Este cromosoma contiene airededor de unos 1.300 genes, una cantidad muchisimo mayor respecto al cromosoma Y, pero bastante reducida comparada con otros cromosomas nucleares. La principal diferencia entre los cromosomas sexuales es que el Y carece de recombinaciôn durante la meiosis, si se excluyen las pequehas zonas de recombinaciôn con el X (PAR) (Quintana-Murci y Fellous, 2001). En el caso de las mujeres, el cromosoma X recombina con su homôlogo, comportàndose como todas las demas parejas de cromosomas nucleares. Sin embargo, la diversidad genética del cromosoma X es menor respecto a los cromosomas autosômicos, dado que su poblaciôn efectiva (Ne) es très cuartas partes la de los autosomas, en cuanto se présenta en copia ünica en los individuos masculinos. 22 INTRODUCCION A pesar de la presencia de recombinacion, el cromosoma X contiene regiones caracterizadas por un elevado desequilibrio de ligamiento (LD, en inglés Linkage Disequilibrium) y a partir de cada una de ellas séria posible construir filogenias independientes (Gabriel et al., 2002; Schaffner, 2004). La presencia de recombinaciôn podria representar también una ventaja: el cromosoma X puede aportar informaciôn acerca de centenares o incluso millares de fragmentes independientes heredados en bloque, mientras que el mtDNA y el cromosoma Y solamente de uno (Schaffner, 2004). Esto représenta el principal potencial de este cromosoma en genética de poblaciones, con aplicaciones que van desde problemâticas globales, como el origen del hombre moderno, hasta la historia humana mas reciente y local, como el estudio del poblamiento de América. Sin embargo, su empleo en este tipo de estudios es muy reducido debido a las dificultades asociadas a la construcciôn de diferentes filogenias (Tomas et al., 2008; Pereira et al., 2011). Por ello, la mayoria de este tipo de investigaciones se basa en marcadores uniparentales, el mtDNA y el cromosoma Y, cuya filogenia ha sido ampliamente estudiada. El potencial del cromosoma X es elevado, también porque representaria la historia de la poblaciôn humana y no solamente de uno de los sexos. Gracias al desarrollo de las técnicas de secuenciaciôn masiva, el interés y el empleo de este marcador en genética de poblaciones podria ser favorecido (Schaffner, 2004). Actualmente esta también ampliamente empleado en genética forense, porque debido a su patrôn de herencia permite estudiar relaciones familiares en las que la genealogia no esté compléta. La principal dificultad asociada al analisis del cromosoma X en aDNA reside en su baja concentraciôn comparada con el mtDNA, como ocurre en el caso del cromosoma Y. Sin embargo, gracias al desarrollo de nuevas técnicas y protocolos, su estudio en poblaciones antiguas présenta un gran potencial. 23 Cristina Gamba 1.3 EL ADN A N T IG U O : HISTORIA Y PROBLEMATICAS ASOCIADAS A SU ANALISIS 1.3.1 H isto ria del A D N antiguo A mediados de los anos 80 se publicaron los primeros dos trabajos de ADN antiguo, que se basaban en técnicas de clonacion bacteriana para la amplificaciôn de pequehos fragmentes de mtDNA de tejidos momificados (Higuchi et al., 1984; Paabo, 1985). Sin embargo, las limitaciones de dichas técnicas, la elevada tasa de contaminaciôn por ADN exôgeno y la escasa cantidad y calidad de ADN endôgeno, no permitieron la replicaciôn de los experimentos, criterio que fundamenta y valida cualquier disciplina cientifica (Handt et al., 1994). En la segunda mitad de la misma década, se desarrollô la técnica de amplificaciôn in vitro mediante la reacciôn en cadena de la polimerasa o PCR, en inglés Polymerase Chain Reaction (Mullis y Faloona, 1987), que supuso un avance tecnolôgico fundamental en el campo de la biologia molecular. Ademas facilité enormemente el consiguiente desarrollo de estudios de aDNA, puesto que hacia posible la amplificaciôn y analisis de ADN a partir de cantidades muy pequehas de moléculas degradadas. Asi pues la amplificaciôn in vitro fue inmediatamente aplicada a muestras antiguas. Entre los primeros trabajos de aDNA amplificados por PCR, destaca el de Paabo y Wilson (Paabo y Wilson, 1988) en el que se hace hincapié en las ventajas de esta nueva técnica. Estos investigadores consiguieron replicar el experimento de Higuchi y colaboradores (Higuchi et al., 1984) detectando sustituciones que no se habian podido identificar mediante la clonaciôn bacteriana, debido a que habian sido corregidas por los mecanismos de reparaciôn de las bacterias. Estos primeros resultados fueron acogidos con entusiasmo por la comunidad cientifica y diferentes grupos de investigaciôn emprendieron nuevos estudios sobre muestras antiguas. En 1989 se demostrô la posibilidad de recuperar material genético a partir de 24 INTRODUCCION huesos y dientes de hasta 5.000 anos de antigüedad (Hagelberg et al., 1989). Dichos materiales representan el tipo de muestra mas abundante en el registre arqueolôgico, dado que se trata del material que mejor se conserva en los vertebrados, ampliando asi las posibilidades de aplicaciones de la genética al mundo de la arqueologia y a la genética forense. Sin embargo, la gran sensibilidad de la PCR conIleva un elevado riesgo de contaminaciôn con ADN exôgeno de los propios manipuladores o procedente de moléculas previamente amplificadas en el laboratorio. Por ello, muchos de los primeros trabajos publicados fueron posteriormente desacreditados, demostrandose que no era posible su replicaciôn y que se trataba de contaminaciones con ADN actual de diferente origen. Estos casos afectaron a publicaciones de secuencias de millones de anos de antigüedad que habian suscitado mucho entusiasmo y polémica. Golenberg y colaboradores (Golenberg et al., 1990) amplificaron ADN procedente de una hoja de magnolia de 17-20 millones de anos, cuyo analisis filogenético relacionaba las secuencias antiguas con las especies de Magnolia actuales, apoyando la autenticidad de los resultados. Sin embargo, este estudio fue llevado a cabo sin ningün control de posibles contaminaciones. Ademas no fue posible replicar los resultados de forma independiente y, por estas razones, fue ampliamente criticado (Paabo y Wilson, 1991; Lindahl, 1993). Una gran variedad de restos incluidos en ambar fueron analizados porque se creia que esta résina permitia una desecaciôn répida del organismo e inhibia toda actividad bacteriana, favoreciendo la preservaciôn del ADN (Cano et al., 1993; Poinar, 1994). Asi pues se obtuvieron secuencias de ADN a partir de restos de abejas, termitas y plantas (DeSalle et al., 1992; Cano et al., 1993; Poinar et al., 1993). Incluso se creyô haber identificado y analizado bacterias fôsiles (Cano et al., 1994), aunque en realidad se trataba de contaminaciones (Yousten y Rippere, 1997). Ulteriores estudios demostraron que la conservaciôn del ADN durante millones de anos es altamente improbable (Stankiewicz et al., 1998). El trabajo con mas impacto mediatico probablemente fue la recuperaciôn de mtDNA a partir de fôsiles de dinosaurios de hace 80 millones de anos (Woodward et al., 1994). 25 Cristina Gamba Se confié en la autenticidad de las secuencias puesto que nunca se habian descrito antes ni en mamiferos ni en reptiles. Posteriormente se demostrô que se trataba de una contaminaciôn por ADN humano actual, procedente de una porciôn de! ADN mitocondrial integrada en el genoma nuclear y que presentan ciertos individuos (NUMTs, en inglés nuclear mitocondrial DNA) (Zischler et al., 1995). Desde 1995 no se han vuelto a publicar resultados de muestras con millones de anos de antigüedad, dado que se ha demostrado que el limite maximo para la preservaciôn y amplificaciôn del aDNA ronda los 100.000 anos (Lindahl, 1993, 1997). El equipo de Svante Paabo puso de manifiesto los inconvenientes asociados a los estudios de aDNA publicados, destacando las limitaciones de las técnicas empleadas y de las instalaciones, asi como la falta de control de las contaminaciones (Paabo, 1989; Paabo et al., 1989). Hay que tener en cuenta que una molécula de ADN fresco procedente de una fuente contaminante tiene mas probabilidades de ser amplificada que las moléculas antiguas endôgenas, que estan degradadas y dahadas. Ademas existe la posibilidad de obtener secuencias mixtas o quimeras de aDNA, resultado de la co-amplificaciôn de moléculas endôgenas y contaminantes, mediante lo que se conoce como Jumping PCR (ver Apartado 1.33.2) (Paabo et al., 1989). Existe el riesgo de no détecta r este fenômeno, puesto que estas quimeras podrian tener cierto sentido filogenético. Por otra parte, el ADN dahado puede provocar la inserciôn de adeninas durante la PCR asi como errores de incorporaciôn en motivos repetitivos (DeSalle et al., 1993). Hay que tener en cuenta que las fuentes de contaminaciôn no incluyen solamente la fase de analisis en el laboratorio (personal del laboratorio, reactivos, moléculas amplificadas flotantes), sino también a todas aquellas personas y sustancias que hayan entrado en contacte con las muestras desde la excavaciôn hasta su llegada al laboratorio (Handt et al., 1994). La dificultad en el control de posibles contaminaciones en el analisis de restos antiguos es aün mayor en el caso de especimenes humanos, asi que la primera prueba que testifica la autenticidad de un resultado es la replicaciôn del mismo de forma independiente. 26 INTRODUCCION Entre finales de los 90 y principios del 2000 se comenzô a hacer hincapié en la importancia de ciertos criterios en la validaciôn de los resultados obtenidos a partir de muestras antiguas, los cuales fueron asimilados por las revistas de impacto como requisitos para la publicacion de estudios de aDNA. Uno de los trabajos mas importantes en el establecimiento y empleo de estos criterios es el de Krings y colaboradores (Krings et al., 1997), en el que se demostrô la autenticidad de los resultados obtenidos a partir del primer espécimen de Neandertal analizado. Mas recientemente se han publicado diferentes revisiones exhaustivas de todos los criterios necesarios para la validaciôn de resultados (Poinar et al., 1993; Cooper y Poinar, 2000; Paabo et al., 2004) (ver Apartado I.3.3.3). A pesar de sus comienzos controvertidos, el ADN antiguo se puede considerar una disciplina cientifica establecida; se han mejorado muchisimo los estandares, asi como el conocimiento de la naturaleza bioquimica de los procesos diagenéticos y del daho molecular del ADN (Willersiev y Cooper, 2005). Se han publicado ademas estudios rigurosos que contribuyen al conocimiento de procesos evolutivos, proporcionando informaciôn de primera mano para testa r modelos e hipôtesis en genética de poblaciones, paleoecologia y evoluciôn (Willersiev y Cooper, 2005). 1.3.2 Factores de degradaciôn del A D N antiguo La recuperaciôn de ADN a partir de muestras antiguas esta sujeta principalmente a la preservaciôn de la muestra. Existen diferentes mecanismos que afectan al material genético de las muestras biolôgicas antiguas debido a los propios fenômenos de muerte celular y a las condiciones medioambientales y fisico-quimicas del entorno de deposiciôn a las que ha estado sometida. En las células, los mecanismos enzimaticos de reparaciôn dejan de funcionar poco tiempo después de la muerte del organismo. Para los humanos la autolisis celular empieza a los 4 ô 5 minutos de la muerte (Vass, 2001), cuando la concentraciôn de oxigeno en la sangre disminuye a la vez que aumenta la de diôxido de carbono, baja el pH y se acumulan los productos de 27 Cristina Gamba degradaciôn celular. Al mismo tiempo, las enzimas liticas celulares comienzan a degradar la célula desde su interior provocando la rotura de la membrana celular y nuclear, liberando enzimas intracelulares como las nucleasas, que degradan especificamente el material genético. Tras el proceso de autolisis se inicia la colonizaciôn del tejido muerto por microorganismos, hongos e insectos, que completan el proceso degradativo (Gilbert, 2006). Todas estas modificaciones celulares conllevan la degradaciôn del material genético, cuyas modificaciones se denominan diagenéticas o post-mortem. El proceso de degradaciôn puede ser muy rapido con una disminuciôn importante de ADN amplificable en tan solo pocas semanas o meses. Existen diferentes mecanismos que ralentizan la degradaciôn, favoreciendo la preservaciôn de los tejidos y del ADN, como una rapida desecaciôn (momificaciôn natural), una elevada concentraciôn de sales o bajas temperaturas (Hofreiter et al., 2001 b). Estos factores inhiben o ralentizan la actividad enzimatica de las endonucleasas. Existen muchos mecanismos que actüan sobre la molécula de ADN provocando fragmentaciôn y modificaciones estructurales y quimicas que pueden incluso impedir su analisis. A continuaciôn se describen los principales procesos diagenéticos responsables de la degradaciôn del ADN. 1,3,2.1 D EG R AD AC IO N EN Z IM A TIC A E H ID R O LIS IS Los mecanismos hidroliticos y de degradaciôn enzimatica son los principales responsables de la fragmentaciôn de las hebras de ADN, reduciendo su longitud a unas 100-200 pb (Paabo et al., 2004). En primer lugar, la rotura de ciertos organulos celulares, como los lisosomas, libera enzimas autoli'ticas como las endo y las exonucleasas (Paabo, 1989). Las primeras cortan las cadenas de ADN en diverses puntos y las segundas eliminan los nucleôtidos a partir de los extremes de la cadena. A continuaciôn, el daho hidrolitico actua sobre los enlaces fosfodiéster y N-glicosidicos provocando respectivamente la rotura de la hebra o la eliminaciôn de una base nitrogenada (Lindahl, 1993) (ver Figura I 4). En el segundo caso se habla de 28 INTRODUCClÔN depurinizaciôn o depirimidinaciôn, en funcion de si la base eliminada es una purina (adenina o guanina) o una pirimidina (citosina o timina). La hidrôlisis afecta principalmente a los enlaces N-glicosidicos de las purinas, siendo la tasa de depurinizaciôn 20 veces mayor que la de depirimidinaciôn (Lindahl, 1993). Después de la eliminaciôn de una base se suceden mecanismos de reorganizaciôn estructural que llevan a la rotura de la cadena de ADN o incluso a la pérdida de bases adyacentes. Figura 14 Principales modificaciones post-mortem de! ADN. Las fléchas rojas indican los principales sitios de depurinaciôn, las azules los de dano oxidativo y las verdes los de hidrôlisis (imagen modificada a partir de Hofreiter et al. 2001). 0 NH NH 0 = P - 0 CH HN 0 -P - 0 — 1 Depurinaciôn Daho Hidrolitico Daho Oxidativo 29 Cristina Gamba Otro punto susceptible a! ataque hidrolitico es el enlace glicosidico del grupo amino de la base nitrogenada. Este proceso se denomina desaminacion hidrolitica y afecta principalmente al grupo amino de las pirimidinas, siendo menos frecuente en las purinas. Se trata de un proceso que no afecta directamente a la estructura y longitud de la hebra del ADN, como ocurre en el caso de la depurinizacion, puesto que la estructura de la doble hélice consigue protéger de la desaminacion las bases en su interior (Lindahl, 1993). Se ha estimado que la frecuencia de esta reacciôn en las cadenas sencillas es hasta cien veces mas probable que en la doble hélice (Kricker y Drake, 1990). La desaminacion de las bases nitrogenadas provoca la transformaciôn de unos nucleôtidos en otros. Por ejemplo, la adenina se transforma en hipoxantina, un analogo de la guanina (Lesion de tipo 1); y la citosina en uracilo, un analogo de la timina (Lesion de tipo2) (ver Figura I 5). Estas modificaciones se denominan Miscoding Lesions dado que durante la amplificaciôn del ADN por PCR inducen a la incorporaciôn de nucleôtidos incorrectos en la cadena complementaria (Hofreiter et al., 2001 b; Gilbert et al., 2003 b). A la hora de analizar el dano molecular de una secuencia amplificada, es posible detectar cuatro cambios distintos de bases: G>T, T->C, A->G y G->A. Se trata de transiciones entre purinas o pirimidinas causadas por los dos mecanismos de desaminacion descritos, y que producen uno u otro cambio dependiendo de la cadena del ADN (directa o reversa) en la que se originen (ver Figura 15). Sin embargo, recientemente se ha demostrado mediante diferentes métodos que las Lesiones de tipo 2 son las principales, si no las ünicas, responsables del daho molecular detectado en secuencias de ADN antiguo (Brotherton et al., 2007; Gilbert et al., 2007). En la Figura I 6 se detallan los efectos de las Miscoding Lesions en la cadena di recta o forward, utilizada como referencia para la lectura de secuencias de ADN. 30 INTRODUCOON Figura I 5 Mecanismos de actuaciôn de la desaminacion hidrolitica. Se detallan las lesiones de tipo 1 y de tipo 2. O Q . CM O Q . Citosina Adenina o NH Uracilo NH Hipoxantina Figura I 6 Mutaciones asociadas a la desaminacion hidrolitica de tipo 1 y 2. Se ilustran los distintos resultados dependiendo de si la Miscoding Lesion tiene lugar en la cadena ligera (Q ) o en la pesada (Ch). Cl- Cl - Q- Cl- Desaminacion Replicaciôn Replicaciôn - T - - d > - A - - G - - c - H- T T H U -G G U H C C H U -A A U - c - - G - - A - - T - Mutaciôn en A ^ G T ^ C C - > T G-> A Como ya se ha comentado anteriormente, existen unas posiciones del mtDNA que presentan una tasa de mutaciôn mas elevada y que se denominan puntos calientes mutacionales o molecular hot spots. Diferentes autores han estudiado este fenômeno 31 Cristina Gamba para comprobar la presencia de un comportamiento similar en el caso del dano molecular. Estos trabajos se fundamentan en la hipôtesis de que determinadas posiciones del mtDNA que se encuentran menos protegidas in vivo también lo estàn durante el proceso diagenético (Heyer et al., 2001). Uno de los primeros estudios acerca de este tema afirma que la distribuciôn del dano molecular en el mtDNA de osos de las cavernas no sigue una pauta especifica sino que se distribuye al azar (Hofreiter et al., 2001 a). Poco después fue posible identificar estas posiciones en la HVR-I del mtDNA humano (Gilbert et al., 2003 b) y posteriormente también en bisontes (Gilbert et al., 2005). El conocimiento de las posiciones mas sujetas al dano molecular puede ayudar en la interpretaciôn de los resultados y a distinguir entre mutaciones endôgenas y dano molecular (Gilbert et al., 2003 a). 1.3.2.2 OXIDACION El ADN puede daharse también mediante reacciones oxidativas, por la acciôn de radicales libres que se originan tras la exposiciôn a radiaciones ionizantes, luz ultravioleta y procesos de degradaciôn por parte de bacterias y hongos (Poinar, 2002). Los radicales libres inducen danos estructurales importantes a nivel de los dobles enlaces de las bases nitrogenadas y pueden provocar incluso su rotura (ver Figura I 4). También las moléculas de hidrogeno de la desoxirribosa representan una diana del dano oxidativo, con la consecuente rotura del anillo. Otra de las modificaciones provocadas por los radicales libres es la transformaciôn de las bases nitrogenadas, sobre todo de las pirimidinas, en hidantomas (Hôss et al., 1996). Las principales formas de hidantomas asociadas al dano oxidativo son la 5-OH-S-MeHyd, un derivado de la timina, y la S-OH-Hyd, un derivado de la citosina (Hôss et al., 1996). El resultado de las modificaciones generadas por oxidaciôn no es la fragmentaciôn de la cadena de ADN sino el bloqueo de la polimerasa durante la PCR, actuando por lo tanto como modificaciones inhibidoras. 32 INTRODUCOON 1.3.2.3 PUENTES CRUZADOS O “CROSSLINKS” Ademas de las modificaciones que implican la rotura de enlaces, existen otras que provocan la formacion de nuevos enlaces, denominados puentes cruzados o crosslinks. Se han identificado enlaces intramoleculares, entre diferentes cadenas de ADN, e intermoleculares, entre ADN y otras biomoléculas como las protemas. Estas ultimas consisten principalmente en reacciones de condensaciôn entre la desoxirribosa de las bases nitrogenadas y los grupos amino de las protemas. Los derivados de esta ultima reacciôn se identificaron por cromatografia de gases combinada con espectrometria de masas en coprolitos (Poinar et al., 1998) y se conocen como productos de Maillard (Lindahl, 1993). Los puentes cruzados también impiden la amplificaciôn del ADN por PCR, bloqueando la polimerasa. Sin embargo, se identified un compuesto capaz de romper estos enlaces, el bromuro de N-fenilacil-tiazolio o PTB (Vasan et al., 1996), incrementando la probabilidad de obtenciôn de productos de amplificaciôn. El empleo del PTB permitiô la recuperaciôn de ADN a partir de coprolitos de unos 20.000 anos (Vasan et al., 1996) asi como de huesos de Neandertal de mas de 40.000 (Krings et al., 2000). 1.3.3 Problemâticas de los estudios de AD N antiguo 1.3.3.1 JUMPING PCR Como ya se ha mencionado, una consecuencia del daho molecular es la presencia de lesiones que impiden el funcionamiento de la polimerasa, enzima responsable de la PCR. En esos puntos la amplificaciôn se interrompe, pero podria continuer empleandose como molde otra cadena de ADN diferente. Este mecanismo se denomina Jumping PCR, puesto que la polimerasa salta de una cadena molde a otra pudiendo producir secuencias quiméricas, entre diferentes combinaciones de cadenas endôgenas, contaminantes y dahadas. El Jumping PCR es un fenômeno récurrente en el campo del ADN antiguo. Su identificaciôn se basa en el analisis detallado de los 33 Cristina Gamba resultados de clonaciôn bacteriana, asi como en la amplificaciôn repetida de diferentes extractos y en la cuantificaciôn de ADN. 1.3 3.2 INHIBIDORES DE LA REACCIÔN DE PCR Existen diferentes mecanismos y varios factores que pueden disminuir o impedir la amplificaciôn de ADN por PCR. Las moléculas responsables de este fenômeno se denominan inhibidores y suelen actuar bloqueando la actividad enzimatica de la poimerasa durante la PCR (Wilson, 1997). Clâsicamente se han identificado dos categorias de inhibidores, aquellos procedentes de entorno de deposiciôn y los résultantes de la propia degradaciôn del organismo. En:re los primeros estan los acidos hùmicos y fulvicos del suelo, que pueden llegar a ser co-purificados junto con el ADN (Paabo, 1989) y se ha demostrado que tienen un gran poder inhibidor (Tuross, 1994). Entre los segundos se encuentran los residuos de poiirinas. Las porfirinas se pueden encontrar en te] id os animales blandos y restos végéta les, y constituyen una familia de moléculas que derivan de la porfirina, un compuesto tetrapirrôlico. Las porfirinas actüan como inhibidores de la PCR puesto que pueden forma r complejos mediante la uniôn a diverses iones, entre los cuales se encuentra el magnesio, necesario para el funcionamiento de la ADN polimerasa (Higuchi et al., 1984). Como ya se ha mencionado anteriormente (Apartados i.3.2.2 e 1.3 2.3), otros productos de degradaciôn del ADN, como las hidantomas y los productos delà reacciôn de Maillard, pueden comportarse también como inhibidores de la PCR. 1.3.3.3 CONTAMINACION Y CRITERIOS DE AUTENTICIDAD Las muestras antiguas contienen ADN fragmentado, dahado y en escasas cantidades, lo que hace que se trate de un material genético de dificil recuperaciôn y muy susceptible a la contaminaciôn por ADN exôgeno. Por otra parte, la técnica empleada para la recuperaciôn de informaciôn genética a partir de restos antiguos, la PCR, résulta altamente sensible a cantidades mmimas de ADN. En el caso de una elevada 34 INTRODUCOON degradaciôn, escasez y fragmentaciôn del ADN endôgeno a la muestra, el ADN contaminante séria amplificado preferentemente, dado que este es un ADN fresco, sin fragmentaciôn ni daho molecular. Las principales fuentes de contaminaciôn proceden del personal que ha entrado en contacte directe con la muestra: arqueôlogos, antropôlogos, personal encargado de su conservaciôn en un museo y personal del laboratorio. Por estas razones, son necesarias diversas medidas de prevenciôn de la contaminaciôn desde la exhumaciôn del reste y durante el analisis en el laboratorio. Teniendo en cuenta que en los inicios de esta disciplina la errônea interpretaciôn de los dates llevô a la publicaciôn de resultados no reproducibles o contaminados, la comunidad cientifica comenzô a establecer unas medidas necesarias para la validaciôn de resultados procedentes de muestras antiguas. Dichas medidas se han ido concretando poco a poco (Paabo, 1989; Handt et al., 1994; Lindahl, 1997; Cooper y Poinar, 2000) y hoy en dia representan unas pautas imprescindibles para la validaciôn y publicaciôn de resultados genéticos antiguos. Estas pautas, denominadas criterios de autenticidad (Poinar, 2003; Paabo et al., 2004), se listan a continuaciôn e incluyen las precauciones a tomar en cuanto a infraestructura, metodologia, interpretaciôn y reproducibilidad de resultados y estimaciones del estado de preservaciôn biomolecular de la muestra. 1. Laboratorio exclusivo de ADN antiguo Es muy importante que el analisis genético de restos antiguos se lleve a cabo en laboratories especializados en la manipulaciôn de muestras degradadas, puesto que la presencia de moléculas de ADN fresco en el ambiente podria llevar a una contaminaciôn severa. Es necesario tener en cuenta que en el caso de que se trabaje con ADN antiguo de origen humano, existen multiples fuentes de contaminaciôn relacionadas con el entorno de analisis, no sôlo por parte de los propios investigadores, sino de cualquier persona que haya podido entrar en contacto con las instalaciones y el material empleado en el laboratorio. Independientemente de la especie objeto de estudio, es imprescindible évita r el analisis de muestras recientes del mismo origen, puesto que la amplificaciôn de moléculas perfectamente preservadas 35 Cristina Gamba aumentaria enormemente las probabilidades de contaminaciôn de muestras antiguas. La contaminaciôn ambiental incluye no sôlo las moléculas flotantes en el laboratorio, sino también todo el material que se emplee, incluidos los aparatos y los reactivos. 2. Separaciôn de las areas de trabajo Ademas del estudio de restos antiguos en laboratories especializados y libres de contaminaciôn adicional, es necesaria una separaciôn entre las diferentes areas de trabajo. Es muy importante separar las fases que preceden la amplificaciôn del ADN de las que la siguen, puesto que en el segundo caso se trabaja con concentraciones de ADN mucho mas elevadas, que podrian representar a su vez una fuente de contaminaciôn. Por ello, estas dos fases se llevan a cabo en diferentes laboratories, a ser posible localizados en edificios distintos o a cierta distancia. La fase mas critica es la primera, que va desde la recepciôn de la muestra hasta la extracciôn y amplificaciôn de ADN. Es recomendable llevar a cabo estos primeros pasos en diferentes salas de un laboratorio, con control de contaminaciôn y acceso restringido. En cambio, a partir de la amplificaciôn del ADN es posible desarrollar los siguientes analisis en un laboratorio comùn, sin un control tan estricto de contaminaciones, puesto que ya se estaria trabajando con elevadas concentraciones de ADN no degradado. 3. Acceso restringido Solo el personal especializado puede tener acceso a los laboratorios dedicados a la manipulaciôn y analisis de muestras antiguas, sobre todo durante las fases de preparaciôn de la muestra, extracciôn y amplificaciôn. Ademas, es recomendable que la manipulaciôn de la misma sea Nevada a cabo durante todo el proceso por parte de un ünico investigador. Ambas medidas se cihen al principio de reducciôn de posibles contaminaciones exôgenas. 36 INTRODUCOON 4. Material exclusivo Todo el material y los reactivos necesarios para el estudio de muestras antiguas tienen que ser dedicados exclusivamente al analisis de muestras degradadas. En caso contrario, cualquier material o reactivo que haya entrado en contacto con ADN fresco, mejor preservado que el antiguo, representaria una fuente de contaminaciôn severa para las muestras degradadas. 5. Empleo de contrôles o blancos Durante las fases de extracciôn y amplificaciôn de aDNA es muy importante el empleo de blancos o contrôles negativos. Se trata de mezclas de reacciôn que incluyen todos los reactivos necesarios para los experimentos en curso, y a los que no se ahade ninguna fuente de ADN. Estos blancos se analizan en paralelo a las mezclas de reacciôn que contienen ADN y, para garantizar la autenticidad de los resultados, es necesario que no produzcan resultados positivos. En caso contrario, séria posible detectar contaminaciones puntuales o generalizadas en una determinada tanda de extracciôn o amplificaciôn. Se puede tratar de contaminaciones procedentes de un reactivo, del investigador o de otras muestras analizadas en paralelo, asi como de contaminaciones ambientales. 6. Descontaminaciôn de la muestra La manipulaciôn de las muestras desde su llegada al laboratorio comienza con una limpieza superficial para conseguir la eliminaciôn de posibles moléculas contaminantes en su exterior. Existen diferentes técnicas empleadas en esta fase que van desde un raspado manual hasta el empleo de lejia (Kemp y Smith, 2005). No obstante, existe otro procedimiento de naturaleza fisica que consiste en la eliminaciôn de airededor de medio m ilimetro de la capa superficial de la muestra mediante su abrasiôn con ôxido de aluminio a presiôn dentro de una camara dotada de presiôn positiva (Hummel, 2003). A continuaciôn las muestras se someten a radiaciones ultravioletas, que crean dimeros de tim ina en el ADN localizado en su superficie. Estos compuestos impiden la 37 Cristina Gamba amplificaciôn del ADN, de manera que los contaminantes rémanentes o los que se hayan podido introducir durante la limpieza de la muestra quedan neutralizados. 7. Empleo de diferentes parejas de cebadores El empleo de diferentes parejas de cebadores o primers para la amplificaciôn de un mismo fragmento permite detectar y évita r la amplificaciôn de pseudogenes insertados en el ADN nuclear (NUMTs) (Cooper y Poinar, 2000), asi como posibles haplotipos quiméricos o contaminaciones. 8. Correlaciôn inversa entre la longitud de los fragmentos amplificados y la eficiencia de amplificaciôn Résulta interesante monitorizar la longitud de los fragmentos amplificados en muestras antiguas, ya que normalmente no es posible recuperar secuencias con longitud superior a las 100-200 pb, debido a la fragmentaciôn del ADN (Paabo et al., 2004) y/o a la presencia de moléculas o lesiones inhibidoras (ver Apartados I.3.2.2 e I.3.2.3). Por ello, es posible observer una correlaciôn inversa entre la longitud del fragmento amplificado y la cantidad de producto obtenido tras la PCR (Paabo et al., 2004). La amplificaciôn de fragmentos de diferente longitud en una misma reacciôn también permite rastrear posibles contaminaciones, puesto que solo se puede obtener amplificaciones de fragmentos largos en el caso de ADN bien preservado. 9. Comparaciôn de perfiles genéticos con manipuladores y blancos Para la correcta interpretaciôn de los resultados y la exclusiôn de posibles contaminaciones por parte de los manipuladores es necesario comparar los perfiles genéticos obtenidos con los de aquellas personas que hayan podido entrar en contacto con las muestras o con las instalaciones. La secuenciaciôn de los blancos de extracciôn y de PCR que proporcionen resultados positivos y la comparaciôn de las secuencias obtenidas en las diferentes tandas de 38 INTRODUCOON extracciôn y/o amplificaciôn permiten identificar moléculas contaminantes procedentes de otras muestras analizadas en paralelo, de los reactivos o del ambiente de trabajo. Este tipo de contaminaciôn se conoce como carry-over. 10. Sentido filogenético Teniendo en cuenta que el ADN antiguo es un material degradado y fragmentado, es conveniente amplificar diferentes fragmentos solapantes, asi como otras regiones informativas. El conjunto de resultados obtenidos tiene que presentar un sentido filogenético de acuerdo con la filogenia establecida para el correspondiente marcador en la poblaciôn actual. Este criterio évita la consideraciôn de secuencias quiméricas y permite la exclusiôn de los NUMTs. 11. Multiples extracciones y amplificaciones Este criterio esta directamente relacionado con el principio de reproducibilidad de los experimentos cientificos. Se deben realizar diferentes extracciones a partir de muestras diferentes de un mismo individuo y también multiples amplificaciones a partir de un mismo extracto. Se trata de una medida indispensable para la identificaciôn de contaminaciones introducidas durante el proceso experimental y de las miscoding lesions (ver Apartado I.3.2.1). 12. Analisis en un laboratorio independiente Un ulterior criterio para la validaciôn de los resultados consiste en la repeticiôn de todos los analisis en un laboratorio independiente, desde la preparaciôn de la muestra hasta su amplificaciôn. Este criterio se basa también en el principio de reproducibilidad y se emplea para excluir contaminaciones masivas de un laboratorio especifico. La condiciôn ideal es que la muestra se envie directamente desde la excavaciôn o el museo a los dos laboratorios correspondientes. 39 Cristina Gamba 13. Ensayos bioqufmicos Diversos trabajos realizados a inicios de los ahos noventa, pusieron de manifiesto que era posible inferir el grado de preservaciôn del ADN a partir de la estimaciôn realizada para otras moléculas, como el grado de racemizaciôn de ciertos aminoacidos (Poinar et al., 1996). Se consideraba que la tasa de racemizaciôn del acido aspârtico era equiparable a la tasa de depurinizaciôn de las moléculas de ADN. La ventaja de esta técnica sobre el analisis directo de los especimenes residia en que requiere una cantidad minima de muestra, lo que justificaba no tener que destruir innecesariamente las muestras objeto de estudio si el valor de racemizaciôn obtenido no era compatible con la preservaciôn del material genético. Sin embargo, recientemente se ha demostrado que no es posible extrapolar los datos de racemizaciôn para la estimaciôn de la preservaciôn del ADN, puesto que actüan diferentes mecanismos de degradaciôn a nivel de los dos tipos de biomoléculas (Collins et al., 2009; Fernandez et al., 2009). 14. Cuantificaciôn La cuantificaciôn de las moléculas présentes en un extra cto de ADN proporciona una medida de fiabilidad de los resultados obtenidos. Ademas permite estimar el numéro de amplificaciones o extracciones independientes a realizar: cuanto menos concentrado esté el ADN, mas replicaciones seran necesarias para determinar su autenticidad. En el caso de que un extracto de ADN contenga un numéro de moléculas superior a 1.000, se considéra que la identificaciôn de la secuencia consenso podria realizarse a partir de dos amplificaciones independientes por extracto. En el caso de concentraciones inferiores, se recomienda replicar los resultados mas veces (Paabo et al., 2004). 40 INTRODUCOON 15. Clonaciôn bacteriana La clonaciôn bacteriana de los productos de amplificaciôn se emplea para discernir entre las diferentes moléculas de ADN molde amplificadas en una PCR. Se basa en la inserciôn del ADN amplificado en un vector de clonaciôn o plasmido, con el que se transforman células de la bacteria E. coll. El mecanismo de clonaciôn hace que cada vector incorpore un ünico inserto y que cada célula bacteriana incorpore un ünico vector. Una vez dentro de la bacteria, ésta se multiplica reproduciendo el ADN incorporado como si fuera propio. De esta forma, cada colonia bacteriana, descendiente de la original, contendra copias idénticas de cada molécula de ADN présente en la PCR. Alineando las secuencias obtenidas a través de la clonaciôn de varios productos de amplificaciôn procedentes de diferentes extracciones y amplificaciones de un mismo individuo, es posible identificar la secuencia endôgena a la muestra, asi como moléculas contaminantes y nucleôtidos que han sufrido dano molecular o Jumping PCR. 1.3.3.4 INFLUENCIA DE LOS FACTORES AMBIENTALES Y DEL ENTORNO DE DEPOSICIÔN SOBRE LA PRESERVACIÔN DEL ADN ANTIGUO Todas las reacciones de degradaciôn y dano molecular descritas pueden ser mas o menos rapidas en funciôn de los factores ambientales a los que esté sujeta la muestra. El estado de preservaciôn del ADN depende principalmente de las condiciones del entorno de deposiciôn mas que de su antigüedad (Nielsen-Marsh y Hedges, 2000; de Torres et al., 2002). El factor que se considéra mas déterminante en la preservaciôn del material genético es la temperatura y la historia térmica del ambiente de deposiciôn (Smith et al., 2003). Los ambientes frios con pocas fluctuaciones térmicas son los ôptimos (Lindahl, 1993; Burger et al., 1999; Smith et al., 2001, 2003), puesto que frenan la degradaciôn de las muestras (Hôss et al., 1996). También la ausencia de agua y la baja humedad favorecen la preservaciôn de ADN, dado que impiden el crecimiento de microorganismos y la degradaciôn hidrolitica del material genético (Burger et al., 1999). 41 Cristina Gamba Asimismo, la radiaciôn solar, y mas especialmente su componente ultravioleta, y las radiaciones ionizantes perjudican la preservaciôn del material genético no solo porque pueden provocar el aumento de la temperatura, sino también porque fomentan la formaciôn de radicales libres que perjudican la integridad del ADN mediante procesos oxidativos (ver Apartado i.3.2.2) (Gilbert, 2006). Por otro lado, los ambientes acidos disuelven el fosfato de calcio degradando la hidroxiapatita de los restos ôseos, mientras que condiciones alcalinas tamponan los efectos de los acidos y favorecen la preservaciôn de la estructura ôsea. Los ambientes alcalinos favorecen la formaciôn de bicarbonate, el cual aumenta la degradaciôn de la hidroxiapatita (Bollongino et al., 2008). Como consecuencia, la preservaciôn del material genético es mejor en entornos anôxicos, secos, oscuros, ligeramente alcalinos y caracterizados por bajas temperaturas. 1.3.3.5 LIMITE DE PRESERVACION DEL ADN ANTIGUO Existe un limite maximo de preservaciôn del ADN determinado experimentalmente (Paabo y Wilson, 1991; Lindahl, 1993) y que ronda los 100.000 anos en condiciones fisiolôgicas de pH y concentraciôn de sales. Este limite actualmente esta confirmado por la casi totalidad de los estudios de aDNA, siendo la ünica excepciôn que supera este limite un estudio de restos végéta les datados en 300.000 - 400.000 AP (Antes del Présente) (Willersiev et al., 2003). En lo que concierne al género homo, el ünico espécimen que alcanza el limite de los 100.000 ahos de antigüedad es un hombre de Neandertal procedente de la cueva de Scladina (Meuse Basin, Bélgica) del que se pudo recuperar un corto fragmento de mtDNA (Orlando et al., 2006). Este limite puede ser mas amplio en el caso de restes preservados en hielo o permafrost, condiciones ôptimas para la preservaciôn. En estes ambientes la preservaciôn del material genético es excepcional, como demuestra la recuperaciôn reciente del genoma casi completo de un individuo de 4.000 ahos a part r de un resto de cabello (Rasmussen et al., 2010). Asimismo, un ambiente desfavorable puede limitar enormemente la posibilidad de recuperaciôn de ADN endôgeno. En el 42 INTRODUCOON caso de papiros y restos humanos procedentes de zonas calidas como Egipto, Ma rota y colaboradores (Marota et al., 2002) fijaron el limite maximo para la preservaciôn del ADN por debajo de los 1.000 ahos. Sin embargo, recientemente se ha publicado un estudio ampliamente validado en el que se obtuvo informaciôn genética de STRs nucleares de momias egipcias con una antigüedad de unos 3.500 ahos, de la familia del faraôn Tutankamon (Hawass et al., 2010). A pesar de las mejoras tecnolôgicas introducidas en el campo del ADN antiguo durante los ùltimos 20 ahos, la probabilidad de recuperaciôn de ADN endôgeno sigue estando sujeta a las condiciones de preservaciôn de los restos, siendo favorecida por ciimas frios y secos frente a calidos y hûmedos. 43 Cristina Gamba 1.4 APLICACIONES DEL A D N A N T IG U O 1.4.1 Estudios diacronicos en Europa y la Peninsula Ibérica, desde el N eo litico hasta la Edad del H ierro El ADN antiguo représenta una poderosa herramienta con la que sondear el pasado de las poblaciones y verificar hipôtesis planteadas desde otras disciplinas como la arqueologia, la antropologia o la propia genética de poblaciones. Gracias al analisis directo de las poblaciones humanas antiguas es posible estudiar procesos a gran escala, como migraciones, expansiones poblacionales y cuellos de botella, asi como continuidad o discontinuidad genética entre diferentes pobladores de una regiôn, como en el caso de estudios diacrônicos. Para ello, es necesario integrar los resultados obtenidos con la informaciôn arqueolôgica, antropolôgica o genética disponible. Entre las aplicaciones de esta disciplina destacan sus aportaciones a nivel del estudio del poblamiento de Europa, una de las cuestiones arqueolôgicas mas debatidas durante las ultimas décadas. A este propôsito, se pretende estimar la contribuciôn relativa de los diversos procesos migratorios acontecidos durante la prehistoria. A continuaciôn, se detalla el marco histôrico de los periodos estudiados en la présente tesis doctoral mediante el analisis poblacional de restos antiguos que van desde el Neolitico hasta la Edad del Hierro. Asimismo, se présenta el conjunto de estudios genéticos actuales y antiguos présentes en la literatura acerca del poblamiento Europeo en general y peninsular en particular. 1.4.1.1 MARCO HISTÔRICO Las primeras migraciones del hombre anatômicamente moderno (HAM) desde Africa hacia Europa, pasando por Prôximo Oriente, se remontan al Paleolitico Superior, hace airededor de unos 40.000 AP (ver Figura I 7) (Guy Straus, 1989). Hasta entonces 44 INTRODUCOON Europa estaba poblada solo por Neandertales, asociados a la industria litica Musteriense (Eiroa, 2006). Los primeros restos de HAM se encontraron en Africa oriental, siendo fechados en aproximadamente 195.000 anos (McDougall et al., 2005) y denominados inicialmente como "hombres de Cro-Magnon", aludiendo a la localidad francesa en la que se describieron por primera vez (Quatrefages y Hamy, 1874). Los HAM presentaban una morfologia craneal diferente y se han asociado a otro tipo de cultura material, el Aurihaciense (Condemi, 2011). Los HAM y los Neandertales convivieron durante unos 10.000 ahos, hasta la desaparicion de los segundos hace unos 30.000 ahos. La relacion entre ellos ha sido durante décadas el centro de un largo debate y hasta hace poco los datos genéticos, esencialmente basados en el estudio del mtDNA, no apoyaban la posibilidad de mezcia entre am bos (Krings et al., 1997; Ovchinnikov et al., 2000; Serre et al., 2004; Orlando et al., 2006; Briggs et al., 2009). Sin embargo, en 2010 se ha publicado el primer borrador del genoma de Neandertal (Green et al., 2010) y los resultados apuntan a que pudo haber cierta mezcia. Se ha estimado que la contribuciôn genética del Neandertal al acervo genético moderno de descendencia no africana podria haber oscilado entre el 1 y el 4 %, apuntandose que probablemente se produjo mezcia en Prôximo Oriente durante las primeras fases de expansiôn del hombre moderno hacia Europa (Green et al., 2010). El siguiente evento importante a nivel demografico ocurriô después del ultimo maximo glacial (LGM, Last Glacial Maximum), hace unos 25.000 - 19.500 ahos, cuando la mayor parte de Europa estaba cubierta por los hielos y hubo una contracciôn de las poblaciones paleoliticas, que se concentraron en los llamados refugios paleoliticos (Clark et al., 2009). Éstos esta ban localizados en las zonas sur-occidentales de Europa, esencialmente en la franja Franco-Cantabrica, en Italia, en los Balcanes y en las costas del Mar Negro (Dolukhanov, 1993; Semino et al., 2000; Gamble et al., 2004, 2005; Pala et al., 2009). Solo a finales del Paleolitico, paralelamente a la retirada de los hielos, Europa se volviô a poblar a partir de dichos refugios (ver Figura I 7). Debido a la alteraciôn climatica, cambiaron las costumbres culturales y tecnolôgicas. Asi las formas de arte se transformaron y se difundieron en Europa y en la Peninsula Ibérica nuevos 45 Cristina Gamba instrumentos liticos, llamados microlitos por sus dimensiones (Eiroa, 2006). También cambio la dieta debido a la desaparicion de grandes vertebrados. Este periodo se conoce como Epipaleolitico o Mesolitico y tuvo comienzo en Europa desde el 9.000 AP, durando hasta el comienzo del Neolitico (Eiroa, 2006). Figura I 7 Esquema de los posibles movimientos poblacionales que tuvieron lugar en Europa durante la expansion del hombre moderno (en rojo), la repoblacion de Europa a partir de los refugios paleoliticos (en morado) y la difusion de la agricultura (azul). Las fléchas se refieren a los posibles movimientos poblacionales/culturales sugeridos por los datos arqueologicos, y los ova los se corresponden con el comienzo de cada movimiento. Se senalan con fléchas bidireccionales los movimientos de contracciôn demogréfica en los refugios paleoliticos (ôvalos morados), seguidos de una expansiôn poblacional después del ultimo maximo glacial. La flécha discontinua représenta la expansiôn post-glacial desde el refugio de la franja cantâbrica hacia Europa septentrional (Barbujani y Goldstein, 2004). 18.000 BP 6 40,000 BP Los cambios culturales y sociales mas relevantes en la historia del hombre tuvieron lugar a partir del Neolitico, cuando la subsistencia humana pasô de una economia de recolecciôn a una de producciôn, modificando sustancialmente el estilo de vida de las poblaciones paleoliticas (Price, 2000). El origen de la cultura Neolitica tuvo lugar en Proximo Oriente hace mas de 10.000 ahos y se expandiô hacia Europa en menos de 3.000 ahos (ver Figura I 7) (Price, 2000). Este cambio economico, social y cultural 46 INTRODUCOON estuvo caracterizado por la practica de la agricultura y la ganaderfa, por el comienzo de la vida sedentaria en poblados y el empleo de materiales ceramicos y se suele denominar transicion neolitica o neolitizacion. Otros avances a nivel economico, cultural y social corresponden a las diferentes etapas de la llamada Edad de los Meta I es, cuando el empleo de instrumentos de piedra fue gradualmente sustituido por herramientas metalicas. Sus comienzos se remontan al V milenio AP y estan asociados no solo al desarrollo de la metalurgia, sino también a importantes transformaciones culturales, tecnolôgicas y demograficas (Barandiarân et al., 2007). Esta etapa prehistôrica se divide en très periodos: la Edad del Cobre o Calcolitico, la Edad del Bronce y la Edad del Hierro. A continuaciôn se describen las principales caracteristicas de cada uno de los periodos prehistôricos que van desde el Neolitico hasta la Edad del Hierro. 1.4.1.1.1 EL NEOLITICO La etimologia de la palabra Neolitico se refiere a la Era de la piedra moderna, en contraposiciôn a la Era de la piedra antigua, el Paleolitico. Sin embargo, ha ido adquiriendo muchisimos mas significados, puesto que se ha empleado para définir un periodo cronolôgico, una fase cultural, un salto evolutivo, una forma de subsistencia, una estructura social y también una poblaciôn (Price, 2000). Asi pues, se han creado una serie de ambigüedades que han complicado mas todavia la comprensiôn de esta fase (Dennell, 1992). Se suele hablar de "paquete neolitico" o Neolithic package, que incluye caracteristicas especificas de la cultura y tecnologia neolitica mas que fechas concretas, dado que alcanzô las diferentes regiones en distintos momentos y ademas en muchos territorios las poblaciones neoliticas y mesoliticas convivieron durante largos periodos de tiempo. El paquete neolitico se refiere principalmente a los materiales liticos, las ceramicas, los poblados estables y los elementos tecnolôgicos tipicamente asociados a las poblaciones agricultoras y ganaderas. Sin embargo, este paquete no llegô intacto en todas las areas y en algunos casos se encontraron elementos de tecnologia neolitica sin claras evidencias de una economia agro-pastoral. 47 Cristina Gamba Ademas, este cambio tecnologico y cultural conllevo, aunque de manera gradual, un crecimiento demografico importante, debido al aumento de recursos disponibles (Bocquet-Appel y Bar-Yosef, 2008). De hecho, al principio del Neolitico, se estima que la mortalidad aumento, incluso respecto a los grupos de cazadores-recolectores. El cambio de dieta no résulté ser muy favorable, puesto que se basaba principalmente en el consumo de pocas especies y era muy dependiente de la cantidad de la cosecha. Se sospecha que la ganaderia aumento la probabilidad de desarrollo de enfermedades infecciosas transferidas de los animales a los hombres. Se encontraron pruebas de malnutricion y difusion de enfermedades a través del analisis antropologico de restos ôseos de las primeras poblaciones neoliticas (Cohen, 1984). Sin embargo, una vez estabilizada, la poblaciôn neolitica comenzô a crecer gracias a una serie de ventajas, entre las cuales esta ban la posibilidad de almacenar alimentos en exceso y el requerimiento de intervalos menores entre nacimientos, gracias al sedentarismo. La practica agricola surgiô en diferentes lugares del planeta de forma independiente. Sus principales focos fueron Prôximo Oriente, Mesoamérica y China. En nuestro continente, a finales del ultimo maximo glacial (LGM, Lost Glacial Maximum) los hielos se retiraron y el clima empezô a mejorar y a estabilizarse. Como consecuencia la poblaciôn paleolitica que lo habitaba comenzô a crecer y a la vez empezaron a extinguirse los grandes vertebrados, como el mamut, probablemente por el cambio climatico y el aumento de la presiôn de la caza. Aunque no se trate de fenômenos directamente relacionados, estos factores podrian haber empujado el desarrollo de la agricultura (Price, 2000). Las primeras comunidades agricolas de Prôximo Oriente no empleaban ceramicas y pertenecfan a la cultura denominada PPN {Pre-Pottery Neolithic, Neolitico pre-cerâmico). Durante esta primera fase aceramica la nueva economia se expandiô desde Turquia hacia Macedonia y Grecia. A continuaciôn se comenzô a emplear ceramica en todas las comunidades agricolas. A partir de entonces se estimé que la ceramica podria representar un indicador arqueolôgico valido de la difusiôn de la agricultura (Price, 2000). Su expansiôn hacia Europa fue relativamente rapida, ya que las primeras comunidades neoliticas se establecieron en el area Egea y en Grecia airededor del 7.000 a.C. (a.C. antes de Cristo) mientras que en Inglaterra y Escandinavia no llegaron hasta poco 48 INTRODUCOON después del 4.000 a.C. (Price, 2000). De hecho, si se representan en un mapa las diferentes cultures neoliticas asociadas a su datacion (Guilaine, 2003), es posible identificar un gradiente sureste noroeste, que refleja las fechas de expansion (ver Figura I 8). Figura I 8 Mapa en la que se representan las dataciones de las diferentes culturas neoliticas, expresadas en anos a.C. (imagen modificada a partir de Guilaine 2003). 5000 5400 Neolitico Pre-cerimlco (PPNB) Neolitico antiguo del noroeste de Anatolia Monocromo / Proto-Sesklo Neolitico antiguo de Creta Kara novo m Anzabegovo I I Stardevo Bug-Oniestr Ruban* Impresa adriâtica Cardial y derivados m g Epicardial I I Hoguette En Europa se distinguen dos rutas principales asociadas a diferentes complejos ceramicos. Por un lado la ruta asociada a la ceramica lineal {Linnearbandkeramic o LBK), que se desarrollo en Europa Central, expandiéndose en varias etapas hacia el norte de Europa. Por otro lado, la ruta asociada a la ceramica Cardial, a lo largo de las costas mediterraneas, que incluyen Italia, sur de Francia y la Peninsula Ibérica. En este ultimo caso, las primeras comunidades neoliticas se desarrollaron principalmente a lo largo de las areas costeras, expandiéndose después hacia el interior de la peninsula (Marti Oliver, 2007). Como ya se ha comentado anteriormente, la naturaleza de la expansion Neolitica ha sido y sigue siendo objeto de debate desde hace mas de 50 ahos. Las primeras hipôtesis arqueolôgicas implicaban una interpretaciôn global del fenômeno neolitico y 49 Cristina Gamba las dos teorias contrapuestas se llamaron "difusion démica" y "difusion cultural". La primera se refiere a un movimiento poblacional masivo con el completo reemplazamiento de las comunidades mesoliticas que habitaban Europa, mientras que la segunda sugiere que la cultura neolitica fue adoptada por los pobladores mesoliticos europeos, sin implicar movimientos poblacionales. En las ultimas décadas se han desarrollado, sin embargo, hipôtesis intermedias para explicar el fenômeno de difusion del Neolitico, que difieren en el grado de contribuciôn genética y demografica de las poblaciones neoliticas al sustrato mesolitico pre-existente. Zvelebil ha definido un total de siete modelos para la difusiôn del Neolitico con mayor o menor grado de mezcia (Zvelebil, 2001): 1. Folk migration (Migraciôn de gentes): migraciôn masiva con reemplazamiento. 2. Demie diffusion (Difusiôn démica): entendida como "ola de avance" (Ammerman y Cavalli-Sforza, 1984). 3. Elite dominance (Dominaciôn de una élite): migraciôn de una élite que impone un nuevo modelo cultural. 4. infiltration (Infiltraciôn): migraciôn de un pequeho numéro de especialistas que se ocupan de una necesidad concreta de la poblaciôn de acogida. 5. Leapfrog colonisation (Colonizaciôn intermitente): migraciôn de pequehos grupos que se establecen en regiones ôptimas, separados de la poblacion indigena. 6. Frontier mobility (Movilidad fronteriza): intercambios entre agricultores y cazadores en las regiones de contacto. 7. Regional contact (Contacto regional): movimiento e intercambio de ideas. La difusiôn del Neolitico en Europa podria explicarse bajo diferentes modelos en funciôn de los mecanismos especificos que jugaron un papel importante en una région concreta. Los estudios de tipo local acerca del impacto neolitico se estan consolidanco 50 INTRODUCOON cada vez mas, puesto que se trata de un fenômeno que engloba diferentes facetas culturales, como las citadas LBK y Cardial, que se producen en areas determinadas y no en la totalidad del continente europeo. En cuanto a la Peninsula Ibérica, las primeras teorias acerca de la difusiôn del Neolitico promovian una influencia norteafricana mayoritaria (Bosch Gimpera, 1932), bajo la denominaciôn de "Cultura de Cuevas". Esta teoria estuvo en vigor durante mucho tiempo y fue apoyada por otros autores que la denominaron "hispano-mauritana" o "ibero-sahariana" (Bosch Gimpera, 1932; San Valero Aparisi, 1948). Fue unos ahos mas tarde cuando se comenzaron a considerar las aportaciones orientales y del mediterraneo como imputables a un ünico movimiento cultural con diferentes facetas, todas asociadas a ceramica impresa (Bernabô Breq 1946). A partir de los ahos 60, se fue devaluando cada vez mas la teoria de la influencia norteafricana en la peninsula (Fletcher, 1963; Pellicer, 1964) y se comenzaron a considerar las conexiones culturales entre los dos continentes mas bien como una emanaciôn desde la estera espahola hacia marruecos (Tarradell, 1965). En general, durante este periodo, las sintesis régionales se sustituyeron por las visiones globales de tipo difusionista (Manen et al., 2007). Durante los ahos 80, se difundiô otra corriente de pensamiento que proponia un modelo mixto para explicar el proceso de neolitizaciôn en la Peninsula Ibérica, implicando una difusiôn démica a lo largo de las costas del mediterraneo asi como la aculturaciôn en las regiones mas interiores. Se trata del "modelo dual", por el cual los primeros grupos neoliticos costeros se difundieron progresivamente hacia el interior de la Peninsula Ibérica englobando a los grupos epipaleoliticos, que a veces adquirieron solo algunas facetas del paquete neolitico (Fortea, 1973; Fortea y Marti, 1984; Bernabeu, 2002; Juan-Cabanilles y Marti, 2002). Sin embargo, existen otras hipôtesis mas recientes, como la de Zilhâo (2000, 2001) que interpretô los datos arqueologicos suponiendo una colonizaciôn maritima por parte de grupos pioneros, basandose en la rapida expansiôn del complejo Cardial en las costas ibéricas. A favor de esta hipôtesis estan la casi contemporaneidad y las homologias culturales entre grupos neoliticos de las costas mediterranea y atlantica y la neta 51 Cristina Gamba separaciôn de los grupos mesoliticos a nivel territorial, cultural, tecnologico, alimenticio y funerario (Zilhâo, 2001). 1.4.1.1.2 TRANSICION A LA EDAD DE LOS METALES Y LA EDAD DEL COBRE Asi como ocurre para el Neolitico, la metalurgia del cobre aparece en diferentes momentos a nivel europeo y también peninsular (Rincôn Martinez, 2007). Este primer periodo de la edad de los metales se desarrollô durante todo el III milenio a.C. y se denomina Edad del Cobre, Calcolitico o Eneolitico. Aunque représente un factor importante, el empleo de este métal représenta sôlo uno de los muchos rasgos culturales del Calcolitico (Delibes de Castro y Fernandez Miranda, 1999). Durante el Calcolitico la metalurgia del cobre es incipiente con finalidades esencialmente de connotaciôn decorativa o ritual, mientras que la industria litica, principalmente basada en silex, es abundante. Es solo durante la Edad del Bronce cuando disminuyen considerablemente los utiles liticos en favor de los metalûrgicos, cuya presencia y diversidad tipolôgica aumentan notablemente (Rincôn Martinez, 2007). Desde finales del Neolitico y principios del Calcolitico se registra cierto cambio de habitat, con el relative abandono de cuevas en favor de poblados estables de mayor tamaho. Una de las caracteristicas principales de esta época es el comienzo de la complejidad social, sugerida por diferentes aspectos arqueolôgicos. Por ejemplo, se han detectado ajuares desiguales dentro de grupos funerarios. Por otra parte, las diferencias de tamaho entre poblados y la fortificaciôn de alguno de ellos sugieren la existencia de una jerarquia también a este nivel. Ademas existen evidencias arqueolôgicas del incremento en la producciôn agricola y ganadera y del almacenamiento de excedentes. También hay evidencias de comercio de ambar procedente de las regiones Bâiticas y de marfil y ostras desde el norte de Africa (Jordâ, 1998). Durante el Calcolitico se empiezan a desarrollar estructuras sociales cada vez mas complejas que van desde jefaturas hasta verdaderos estados en la Edad del Bronce (Rincôn Martinez, 2007). 52 INTRODUCOON Las primeras evidencias de fundiciôn del cobre se han hallado en Anatolia y Kurdistan, regiones ricas en este mineral. Pero es en los Balacanes, durante el IV milenio a.C, donde se desarrollo plenamente la metalurgia calcolitica de manera autoctona. Aunque algunos elementos se expandieron hacia el resto de Europa mediante las redes de intercambio existentes, se han descrito diferentes desarrollos autoctonos de esta metalurgia. Por ejemplo, en la Peninsula Ibérica se ha asociado el comienzo in situ de la fabricacion del cobre con las culturas de Los Millares (Almeria, Espaha) y Vila Nova de Sao Pedro (Azambuja, Portugal) (Delibes de Castro y Fernandez Miranda, 1999). A nivel europeo, este periodo esta caracterizado por diferentes culturas. Entre las mas antiguas esta la que se caracteriza por construcciones megaliticas, monumentos religiosos y funerarios construidos con grandes bloques de piedra (ver panel a de la Figura I 9). Los mas antiguos proceden de Inglaterra, donde se construyeron desde el V hasta el I milenio a.C. (Renfrew, 1987). La cultura megalitica también se difundiô en casi toda la Peninsula Ibérica a partir del Neolitico medio, caracterizô todo el Calcolitico y en algunos casos también llegô hasta la Edad del Bronce, con una complejidad arquitectônica creciente (Rincôn Martinez, 2007). Otra cultura que se difundiô durante el Calcolitico final y el principio de la Edad del Bronce es la del vaso campaniforme (2.900-1.800 a.C.) (Muller y van Willigen, 2001), que ocupô gran parte de Europa central y occidental, incluida la Peninsula Ibérica (ver panel b de la Figura I 9). Durante el siglo pasado, se han sucedido diferentes interpretaciones acerca de este extenso fenômeno cultural. Hasta los ahos 70 se considerô como una cultura homogénea que se expandiô por toda Europa de mano de una élite de comerciantes y guerreros (Childe, 1930) y se propusieron diferentes posibles origenes, entre los cuales se encontraba la Peninsula Ibérica (Bosch Gimpera, 1919, 1940; Sangmeister, 1963). Sin embargo, esta cultura se solapaba con diferentes facetas en las distintas zonas de Europa, como la cultura de anforas globulares en Europa central, lindando con la cultura de Baden y la mas extensa cultura de la ceramica cordada y del hacha de combate en Europa central y septentrional (ver panel b de la Figura 19) (Neustupny, 1963; Guilaine, 1966; Treinen, 1970). 53 Cristina Gamba Figura I 9 a) Distribuciôn de los monumentos megaliticos en Europa; b) Localizaciôn de algunas de las culturas de la Edad del Cobre y del Bronce; cultura del vaso campaniforme, de anforas globulares, de la ceramica cordada y del hacha de combate; c) Difusiôn de la cultura de las culturas herederas de los Campos de Urnas {Urnfield culture) durante el primer milenio AP; d) Mapa de Europa durante el primer milenio a.C.: las influencias célticas y orientales (griegas y fenicias) (imagenes modificadas a partir de Cavalli-Sforza et al. 1994) CULTURAS DEL HACHA DE COMBATE, DE lA CERAMICA CORDADA Y DE ANFORAS LOBULARES ê Difusién dm las poM aciona t I de iengues c é lt ic e t i Coloni«s Cri«QM | I entes TA, 68%) over type 1 transirions (TA CG, 28%) and transversions (4%), as already suggested in the literature (Brotherton et al. 2007; Gil­ bert et al. 2007). Haplogroup single nucleotide polymor­ phism (SNP) typing results were in concordance with HVR-1 information, supporting the authenticity of the recovered haplotypes. Sample cleaning and grinding. Samples v/ere cleaned using a Sand Blaster (Dentalfarm Base 1 Plus), which allows the removal of about a millimetre of the bcne/- tooth surface using aluminium oxide powder under pressure. The aim of this procedure is to clean the sample and remove contaminant DNA molecules from its outer surface. Samples were then irradiated with UV light for about 30 min per side in a laminar flow cabinet and transferred to sterile grinding vials. Grind­ ing was performed in a Freezer M ill (SPEX Model 6700) filled with liquid nitrogen. The resulting powder was stored at -20 °C until DNA extraction was per­ formed. DNA extraction. DNA was extracted from approxi­ mately 500 mg of powdered sample following the pro­ tocol published by Rohland & Hofreiter (2007). In this protocol, D N A is absorbed to silica in the presence of high concentrations of a chaotropic salt, guarridirium thiocyanate (GuSCN). Mitochondrial DNA amplification. Two overlapping frag­ ments of the hypervariable region 1 (HVR-1) of the mtDNA were amplified by PCR. The primer pairs rsed (see Table S6 for primer sequences. Supporting infor­ mation) allowed typing 294 bp (bases pairs) of the HVR-1 (positions 16106-16399). PCRs were set up using the Qiagen Multiplex PCR kit in a final volurre of 25 pL (12.5 pL Qiagen Multiplex PCR Master Mix, 9 ^L RNAse-Free Water, primers at 2.5 mM and 3 pL DNA extract). Hot-start amplifications were carried out in a Multigene 11 Personal Thermal Cycler (Labnet Interna­ tional, Inc.), consisting of an initial dénaturation at 95 °C for 15 min, 40 cycles of 30 s at 94 °C, 90 s at 55- 59 °C, 90 s at 72 °C, and a 10-min final extension at © 2011 Blackwell Publishing Ltd 108 A N C IE N T D N A FROM FIRST N E O L IT H IC IB E R IA N S 5 72 °C. Amplifications were checked in 2% agarose gels, and positive amplifications were purified using the QlAquick PCR Purification kit (Qiagen), obtaining a final volume of 30 gL. Sequmcing and cloning. Purified PCR products were directly sequenced in ABl Prism 310 Genetic Analyzer (Applied Biosystems, Life Technologies) or sent to the C.AJ. laboratory (Centro de Apoyo a la Investigacion, Research Support Centre, Universidad Autonoma de Madrid, Cantoblanco, Madrid, Spain) and run in ABl Prism 3700 Genetic Analyzer (Applied Biosystems, Life Technologies). Consistent amplifications were cloned using the pGEM-T Easy Vector System (Promega) or TOPO TA Cloning kit (Invitrogen) following the manu­ facturer's instructions. Twenty colonies with insert were grown in a different plate. Presence of DNA insert was then double-checked by colony PCR using vector prim­ ers SP6 and T7. PCRs were performed in a final volume of 10 pL under standard conditions and reagents (Bio­ tools B&M LAbs, S.A.). Amplifications were carried out in aa Eppendorf Mastercycler PCR Thermalcycler (10- minute initial dénaturation at 94 °C, 30 cycles at 94 °C for eO s, 55 °C for 60 s and 72 °C for 60 s, and final extension at 72 °C for 10 min). Amplified DNA was then run in 2% agarose gels, and only products of right size were selected for purification. D NA was directly puriied from bacterial colonies using the QlAprep Miniprep kit (Qiagen) and sent to the C.A.l. laboratory to he run in a ABl Prism 3700 Genetic Analyzer (Applied Biosystems, Life Technologies). See Table S7 (Supporting information) for cloning alignments. Consmsus haplotype identification. Sequencing electro- pher)grams were read using the program Mutation Surveyor (Demo) version 3.24 (SoftGenetics, LLC). Sequences were then aligned and consensus haplotypes were established using the following criteria: Only those haplotypes that were repeated between dif- ferert samples from the same individual using indepen­ dent D NA extractions and amplifications were consdered as endogenous. Consensus haplotypes had to be congruent within the two ragments and with SNP typing. Hapbtypes matching those from laboratory staff, archaeologists or anthropologists were not considered. Misoding lesions were identified and removed from consfnsus haplotypes. Jumping PCRs and cross-contaminations were individu­ ally (Stimated for each sample. For hirther details about consensus haplotypes, see clone alignments (Table S7, Supporting information). Haplogroup prediction and detection. Haplogroup predic­ tion was based on mutations of the HVR-1 according to Richards et al. (2000) and van Oven & Kayser (2009). Ambiguities were resolved by comparison of consensus haplotypes with available modem mtDNA sequences collected in public databases (mtDNA manager, Lee et al. 2008) and publications (Richards et al. 2000). Haplogroups were then confirmed by the amplification of SNPs in the mtDNA coding region using specific primers (Table S6, Supporting information), following the constantly upgraded phylogeny available developed by van Oven & Kayser (2009). PCR amplification, gel electrophoresis, purification and sequencing were per­ formed as described earlier. Ancient D N A data analysis Summary statistics (¥st)- Following the recent studies of Haak et al. (2005) and Bramanti et al. (2(X)9), we esti­ mated pairwise genetic differentiation between three 'populations' using the Fgj parameter (Reynolds et al. 1983; Slatkin 1995) considering two overlapping frag­ ments sparming 255 bp on mitochondrial HVR-1 (16126- 16379) and excluding primer annealing region, using Arlequin software, version 3.5.1.2. The three population groups were as follows: (i) EN (present study, N = 13, Can Sadumi, Chaves and Sant Pau del Camp sites), (ii) M N (Sampietro et al. 2007; N = 11, Cami de Can Grau site) and (iii) a modem samples from the same region (Garcia et al. 2011; N = 363). The modern data set is a pool of 'Aragon' (N = 119), 'Catalonia-Aragon' (N = 164) and 'Catalonia' (N = 80) populations, fully described in the Supplementary Information from Gar­ cia et al. (2011). Simulations and demographic models. Simulations with aDNA data were performed using the BayeSSC pro­ gram (Excoffier et al. 20(X)) available at h ttp :// www.stanford.edu/group / hadlylab/ssc/index.html. This program uses the Bayesian version of the serial coalescent algorithm to mn simulations on genealogies backward in time according to the demographic model tested. We simulated three different data sets (Early Neolithic, Middle Neolithic, Modem Catalonia and Aragon) to match the observed data set in terms of sample sizes and time, as described earlier. In this framework, calibrated years BCE have been trans­ formed to BP by adding 1950. The previous studies of Haak et al. (2005) and Bra­ manti et al. (2009) assumed one model of panmixia across wide geographical areas and for tens of thou­ sands of years. Here, we explored three demographic models to test genetic continuity in the studied area: TPM (total panmixia model), SM (split model) and © 2011 Blackwell Publishing Ltd 109 http://www.stanford.edu/group 6 C. G A M BA E T AL . SDGM (split with differential growth model) (Fig. 2). For all three models, we followed the general frame­ work developed in the previous studies, where an Upper Palaeolithic population was randomly sampled from a hypothetical African source population with a constant female effective size of 5000, representing the first modem humans that settled in Europe 'out of Africa' around 45 000 bp. The first model, named total panmixia model (TPM), was the simplest scenario and represented a random mating population settled in northeastern Spain, showing genetic continuity from the Upper Palaeolithic until the present. Even though this model is not realistic, it was tested to compare this unstructured model with the other two structured sce­ narios implemented here. TPM has been already used by Haak et al. (2005) and Bramanti et al. (2009) to test genetic continuity in Central Europe. R. Rasteiro and L. Chikhi (submitted) have shown that it was not con­ sistent with Central European data and that structured models explained the data better. Here, we follow R. Rasteiro and L. Chikhi (submitted) and use the same demographic models. The second model tested (split model, SM) was designed to represent a simple depar­ ture from the TPM and allow for some structure. This scenario assumed that the original populations that col­ onized Europe 45 000 years ago split in two populations of the same size (demes 1 and 2) that met 7500 years ago, when the Neolithic spread into this region. The two branches can be seen as representing the Palaeolith­ ic background of northeastern Spain and the Palaeolith­ ic population in which the Neolithic arose in Near East. The third model (split with differential growth model, SDGM) was designed to reflect a different scenario with a larger Neolithic contribution. The SDGM was based on the same assumptions as the previous one, but one of the two demes represents the Near Eastern Neolithic population that starts growing around 1 0 0 0 0 bp at a higher rate than the other 'Palaeolithic' deme. As in the SM, the two demes join around 7500 bp, but the Neo­ lithic branch (deme 2) is assumed to reach a population size 20 times larger than that of the other branch (deme 1). To summarize, the SDGM and SM differ in the effec­ tive sizes of the two demes between 10 000 and 7500 bp: in the SM, demes 1 and 2 have the same effective size, while in the SDGM, the size of deme 1 is constrained to be l/20th of deme 2 at time t = 7500 BP (Fig. 2). For all these models, we assumed a sequence length of 255 bp, a fixed mutation rate of 7.5 x 10" ̂ per base pair and per generation (corresponding to 3 x 10“ ̂ sub­ stitution per base pair and per year, Endicott & Ho 2008), a transition over transversion bias of 0.9841, a uniform gamma distribution of mutations with a shape parameter of 0.205 (Bandelt et al. 2006) and 25 years per generation. The modern population effective size (Ne) was set to two million. This number corresponds to around one-sixth of the census size of the region sampled and represents the effective population size of mitochondrial DNA. To estimate this value, we consid­ ered that (i) the population census size of the studied area is around 12 million (Statistics National Institute, Spain, http://www.ine.es), (ii) mtDNA represents only the female population, being around one-half of the total, and (iii) just around one-third of the female popu­ lation reproduces (Cela-Conde & Ayala 2007). Effective population sizes at Upper Palaeolithic (UP; 45 000 bp) and Neolithic (N; 7500 bp) periods were estimated to have been around 700 for the former and 15 000 for the latter. These values were calculated from estimated population densities, around 0.064 individuals per km^ for hunter-gatherers and 20 times this value for farmers (Steele et al. 1998; Alroy 2001). Given the uncertainty on these values, we followed Bramanti et al. (2009) and used wide uniform prior distributions, spanning from 10 to 5000 for UP and from 200 to 100 000 for N, by simulating 1 million genealogies per model. Growth rates were computed on the basis of UP and N effective population sizes sampled from the priors. We then compared the simulated and observed fg j (simfsT and obsfsx/ respectively) under an approximate Bayesian computation (ABC) approach (Beaumont et al. 2002; Blum & François 2009), using the abc package (Csilléry et al. 2010) implemented in the R 2.10.1 version (R Development Core Team, 2009). Parameters were estimated by retaining 10 000 simulated values, associ­ 45,000 BP Population 5,000 7,500 BP «mEle, Population 5.000 Upper Paleolfthic Upper Paleolithic Ne-10-5.000 Ne-10-5.000 / j i / 10,000 BP Fig. 2 Demographic models explored. From left to right: TPM, total panmixia model; split model, SM; split with differential growth model, SDGM; N^, effective population sizes ranges. © 2011 Blackwell Publishing Ltd 110 http://www.ine.es A N C I E N T D N A FROM FIRST N E O L I T H I C IBERIANS 7 ated with the shortest Euclidean distances (toler­ ance - 0.01, corresponding to the 1% closest data sets). Post rejection adjustments were made using the neural- net method and logit transformation (Blum & François 2009) available in the abc package (Table S4, Supporting information). On the basis of posterior distributions obtained with the ABC framework, we set 10 values equally distributed within the UP size remge (10-5000) and 30 values for the N size (20 rémging between 200 and 20 000 and 10 between 20 000 and 100 000). Then, we again used BayeSSC to run 1000 simulations for each of these size combinations (10 x 30 = 300 combinations) and for each model (i.e. 900 000 simulations). After­ wards, we calculated for each parameter combination the probabilities of obtaining larger simFsr values than observed (obsFsr), under the three scenarios and plotted them using the filled.countour function in R version 2.10.1 (R Development Core Team, 2009), following previous studies using this approach (Bramanti et al. 2009; Malm- strom et al. 2009). Comparisons between simFsT and obsFsx values within aU N-N^ values explored are shown in Fig. SI (Supporting information). The ABC framework was also used to identify the model that best explains the observed Fst, by computing posterior prob­ abilities for each model (Beaumont 2008). To do this, we used the postpr function included in the abc package (CsiUery et al. 2010) in R version 2.10.1 (R Development Core Teaun, 2009), using a nonlinear conditional heteros- cedastic method that applies a neural network approach (Blum & François 2009). This procedure wais further val­ idated by applying this approach to data sets for which the original model was known. We used 500 replicates within the 1 million simulated data set under each model (i.e. using the Fst of the replicates as pseudo­ observed Fst values) and calculated how often the ABC procedure identified the correct model by a higher pos­ terior probability (Table 54, Supporting information). We tested this approach when the three models were used together (i.e. choose one of three models) and in pairwise comparisons (TPM vs. SM and TPM vs. SDGM). Finally, we performed simulations by slightly changing the SM and SDGM models so as to have half of the aDNA samples in deme 1 or 2 by reducing the date at which the two demes join from 7500 to 7395 bp. Our aim was to determine whether the posterior proba­ bilities of the structured models would change if we had had access to older aDNA samples. Results Haplotypes and haplogroups We obtained consistent mitochondrial DNA results for 21 of 49 samples (42% success), corresponding to 13 of 22 individuals. The remaining 26 samples were dis­ carded because of absence of results, lack of reproduc­ ibility or staff contamination. Samples recovered from caves (Can Sadurni and Chaves, 42% and 100% suc­ cess, respectively) yielded a higher success rate than those from an open-air settlement (San Pau del Camp, 29% success), which agrees with earlier suggestions that caves offer stable temp>erature conditions all year round (de Torres et al. 2002) and protect samples from adverse climate conditions, such as rainfall (Hedges & Millard 1995). Five different haplotypes were identified in the Can Sadumi archaeological site (Table I). This information, combined with odontological age estimation (Table SI, Supporting information), allowed us to establish a min­ imum number of seven individuals, considering that samples with the seme estimated age and haplotype were from the same individual. Altogether nine differ­ ent haplotypes were found for the whole aDNA data set (Table 1). Most of them are currently widely dis­ tributed throughout Europe and belonged to the major European haplogroups H, K and U5. The first two ha­ plogroups are currently distributed with high (H, ~46%) and moderate (K, ~6%) frequencies in Europe (Richcuds et al. 2000). U5 is currently present in around 9% of modem Europeans (Richards et al. 2000), and a recent aDNA analysis from Central Euro- pem hunter-gatherers has shown that this haplogroup was present at a high frequency (64%) (Bramanti et al. 2009). Three of the haplotypes were represented in more than one individual: 16224C, 16311C (one individual at each site), 16223T, 16362C (two individuals from the same site) and 16147T, 16223T, 16362C (two individuals from two different sites). These last two were assigned through SNP typing to haplogroup N*. This haplogroup was absent in M N and in the modem sample from northeastern Iberia (Table S2, Supporting information), but it has been previously detected in modem popula­ tions from the Near East and Eastem Europe (Table S3, Supporting information) and in a 25 000-year-old Cro- Magnon specimen from the Paglicd cave, southem Italy (CarameUi et al. 2003). However, haplogroup N* appears to be rare in modem populations as it could not be found in a combined search in most common databases (Richcuds et al. 2000; Lee et al. 2008; van Oven & Kayser 2009). We also identified the rare XI branch in one Eastem Iberian Neolithic sample. Haplo­ group X is found at low frequencies (2-3%) in Europe­ ans, NecU Eastemers, North Africans and native Americans (Reidla et al. 2003). Subclade X I has an early coalescence time (42 900 ± 11 900 BP) and is currently restricted to Northem and Eastem Africa and the Near East (Table S3, Supporting information) (Reidla et al. © 2011 Blackwell Publishing Ltd 111 8 C. GAMBA ET AL. I I # Q X O X Z X, X X X Z k o o U te Hir, 00 ^ 00 in tNi tv rJf- o o o u U S £ 2 U U H U t e H U S - s $ ^ s - 3 2 3 S :2 3 2 R u u u on tn £ £ U U u « o u u o u te0\ m 00 00 If) 00 N CO lO e s 'C U < H < U H H 0 \ T f 30 N 5 PI F] 3\C \0 UO \0 Tp \0 1 < < 3 @ 3 So o o n: p p U U U u u u u u CQ m PQ CQ s s i 3s 8 s ë s é s ém ic m m fC (Q (C (Q ^ ^ ^ ^y ̂ y b2fC es RJ cCu u u u l l l l ̂ QJ Ol OJz z z z ^ ^ ^ y \u u es (N W W W M W W W U U U U U U U 00 PO PO PO PO 03 03 î t t Éii CTv o o o O ' p p p O ' Cv t v S 3 S ■H "E “H "S u û u u ^ ^ w S g S z z z i l 11 IIz z c (9 (Q 40%) for the structured models (SM and SDGM) when we compared the three models at once. When we compare the models by pairs, the posterior probabilities of the structured models are always much higher (>72%) than that of the TPM (<28%), whereas the difference between the two structured models is limited. These results clearly favour the structured models over the TPM. It is © 2011 Blackwell Publishing Ltd 112 A N C I E N T D N A F R O M FIRST N E O L I T H I C I B E R I A N S 9 (a1) 4010— 3 0 1 0 - 2010— 1010— 200 2200 4200 6200 8200 § CO CL I CL=) 4010— 3010— 2010— 1010— 10 (a2) 1— I— I— r 200 2200 4200 6200 8200 (83) 4 0 1 0 - 3 0 1 0 - 2010— 1010 - 200 2200 4200 6200 8200 3010 2010 1010 200 2200 4200 6200 8200 4010 3010 2010 1010 200 2200 4200 6200 8200 4010 (C l) 4010 3010 2010 ' 1010 ' 200 2200 4200 6200 8200 (02) 4010 3010 2010 1010 200 2200 4200 6200 8200 •0.05 ■0.04 •0.03 • 0.02 (C3) 4010 3010 2010 101 0 ' 200 2200 4200 6200 8200 0.01 0.00 200 2200 4200 6200 8200 Neolithic Ne Fig. 3 Probabilities of obtaining simulated fgr greater than observed, (a-c.l) TPM model, (a-c.2) SM model, (a-c.3) SDGM model, (a .l- j) M N and modem-day populations Fst; (b.1-3) EN and modern-day populations Fst; (c.1-3) M N and EN populations Fst. Val­ ues higher than 0.05 are in white. N -N ^ range represented is up to 10 000. Plots with all N -N g values explored are available in Fig. SI (Supporting information). UP-Ng, Upper Palaeolithic effective population size; N-Ng, Neolithic effective population size; TPM, total pannixia model; split model, SM; split with differential growth model, SDGM; M N , Middle Neolithic; EN, Early Neolithic. Table 2 Posterior probabilities of the three models (TPM, SM and SDGM) Models Posterior model probabilities (%) Total panmixia (TPM) 16.1 Split SM) 40.4 Split with differential growth (SDGM) 43.4 Poste ior probabilities of the three models estimated using the approximate Bayesian computation (ABC) scheme described in the te93%). Discussion For several decades, the Neolithic transition has been at the centre of ongoing controversies among archaeolo­ gists and geneticists, particularly since the advent of mtDNA and Y chromosome data in the 1990s (Richards et al. 1996; Barbujani et al. 1998; Semino et al. 2000; Chi­ khi et al. 2002; Richards 2003). Beyond the methodologi­ cal disagreements among authors, it is important to note that several genetic studies, while defending one model of Neolithic spread, have acknowledged the pos­ sibility that different regions may have witnessed differ­ ent processes (Barbujani & Chikhi 2006). They have thus called for regional studies to determine whether it is possible to separate demie from cultural processes using both modem and aDNA. Our study addresses exactly these issues by presenting the first aDNA evi­ dence from the earliest Neolithic communities reaching the Iberian Peninsula. This study demonstrates that it is possible to recover ancient endogenous DNA from temperate environments such as northeastern Iberia. Moreover, the results obtained suggest that aDNA preservation depends © 2011 Blackwell Publishing Ltd 113 10 c. G A M B A ET AL. more on depositional conditions than on sample age, in agreement with previous observations (Nielsen-Marsh & Hedges 2000). Haplotype and haplogroup composition of EN and M N populations allow us to infer possible genetic rela­ tionships between populations and/or archaeological sites. For example, shared haplotypes among Can Sad- urni and Sant Pau del Camp could point at a certain degree of genetic continuity during the Neolithic in northeastern Iberia. Regarding the haplogroup composi­ tion, modem and M N populations differ from EN sam­ ples, mostly due to the presence of rare haplogroups N* and X I in the latter. These differences are reflected in high obsfsT- Similarly, high simfsx values could also be observed for a wide range of parameter values in the two structured models (SM and SDGM) but very rarely in TPM (Fig. 3). Within this range, the effect of genetic drift could have produced the loss of rare haplogroups N* and X I, as has been suggested for haplogroup N la in Central Europe (Barbujani & Bertorelle 2001; Barbu­ jani & Chikhi 2006; Haak et al. 2010; R. Rasteiro and L. Chikhi, submitted). This explains why our simulations favour the models considering previous population structure over an unstructured model (TPM) (Table 2). While the latter model is clearly too simphstic, it has been the one used in recent aDNA studies (Haak et al. 2005; Bramanti et al. 2009). Geographical and chrono­ logical origins of N * and X I rare lineages found in Ibe­ rian FN are difficult to trace with current information. These are, however, currently present in the Near Fast (Table S3, Supporting information). The possibility that these haplogroups were carried by Neolithic immi­ grants from the Near Fast seems to be supported from an archaeological point of view. For example, affinities in certain burial rituals (Hodder 2007; Utrilla et al. 2008) have been detected along the Neolithic spread in Europe, including the Cardial culture. In this particular case, individual 1 CHOI 02 (Chaves site) showed a Near Eastern burial ritual. Other haplogroups found at high frequency in our sample, such as H and K, could have also been introduced together with the Neolithic expan­ sion (Barbujani et al. 1998; Barbujani & Chikhi 2006). Further aDNA data from Near Eastern Neolithic and Iberian Mesolithic specimens are needed, as well as a wider analysis of specimens belonging to the Cardial culture (western Italy, southem France, Mediterranean and Atlantic coast of the Iberian Peninsula) to better identify haplotypes and haplogroups that were present in different locations spanning the Near East and all of Europe. Our results allowed us to reject the TPM but did not allow us to easily separate the two structured models. We expect that the incorporation of new aDNA data from older northeastern Iberian Mesolithic and Near Eastern Neolithic sites could help distinguish them. Most of the samples used here were relatively recent in relation to the date at which demes 1 and 2 joined. However, when we modified this date to simu­ late the availability of more ancient aDNA, we found that it improved our ability to separate the models. To conclude, we can tentatively propose a scenario that could explain our results, namely (i) the presence of currently rare haplogroups (N* and X I) in FN sam­ ples, (ii) high genetic drift during the period between the Early and Middle Neolithic, (iii) genetic affinities between FN and the Near East area and (iv) cultural connections with the Near East. This scenario would require that genetic drift played an important role at the beginning of the Neolithic with Near Eastem con­ nections, hence pointing at a succession of pioneer colo­ nization events from the Near East, which might point at other migration events along the Mediterranean, which might be identified in future studies. Acknowledgements This work was supported by CGL2006-07828/BOS and CGL2009-07959 research projects (Ministry of Science and Inno­ vation (M IC IN N ), Spanish Government). Human resources were funded by an FPU grant (ref. AP2006-01586, Spanish Government) for C.G., a grant (ref. SFRH/BD/30821/2006, Fun- daçâo para a Ciência e Tecnologia, Portugal) for R.R. and a M IC IN N researcher contract 'Juan de la Cierva' for E.F. (par­ tially supported by the European Social Fund). Replications analyses in Bordeaux have been partly supported by the CNRS (Centre National de Recherches Scientifiques). Funding was provided to LC by the "Laboratoire d'Excellence (LABEX)" entitled TULIP (ANR -lO-LABX-41). We would like to thank all archaeologists and anthropologists who collaborated in this work: Anna Blasco, Maria Josefa Villalba, Marfa Sana, Teresa Cabellos, Jordi Ruiz (Can Sadumi); Vicente Baldellou (Chaves); Josep Anfruns, Alejandro Pérez-Pérez, Mohammad Alrousan, Ferrân Estebaranz, Laura Martinez (Sant Pau del Camp). Thanks to Juan Alvarez for developping the sequence analysis program used here. The simulations were carried out in the HPC resources from CALMIP, Toulouse, France (Grant 2010- P1038). References Alroy J (2001) A multispecies overkill simulation of the end- Pleistocene megafaunal mass extinction. Science, 292, 1893- 1896. Bandelt H-J, Macaulay V and Richards M (eds) (2006) Estimation of mutation rates and coalescence times: some caveats. In: Hum an Mitochondrial D N A and the Evolution of Homo sapiens, vol. 18(part 1), pp. 47-90. Springer, Berlin, Heidelberg. Barbujani G, Bertorelle G (2001) Genetics and the population history of Europe. Proceedings of the National Academy of Sciences of the United States of America, 98, 22-25. Barbujani G, Chikhi L (2006) DNAs from the European Neolithic. Heredity, 97, 84-85. © 2011 Blackwell Publishing Ltd 114 A N C I E N T D N A FROM FIRST N E O L I T H I C IBERIANS 11 Barbujani G, Bertorelle G, Chikhi L (1998) Evidence for Paleolithic and Neolithic gene flow in Europe. American Journal of Human Genetics, 62, 488-492. Beaumont MA (2008) Joint determination of topology, divergence time, and immigration in population trees. In: Simulation, Genetics, and Human Prehistory (eds Matsumura S, Forster P and Renfrew C), pp. 135-154. McDonald Institute for Archaeological Research, Cambridge. Beaumont MA, Zhang W, Balding DJ (2002) Approximate Bayesian computation in population genetics. Genetics, 162, 2025-2035. Beaumont MA, Nielsen R, Robert C et al. (2010) In defence of model-based inference in phylogeography. Molecular Ecology, 19, 436-446. Bernabeu J (1997) Indigenism and migrationism. The néolithisation of the Iberian peninsula. Documenta Praehislorica, XXIV, 1-17. Blasco A, Edo M, Villalba MJ, Sana M (2005) Primer os datos sobre la utilizadôn sépulcral de la Cueva de Can Sadurni (Bègues, Baix Llobregat) en el Neolitico Cardial. In: Actas del I I I Congreso del Neolitico en la Peninsula Ibérica (eds Arias P, Otanôn R and Garcia-Moncô C), pp. 625-634. Servido de Publicadones, Universidad de Cantabria, Santander. Blum MGB, François O (2009) Non linear regression models for approximate Bayesian computation. Statistics and Computing, 20, 63-73. Bocquet-Appel J-P, Bar-Yosef O (2008) The Neolithic Demographic Transition and its Consequences. Springer, Dordrecht, The Netherlands. Bramanti B, Thomas MG, Haak W et al. (2009) Genetic discontinuity between local hunter-gatherers and Central Europe's first farmers. Science, 326,137-140. Brotherton P, Endicott P, Sanchez JJ et al. (2007) Novel high- resolution characterization of andent DNA reveals C > U- type base modification events as the sole cause of post mortem miscoding lesions. Nucleic Acids Research, 35, 5717- 5728. CarameUi D, Lalueza-Fox C, Vemesi C et al. (2003) Evidence for a genetic discontinuity between Neandertals and 24,000- year-old anatomically modem Europeans. Proceedings of the National Academy of Sciences of the United States of America, too, 6593-6597. Cela-Conde CJ, Ayala FJ (2007) Human Evolution: Trails from the Past, 1st edn. Oxford University Press, New York. Chikhi L, Nichols RA, Barbujani G, Beaumont MA (2002) Y genetic data support the Neolithic demie diffusion model. Proceedings of the National Academy of Sciences of the United States of America, 99, 11008-11013. Childe VG (1964) The Dawn of European Civilization, 6th edn. Vintage Books, New York. CsiUery K, Blum MGB, Gaggiotti OE, François O (2010) Approximate Bayesian computation (ABC) in practice. Trends in Ecology & Evolution, 25, 410-418. DeguiUoux M-F, Soler L, Pemonge M-H, Scarre C, Joussaume R, Laporte L (2011) News from the west: andent DNA from a French megaUthic burial chamber. American Journal of Physical Anthropology, 144,108-118. Dupanloup 1, BertoreUe G, Chikhi L, Barbujani G (2004) Estimating the impad of prehistoric admixture on the genome of Europeans. Molecular Biology and Evolution, 21,1361-1372. Endicott P, Ho SYW (2008) A Bayesian evaluation of human mitochondrial substitution rates. American Journal of Human Genetics, 82, 895-902. Excoffier L, Novembre J, Schneider S (2000) Computer note. SIMCOAL: a general coalescent program for the simulation of molecular data in interconneded populations with arbitrary demography. Journal of Heredity, 91, 506-509. Femandez J, Gomez M (2009) Climate change and population dynamics during the Late Mesolithic and the Neolithic transition in Iberia. Documenta Praehistorica, X X VIII, 67-96. Garda O, Fregel R, Larruga JM et al. (2011) Using mitochondrial DNA to test the hypothesis of a European post-gladal human recolonization from the Franco- Cantabrian refuge. Heredity, 106, 37-45. Gilbert MTP, Binladen J, MiUer W et al. (2007) Recharaderization of andent DNA miscoding lesions: insights in the era of sequencing-by-synthesis. Nucleic Acids Research, 35,1-10. Haak W, Forster P, Bramanti B et al. (2005) Andent DNA from the first European farmers in 7500-year-old Neolithic sites. Science, 310,1016-1018. Haak W, Brandt G, de Jong H N el al. (2008) Andent DNA, Strontium isotopes, and osteological analyses shed light on sodal and kinship organization of the Later Stone Age. Proceedings of the National Academy of Sciences of the United States of America, 105,18226-18231. Haak W, Balanovsky O, Sanchez JJ et al. (2010) Andent DNA from European early NeoUthic farmers reveals their near eastern affinities. PLoS Biology, 8, e l000536. Hedges REM, MiUard AR (1995) Bones and groundwater: towards the modelling of diagenetic processes. Journal of Archaeological Science, 22, 155-164. Hodder 1 (2007) Excavating Catalhoyuk South, North and KOPAL Area Reports from the 1995-99 Seasons. McDonald Institute for Archaeological Research, Cambridge. Lee HY, Song I, Ha E, Cho S-B, Yang WI, Shin K-J (2008) mtDNAmanager: a web-based tool for the management and quality analysis of mitochondrial DNA control-region sequences. B M C Bioinformatics, 9, 483. Mabnstrom H, Gilbert MTP, Thomas MG et al. (2009) Andent DNA reveals lack of continuity between Neohthic hunter- gatherers and contemporary Scandinavians. Current Biology, 19, 1758-1762. Molist M , Vicente O, Farré R (2008) El jadment de la casema de Sant Pau del Camp: aproximado a la caraderitzadô d'un assentament del neolitic antic. Quarhis, 4 , 14—24. Montes L, Utrilla P (2008) Le Paléolithique Supérieur dans la moyenne vallée de l'Ebre. L'Anthropologie, 112,168-181. Nielsen-Marsh CM, Hedges REM (2000) Patterns of diagenesis in bone I: the effects of site environments. Journal of Archaeological Science, 27, 1139-1150. van Oven M, Kayser M (2009) Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation. Human Mutation, 30, E386-E394. Price TD (2000) Europe's First Farmers. Cambridge University Press, New York. R Development Core Team (2009) R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. Available at: http:// www.R-projed.org. © 2011 Blackwell Publishing Ltd 115 http://www.R-projed.org 12 C. GA MBA ET A l . Reidla M, Kivisild T, Metspalu E et al. (2003) Origin and diffusion of mtDNA haplogroup X. The American Jounwl of Human Genetics, 73, 1178-1190. Reynolds J, Weir BS, Cockerham CC (1983) Estimation of the coancestry coefficient: basis for a short-term genetic distance. Genetics, 105, 767-779. Richards M (2003) The Neolithic invasion of Europe. Annual Review of Anthropology, 32, 135-162. Richards M, Côrte-Real H, Forster P et al. (1996) Paleolithic and neolithic lineages in the European mitochondrial gene pool. American Journal of Human Genetics, 59,185-203. Richards M, Macaulay V, Hickey E et al. (2000) Tracing European founder lineages in the near Eastem mtDNA pool. American Journal of Human Gaieties, 67,1251-1276. Rohland N , Hofreiter M (2007) Ancient DNA extraction from bones and teeth. Nature Protocols, 2 , 1756-1762. Sampietro ML, Lao O, CarameUi D et al. (2007) Palaeogenetic evidence supports a dual model of Neolithic spreading into Europe. Proceedings of the Royal Society B: Biological Sciences, 274, 2161-2167. Semino O, Passarino G, Oefner PJ et al. (2000) The generic legacy of paleolithic Homo sapiens sapiens in Extant Europeans: a Y chromosome perspective. Science, 290,1155-1159. Slatkin M (1995) A measure of population subdivision based on microsatellite aUele frecjuendes. Genetics, 139, 457-462. Soares P, AchiUi A, Semino O et al. (2010) The archaeogenerics of Europe. Current Biology, 20, R174-R183. Steele J, Adams J, Sluckin T (1998) Modelling Paleoindian dispersals. World Archaeology, 30, 286-305. dc Torres T, Ortiz JE, Llamas FJ, Canoira L, Julia R, Garda- Martinez MJ (2002) Bear dentine aspartic add racemizarion analysis: a proxy for the daring of Pleistocene cave infills. Archaeometry, 44, 417-426. Utrilla P, Lorenzo JI, BaldeUou V, Sopena MC, Ayuso P (2008) Enterramiento masculine en fosa, cubierto de cantos rodados, en el neolitico antiguo de la cueva de Chaves. In: IV Congreso del Neoh'tico Paiinsular (eds Hernandez MS, Soler JA and Lopez JA), vol. 2, pp. 131-140. Museo Arqueologico de Ahcante (MARQ), Alicante. Zilhao J (2001) Radiocarbon evidence for maritime pioneer colonization at the origins of farming in west Mediterranean Europe. Proceedings of the National Academy of Sciences, 98, 14180-14185. Zvelebil M (2001) The agricultural transition and the origins of Neolithic sodety in Europe. Documenta Praehistorica, XXVIII, 1-29. CG, EF, MT, MFD, MHP and EAP are interested in using andent DNA generic analyses to gain insights into archaeologi­ cal and demographic aspects of andent human populations, particularly in the generic impact of the Neolithic. CG, RR and LC are interested in applying model-based approaches to study the demographic past of populations, using dther andent and/or modem genetic data. PU, ME and M M are interested in the archaeological and demographic Prehistory of European, Near Eastem and Iberian populations. Data accessibility Sequence alignments are available in the Supporting informa­ tion. Supporting information Additional supporting information may be found in the online version of this arride. Fig. S I Plots with N-N(. values explored. Table SI Samples description. Table S2 Haplogroup frequendes in studied populations. Table S3 Haplogroup N* and XI frequendes in the Near East. Table S4 Posterior distribution of population sizes and power to recover the true model. Table S5 Staff's mtDNA. Table S6 Pruner sequences. Table S7 Cloned sequences alignments. Please note: Wiley-Blackwell are not responsible for the content or functionality of any supporting information supplied by the authors. Any queries (other than missing material) should be directed to the corresponding author for the arride. © 2011 Blackwell Publishing Ltd 116 SUPPLEMENTARY MATERIAL TABLE S I Sample description Can Sadurni Barcelona CSA0511 CSA05 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2005 adult canine tooth Can Sadurni Barcelona CSAOSll CSAll Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2006 adult incisor tooth Can Sadurni Barcelona CSA09 CSA09 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2007 infant molar tooth Can Sadurni Barcelona CSA152223 CSA15 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2008 adult/sub-adult molar tooth Can Sadurni Barcelona CSA152223 CSA22 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2009 adult/sub-adult premolar tooth Can Sadurni Barcelona CSA152223 CSA23 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2010 adult/sub-adult premolar tooth Can Sadurni Barcelona CSA16 CSA16 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2011 adult/sub-adult incisor tooth Can Sadurni Barcelona CSA24 CSA24 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2012 infant molar tooth Can Sadurni Barcelona CSA26 CSA26 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2013 infant molar tooth Can Sadurni Barcelona CSA29 CSA29 Early Neolithic (Cardial) 5,475-5,305 cal. BC Blasco et al. 2014 infant canine tooth Chaxes Huesca 1CH0102 ICHOl Early Neolithic (Cardial) 5,329-4,999 cal BC Utrilla et al. 1999 adult cranial fragment Chases Huesca 1CH0102 1CH02 Early Neolithic (Cardial) 5,329-4,999 cal BC Utrilla et al. 2000 adult rib fragment Chases Huesca 2CH0102 2CH01 Early Neolithic (Cardial) 5,329-4,999 cal BC Utrilla et al. 2001 adult molar tooth Chases Huesca 2CH0102 2CH02 Early Neolithic (Cardial) 5,329-4,999 cal BC Utrilla et al. 2002 adult molar tooth Chases Huesca 3CH01 3CH01 Early Neolithic (Cardial) 5,329-4,999 cal BC Utrilla et al. 2003 adult molar tooth Sant ’ au del Camp Barcelona 19SP0102 19SP01 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2008 adult molar tooth Sant ’au del Camp Barcelona 19SP0102 19SP02 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2009 adult premolar tooth Sant ’au del Camp Barcelona 26SP0102 26SP01 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2010 adult molar tooth Sant ’au del Camp Barcelona 26SP0102 26SP02 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2011 adult molar tooth Sant ’au del Camp Barcelona 27SP0102 27SP01 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2012 infant incisor tooth Sant ’au del Camp Barcelona 27SP0102 27SP02 Late Early Neolithic 4,250-3,700 cal BC Molist et al. 2013 infant molar tooth References Blasco, A., Edo, M., Villalba, M. J. & Sana, M. 2005 Primeros datos sobre la utilizacion sépulcral de la Cueva de Can Sadurni (Segues, Baix Llobregat) en el Neoh'tico Cardial. In Actas del III Congreso del Neolitico en la Peninsula Ibérica., Santander: Servicio de Publicaciones, Universidad de Cantabria. Utrilla, M. del P. & Calvo, M. J. 1999 Cultura material y arte rupestre "levantino": La aportacion de los yacimientos aragoneses a la cuestion cronologica. Una revision del tema en el ano 2000. Bolskan 16, SO­ TO. Molist, M., Vicente, 0. & Farré, R. 2008 El jadment de la casern a de Sant Pau del Camp: aproximado a la caracteritzacio d'un assentament del neolitic antic. Quarhis 4,14 24. 117 TABLE 5 2 Haplogroups frequencies in Early Neolithic samples (present study), Middle Neolithic Samples (Sampietro et al. 2007) and Modern population samples from the same area (Garcia et al. 2011). Modern (%) Modem (N) Middle Neolithic {% ) Middle Neolithic (N) Early Neolithic (%) Early Neolithic (N) H/HV/U*/R* 42,70 1S5 36,36 4 30,77 4 N* - - - - 30,77 4 K 6,06 22 - - 23,08 3 V/HVO 4,96 18 - - - - U4 0,83 3 9,09 1 - - US 8,54 31 7,69 1 U6 1,38 5 - - - - T 10,19 37 18,18 2 - - J 9,64 35 18,18 2 - - Nla 0,28 1 - - - - 1 1,38 5 9,09 1 - - W 2,48 9 9,09 1 - - X 2,48 9 - - 7,69 1 others 9,09 33 - - - - TOTAL 100,00 363 100,00 11 100,00 13 118 TABLE S3 Haplogroup N* frequencies in the Near East and Eastern Europe Saudi Arabia 0,18 Saudi Arabia Arab 553 Abu Amero et al. 2008 Oman 2,86 Oman Arab 105 Rowold et al. 2007 United Arab Emirates 9,16 Union Arab Emirates Arab 131 Rowold et al. 2007 Jordan 0,54 Jordan Arab 184 Gonzalez et al. 2008, Rowold et al. 2007 Ethiopia 1,48 Ethiopian Ethiopian 270 Kivisild et al. 2004 Iran 1,58 Iran Iranian 507 Richards et al. 2000, Metspalu et al. 2004, Comas et al. 2004, Quintana- Murci eta l 2004 Syria 0,85 Syria Syrian 118 Vernesi et al. 2001, Richards et al. 2000 Palestinian 0,81 Israel Palestinian 247 Shen et al. 2004, Richards et al. 2000, Behar et al. 2008, Di Rienzo and Wilson 1991 Druze 0,22 Near East Druze 452 Macaulay et al. 1999, Shen et al. 2004, Slush et al. 2008, Behar et al. 2008 Turkmenistan 1,64 Turkmenistan Turkmen 61 Quintana-Murci et al 2004, Comas et al. 2004 Near Eastern Jews 1,68 Yemen, Iraq, Syria, Iran, Kurdistan, Uzbekistan, Afghanistan Jew 476 Shen et al. 2004, Richards et al. 2000, Behar et al. 2008, Di Rienzo and Wilson 1991, Picornell et al. 2006 Serbia 1,71 Serbia Serbian 117 Cvjetan et al. 2004 Askhenazi Jews 0,32 Austria, Hungary, Byelorussia, Czech Republic, Estonia, France, Germany, Latvia, Lithuania, Moldavia, Netherlands, Poland, Romania, Russia, Switzerland, Ukraine Jew 623 Behar et al. 2004, Behar et al. 2006, Shen et al. 2004, Picornell et al. 2006 119 Haplogroup X I frequencies in the Near East Near Eastern Jews 0,03 Iraq, Iran Jewish 135 Behar et al. 2008 Caucasian Jews 0,02 Azerbaijan Jewish 58 Behar et al. 2008 Palestinian 0,01 Israel Palestinian 110 Behar et al. 2008 Askhenazi Jews 0,03 Austria, Hungary Jewish 29 Behar et al. 2006 Ethiopia 0,01 Ethiopian Ethiopian 270 Kivisild et al. 2004 Kuwait 0,50 Kuwait Kwaitis 202 Reidla et al. 2003 Druze 15,60 Israel Druze 45 Macaulay et al. 1999 Jordan 0,50 Jordan Arab 202 Reidla et al. 2003 Iraq 0,90 Iraq Jraquian 116 Richards et al. 2000 Iran 0,20 Iran Iranian 440 Reidla et al. 2003 References Abu-Amero KK, Gonzalez AM, Larruga JM, Bosley TM, and Cabrera VM. Eurasian and African mitochondrial DNA influences in the Saudi Arabian population. BMC Evol Biol 7:32-32. Behar DM, Metspalu E, Kivisild T, Achilli A, Hadid Y, Tzur S, Pereira L, Amorim A, Quintana-Murci L, Majamaa K, et al. 2006. The matrilineal ancestry of Ashkenazi Jewry: portrait of a recent founder event. Am. J. Hum. Genet 78:487-497. Behar DM, Metspalu E, Kivisild T, Rosset S, Tzur 5, Hadid Y, Yudkovsky G, Rosengarten D, Pereira L, Amorim A, et al. 2008. Counting the founders: the matrilineal genetic ancestry of the Jewish Diaspora. PLoS ONE 3:e2062. Comas D, Plaza S, Wells RS, Yuldaseva N, Lao 0, Calafell F, and Bertranpetit J. 2004. Admixture, migrations, and dispersals in Central Asia: evidence from maternal DNA lineages. Eur. J. Hum. Genet 12:495-504. Cvjetan 5, Tolk H-V, Lauc LB, Colak I, Dordevic D, Efremovska L, Janicijevic B, Kvesic A, Klaric IM, Metspalu E, et al. 2004. Frequencies of mtDNA haplogroups in southeastern Europe- Croatians, Bosnians and Herzegovinians, 5erbians, Macedonians and Macedonian Romani. Coll Antropol 28:193- 198. Di Rienzo A, and Wilson AC. 1991. Branching pattern in the evolutionary tree for human mitochondrial DNA. Proc. Natl. Acad. 5ci. U.5.A 88:1597-1601. Gonzalez AM, Karadsheh N, Maca-Meyer N, Flores C, Cabrera VM, and Larruga JM. 2008. Mitochondrial DNA variation in Jordanians and their genetic relationship to other Middle East populations. Ann. Hum. Biol 35:212-231. Kivisild T, Reidla M, Metspalu E, Rosa A, Brehm A, Pennarun E, Parik J, Geberhiwot T, Usanga E, and Villems R. 2004. Ethiopian mitochondrial DNA heritage: tracking gene flow across and around the gate of tears. Am. J. Hum. Genet 75:752-770. 120 Macaulay V, Richards M, Hickey E, Vega E, Cruciani F, Guida V, Scozzari R, Bonné-Tamir B, Sykes B, and Torroni A. 1999. The emerging tree of West Eurasian mtDNAs: a synthesis of control-region sequences and RFLPs. Am J Hum Genet 64:232-249. Picornell A, Gimenez P, Castro JA, and Ramon MM. 2006. Mitochondrial DNA sequence variation in Jewish populations. Int. J. Legal Med 120:271-281. Quintana-Murci L, Chaix R, Wells RS, Behar DM, Sayar H, Scozzari R, Rengo C, Al-Zahery N, Semino O, Santachiara-Benerecetti AS, et al. 2004. Where West Meets East: The Complex mtDNA Landscape of the Southwest and Central Asian Corridor. Am J Hum Genet 74:827 845. Richards M, Macaulay V, Hickey E, Vega E, Sykes B, Guida V, Rengo C, Sellitto D, Cruciani F, Kivisild T, et al. 2000. Tracing European founder lineages in the Near Eastern mtDNA pool. Am. J. Hum. Genet 67:1251 1276. Rowold DJ, Luis JR, Terreros MC, and Herrera RJ. 2007. Mitochondrial DNA geneflow indicates preferred usage of the Levant Corridor over the Horn of Africa passageway. J. Hum. Genet 52:436-447. Shen P, Lavi T, Kivisild T, Chou V, Sengun D, Gefel D, Shpirer I, Woolf E, Hillel J, Feldman MW, et al. 2004. Reconstruction of patrilineages and matrilineages of Samaritans and other Israeli populations from Y- chromosome and mitochondrial DNA sequence variation. Hum. Mutat 24:248-260. Shlush LI, Behar DM, Yudkovsky G, Templeton A, Hadid Y, Basis F, Hammer M, Itzkovitz S, and Skorecki K. 2008. The Druze: A Population Genetic Refugium of the Near East. PLoS ONE 3. Vernesi C, Di Benedetto G, CarameUi D, Secchieri E, Simoni L, Katti E, Malaspina P, Novelletto A, Marin VT, and Barbujani G. 2001. Genetic characterization of the body attributed to the evangelist Luke. Proc. Natl. Acad. Sci. U S A 98:13460-13463. 121 TABLE 54 Posterior distribution population sizes 187,73 203,71 313,67 359,12 101,05 205,42 2376,39 1207,48 2748,90 6828,98 2453,44 2885,99 4897,56 64582,69 5094,00 78293,07 5145,36 86737,85 Posterior distribution of Upper Palaeolithic and Neolithic effective population sizes, estimated under an ABC approach. Power to recover the true model 60,20 15,06 24,20 45,40 26,00 28,60 31,40 24,80 43,80 Power to recover the true model randomly sampling 500 replicates within the 1 million simulated dataset under the TPM (first row), the SM (second row) and the SDGM (third row). The posterior probabilities were all obtained using the neuralnet method with a tol=0.01, as implemented in the R abc package, (a) Proportion of times that the method recovered the true model. Replicates were considered assigned to the model that has the highest posterior distribution. 122 TABLE 5 5 Mitochondrial DNA profiles of the laboratory staff, archaeologists and anthropologists Lab_Madrid_l* Laboratory staff (handling samples in all stages ) 16126C, 16294T, 16296T, 16304C Lab_Madrid_2 Laboratory staff (handling samples only in post- PCR stages ) 16224C, 16311C Lab_Madrid_3 Laboratory staff (having access to the pre-PCR and PCR rooms) CRS Lab Madrid s Laboratory staff (having access to the PCR room) 16069T, 16126C Lab Bordeaux 1* Laboratory staff (handling samples in all stages ) 16126C, 16294T, 16296T, 16304C LabBordeaux 2 Laboratory staff (having access to the pre-PCR and PCR rooms) 16126C, 16294T, 16324C LabBordeaux 3 Laboratory staff (having access to the pre-PCR and PCR rooms) 16209C LabBordeaux 4 Laboratory staff (having access to the pre-PCR and PCR rooms) CRS LabBordeauxS Laboratory staff (having access to the pre-PCR and PCR rooms) 16234T Can S ad urn il Archaeologist 16069T, 16126C, 16278T, 16366T Can Sadurni_l Archaeologist 16126C, 16239T, 16294T, 16296T, 16304C Can_Sadurni_2 Archaeologist 16126C, 16163G, 16186T, 16189C, 16261T, 16294T Can Sadurni_3 Anthropologist 16270T Can Sadurni_4 Anthropologist CRS Can Sadurni 5 Anthropologist CRS Chaves_l Archaeologist 16293G Chaves_2 Archaeologist 16037G,16183C, 16189C Chaves_3 Anthropologist 16224C,16311C Chaves_4 Archaeologist 16069T, 16126C Sant_Pau_del_Camp_l Anthropologist 16304C, 16320T Sa nt_Pa u_del_Ca m p_2 Anthropologist 16168C Sant_Pau_del_Camp_3 Anthropologist 16265G Sa nt_Pa u_de l_Ca m p_4 Anthropologist 16311C * Asterisk refers to the same person who worked In both labs (CG). 123 TABLE S6 Primers used for the amplification of HVRI and coding regions of the mtDNA m HVI_3,2 16106 GCCAGCCACCATGAATATTG 16125 16280 TGGTATCCTAGTGGGTGAG 16262 Fernândez, 2005 HVI_3,4 16106 GCCAGCCACCATGAATATTG 16125 16262 ATCCTAGTGGGTGAGGGG 16280 Fernandez, 2005 HVI_1,4 16095 CGTACATTACTGCCAGCC 16112 16262 ATCCTAGTGGGTGAGGGG 16280 Fernéndez, 2005 HVI_5,6 16232 CACACATCAACTGCAACTCC 16251 16399 TCAAGGGACCCCTATCTGAG 16380 Fernéndez, 2005 HVI_cu,cl 16190 CCCCATGCTTACAAGCAAGT 16209 16410 GAGGATGGTGGTCAAGGGAC 16391 Jeahes et al., 2001 HVI_bu,bl 16144 TGACCACCTGTAGTACATAA 16163 16251 GGAGTTGCAGTTGATGT 16235 Jeahes et al., 2001 1A_1B 15975 CTCCACCATTAGCACCCAA 15973 16418 ATTTCACGGAGGATGGTG 16401 Gabriel et al. 2003 SNP_5178 5129 CTTAAACTCCAGCACCACGA 5148 5238 GGGCAAAAAGCCGGTTAG 16251 Present study SNP_4833 4790 ATAGCCCCCnrCACTTCTG 4810 4887 GGGAGAGATTTGGTATATGATTGA 4910 Present study SNP_10873 10825 AA7TTGAATCAACACAACCA 10844 10901 GGGGAACAGCTAAATAGGTT 10920 Present study SNP_10398_10400 10359 AGTCTGGCCTATGAGTGACTAC 10380 10423 AATGAGTCGAAATCATTCGTTT 10444 Present study SNP_10238 10174 GCGGCTTCGACCCTATATC 10192 10279 TTGTAGGGCTCATGGTAGGG 10298 Present study SNP_10550 10500 GCATTTACCATCTCACTTCTAGG 10522 10609 GGAGTGGGTGTTGAGGGTTA 10628 Present study SNP_7028 6979 CAAACTCATCACTAGACATCG 6999 7066 GAATGAAGCCTCCTATGATGG 7086 Present study SNP_14766 14712 AAAACCATCGTTGTATTTCAA 14732 14792 GGAGGTCGATGAATGAGTG 14810 Present study SNP_3197 3116 CCTCCCTGTACGAAAGGACA 3135 3228 GGGCTCTGCCATCTTAACAA 3247 Present study SNP_1719 1689 CCCACTCCACCTTACTACCAGA 1710 1755 TGCGCCAGGTTTCAATTT 1772 Nelson et al., 2007 SNP_6371 6267 GCAGGAACAGGTTGAACAGTC 6287 6377 TGAAATTGATGGCCCCTAAG 6396 Present study FW= Forward RV=Reverse References Fernandez E. 2005. Polimorfismos de DNA mitocondrial en poblaciones antiguas de la cuenca medlterranea. Available from: www.tesisenxarxa.net/rESIS_UB/AVAILABLE/rDX-0123106-084234/ Gabriel MN, Calloway CD, Reynolds RL, and Primorac D. 2003. Identification of human remains by immobilized sequence-specific oligonucleotide probe analysis of mtDNA hypervariable regions I and II. Croat. Med. J 44:293-298. Jehaes E, Toprak K, Vanderheyden N, Pfeiffer H, Cassiman JJ, Brinkmann B, and Decorte R. 2001. Pitfalls in the analysis of mitochondrial DNA from ancient specimens and the consequences for forensic DNA analysis: the historical case of the putative heart of Louis XVII. Int. J. Legal Med 115:135-141. Nelson TM, Just RS, Loreille O, Schanfield MS, and Podini D. 2007. Development of a multiplex single base extension assay for mitochondrial DNA haplogroup typing. Croat. Med. J 48:460-472. 124 http://www.tesisenxarxa.net/rESIS_UB/AVAILABLE/rDX-0123106-084234/ TABLE S7 Cloned Sequences alignment Sequences are identified by sample name, extraction number, amplification number, primer pair and clone number or "dir" (direct sequence). Sequences follow specimen order listed in Table 1 and Table SI. Colours identify discarded haplotypes (grey=lab staff/archaeologist/anthropologist contamination, orange=cross-contamination) and jumping-PCR (blue). AVAILABLE IN THE CD PROVIDED TOGETHER WITH THIS PHD THESIS. 125 FIGURE S I Probabilities of obtaining simulated F st greater than observed are plotted (UP-Nei Upper Palaeolithic effective population size; N-Ne: Neolithic Effective population size), (a-c.l) TPM model, (a-c.2) SM model, (a-c.3) SDGM model, (a.1-3) MN and modern-day populations Fst; (b.1-3) EN and modern-day populations Fst; (c.1-3) MN and EN populations Fst. Values higher than 0.05 are in white. Include all N-Ne valu Ne explored (up to 100,000). 4910 —i 4010 4010 3210 3210 2410 2410 H 1910 1010 810 810 (b .1)(a.1) 30200 80200 80200 30200 00200 00200 4810 4810 4010 4010 — .3; 3210 3210 2410 810 810 — (b .2 ) ^(a.2) 30200 00200 80200 30200 80200 90200 4010 4810 4010 4010 — 3210 3210 — 2410 1010 810 810 (b .3)(a.3) 30200 00200 80200 30200 00200 90200 « 0.05 0.04 0.03 0.02 0.01 0.00 30200 00200 80200 30200 80200 90200 Neolithic Me 30200 00200 90200 126 ARTTCULO 4 / A R T IC L E 4 Incluye una actualizacion con los resultados validados y el analisis estadfstico y computacional / Update with the results validated and the statistical and computational analyses included Population genetics and DNA preservation in ancient human remains from Eastern Spain. Gamba C. Fernandez E, Oliver A, Tirado M, Baeza C, Lopez-Parra A, y Arroyo-Pardo E. Forensic Science International: Genetics Supplement Series 1:462-464.2008. RESUMEN (ESPANOL) El objetivo de este trabajo era evaluar el impacto genético de diferentes pobladores que habitaron el noreste de la Peninsula Ibérica desde el Calcoh'tico hasta la Edad del Hierro. Mas concretamente, se évalué la continuidad o discontinuidad genética entre los diferentes grupos estudiados y las poblaciones neoliticas y actuales de la misma region. Se obtuvieron resultados validados para 12 individuos, 8 de la Edad de los Metales (Calcoh'tico y Edad del Bronce) y 4 fberos (Edad del Hierro). Se implementaron diferentes modelos estadi'sticos y computacionales para la evaluaciôn del impacto genético de los diferentes pobladores de la region. Los resultados apuntan a la presencia de cierta continuidad genética desde el Neoh'tico Medio hasta la actualidad, a excepcién de la poblaciôn ibera. Esta ultima presentaba una composicién genética diferencial que podn'a atribuirse a diferentes factures: al escaso numéro de muestras estudiadas, a una elevada endogamia o a que se tratase de un grupo étnico diferencial, puesto que los individuos analizados no fueron incinerados como corresponde a la tradiciôn funeraria de ese pen'odo. En el conjunto de datos analizados destaca la presencia de haplogrupos mitocondriales tradicionalmente asociados a la expansion post-glacial (como el V y el HVO) desde los refugios paleoh'ticos del sur, de acuerdo con los datos de la genética de poblaciones actuales. Su presencia en las muestras estudiadas apunta a una probable localizacién mâs meridional de estos refugios durante el ultimo mâximo glacial. 127 128 Available online at www.sciencedirect.com ScienceDirect ELSEVIER Forensic Science International: Genetics Supplement Series 1 (2008) 462-464 IFSI m GENETICS www.elsevier.com/locate/FSÏGSS Research article Population genetics and D N A preservation in ancient hum an rem ains fro m Eastem Spain C. Gamba ̂ E. Fernandez ̂ A. Oliver^, M. Tirado ̂ C. Baeza % A.M. Lopez-ParraE. Arroyo-Pardo^’* ̂Depto. Toxicologia y Legislaciôn Sanitaria, Facultad de Medicina, Universidad Complutense, M adrid 28040, Spain *^Secciàn de Arqueologia. Museo de Bellas Artes de Castellan, Castellon, Spain Received 16 August 2007; accepted 7 October 2007 Abstract This work aims to establish the genetic relationship between the different settlers of Eastem Spain and also to determine the conditions of DNA preservation. We studied two overlapping sequences (16,126-16,251 and 16,256-16,369) from mitochondrial H V R -I in 37 bone and teeth samples from 17 archaeological sites o f Spanish Levant. Consistence of the results was established by repeated replication of amplifications. Approximately, 50% of the samples yielded reproducible results. The higb efficiency in DNA recovery indicates that sample preservation mainly depends on the depositional environment rather than on sample age. Haplogroup V, an alleged marker of Paleolithic newcomers in Europe, has been found in an unusual elevated frequency (1 Calcolithic and 2 Iberian samples). This result could suggest a more southem distribution of Palaeolithic ice réfugia. Moreover, we found Haplogroup L in Calcolithic samples. This may suggest the presence of a prehistoric African genetic background in eastem Iberia. © 2008 Elsevier Ireland Ltd. A ll rights reserved. Keywords: Ancient DNA; Mitochondrial DNA; Eastem Iberia 1. Introduction The East of Spain has been populated at least since Palaeohthic times [1]. Due to its strategic location, opened to the Mediterranean shore, it has been prone to have received genetic influences from other populations. Present work tries to evaluate this hypothesis through mtDNA Hypervariable region I (H V R -I) characterization of ancient samples from Castellon and Valencia provinces, dated back to Roman, Iberian, Bronze and Chalcolithic ages. Obtained results w ill be interpreted in terms of genetic continuity/discontinuity between these periods. The effect of the environment and the age of the sample over DNA preservation w ill be evaluated in this study. 2. Material and methods 2.7. Samples 36 samples were studied (21 bones and 15 teeth) belonging to 36 different individuals from 17 archaeological sites (6 * Corresponding author. Tel.: +34 91 3941576; fax: +34 91 3941606. E-mail address: earroyop@med.ucni.es (E. Arroyo-Pardo). Chalcohthic, 2 Bronze Age, 6 Iberian Culture and 3 Roman) located in Eastem Spain (see Fig. 1 and Table 1). 2.2. Extraction The external surface of the samples was removed first with a Sand-blaster, and afterwards they were irradiated with U V light and cmshed in a freezer m ill filled with liquid Nitrogen. Samples were then washed several times with EDTA 0.5 M and incubated in a lysis solution (EDTA 5 mM, Tris-HCl 10 mM, SDS 0.5%, proteinase K 50 p-g/ml) overnight at 36 °C. DNA was extracted using a modified Phenol-Chloroform protocol [2] and concen­ trated with microcons (Centriplus 30000, Millipore). 2.3. PCR amplification and sequencing A 244-bp fragment was studied from mitochondrial H VR I by the independent amplification of two short overlapping sequences (positions 16,126-16,369) [2]. Qiagen Multiplex PCR was implemented for ancient DNA. Amplification products were sequenced using a Apphed Biosystems 310 sequencer. 1875-1768/$ - see front matter (( doi : 10.1016/j .fsigss.2(X)7.10.037 2008 Elsevier Ireland Ltd. All rights reserved. 129 http://www.sciencedirect.com http://www.elsevier.com/locate/FS%c3%8fGSS mailto:earroyop@med.ucni.es C Gamba et al./Forensic ScieiKe International: Genetics Supplement Series I {2008) 462-464 Fofcall • , Mas d’Arago ■ 463 f FRANCE PORTUGAL SPAIN Castellon Valencia Table 1 Analysed samples Mas d’Abad cave L'Hostatot Macanetcave • AI Cingle de Cova Negra Cova de Ferrero , Malpasocave • « LosViliares Plug de la Nau Liosguera sepulchre ^Jovellus sepulchre riorrelo del Bonerol FAssud de villarreal 2 sepulchre iJosep •Tossal dew nt Miquel • Castellet d^Bemabe Fig. 1. Location of sample sites. Archaeological site Location No. Sample Age Malpaso cave Castellnovo (Castellon) 4 Teeth Chalcolithic Jovellus sepulchre Benicàssim (Castellon) 1 Tooth Chalcolithic A1 Cingle de Cova Negra Borriol (Castellon) 1 Tooth Chalcolithic Ferrero cave Artana (Castellon) 1 Bone Chalcolithic Assud de Villarreal, 2nd sepulchre Almassora (Castellon) 1 Bone Chalcolithic Costa Lloguera sepulchre Castellon 6 Teeth Chalcolithic Mas d’Ahad cave Les Coves de Vinromà (Castellon) 1 Bone Bronze Age Maçanet cave Llucena (Castellon) 1 Tooth Bronze Age Castellet de Bemahé Liria (Valencia) 2 Bones Therian Los Villares Caudete de las Fuentes (Castellon) 1 Bone Iberian Puig de la Nau Benicarlo (Castellon) 9 Bones Iberian Torrelc Bcnerct Castellon 2 Bones Iberian Sant Josep La Vail d’Uix6 (Castellon) 1 Bone Iberian Tossal de Sant Miquel Li'ria (Valencia) 3 Bones Iberian Mas d’Arago Cervera del Maestre (Castellon) 1 Tooth Roman L’Hostalot Villanova d’Alcolea (Castellon) 1 Tooth Roman Total 36 2.4. Criteria o f authenticity Some criteria of authenticity were followed in this study: analysis in an exclusive ancient DNA lab, physical separation of pre- and post-PCR procedures, equipment exclusive for aDNA, removal of the external surface of the samples analysis by a single researcher, use of “blanks” in extraction and amplification, repeated amplifications from the same extract, phylogenetic sense (comparison with lab staff and archae­ ologists/anthropologists), DNA quantification. 3. Results Approximately, 50% of the samples yielded reproducible results: 17 samples for the two fragments and 3 samples only for one of them (See Tables 1 and 2). By comparing the obtained haploypes with public databases it was possible to assign an haplogroup to most of the sequences. Haplogroup H, the most common nowadays in Europe, was found at all age classes. Haplogroup V, an alleged marker for human post-glacial expansion from southwestern réfugia [3 ^ ] has been found in an unusual elevated frequency (1 Chalcolithic and 3 Iberian samples: 12.5% and 33.3%, respectively). Moreover, the Chalcolithic period is character­ ized by the possible presence of haplogroup L3, a typical sub- saharian haplogroup [5]. 4. Discussion The high efficiency in DNA recovery obtained indicates that sample preservation mainly depends on the depositional environment rather than on sample age. Moreover, cave environment seems to aid DNA preservation as it maintains temperature in a constant interval over years. Thermal history has been proved to play an important role in the preservation of other biomolecules as amino acids [6]. The unique haplotype shared by individuals from different chronologies is CRS. However, as this is the more frequent haplotype nowadays, its presence alone does not allow us to infer the existence of genetic continuity through those periods. Despite the reduced 130 464 C Gamba et al./Forensic Science International: Genetics Supplement Series 1 (2008) 462-464 Table 2 Obtainec results Sample Arch, site Period Haplotype Haplogroup IM P I Malpaso cave Chalcolithic 16223T, 16325C, 16362C D 4MP12 Malpaso cave Chalcolithic 16298C* V 2MP4 Malpaso cave Chalcolithic 16218T, 16223T L3? IJOl Jovellus sepulchre Chalcolithic 16218% 16223Y L3? lA V I Assud de Villareal, 2nd sepulchre Chalcolithic 16218% 16223Y L3? COSTl Costa Lloguera sepulchre Chalcolithic 16293R* H(60% ) COST3 Costa Lloguera sepulchre Chalcolithic 16223Y L3a? C0ST4 Costa Lloguera sepulchre Chalcolithic CRS H IM N l Maçanet cave Bronze Age CRS H CB2 Castellet de Bemabé Iberian 16163G, 16186T, 16189C, 16250% 16294T, 16301Y T1 LVl Los Villares Iberian 16298C V PB 14 Puig de la Nau Iberian 16293T, 16298C V PB18 Puig de la Nau Iberian CRS H PB 19 Puig de la Nau Iberian CRS H PB20 Puig de la Nau Iberian 16293T, 16298C V TORRl Torrelo Bonerot Iberian 16223T, 16292% 16295% 16304% 1631 lY w TORR2 Torrelo Bonerot Iberian 16223T, 16292% 16295% 16304Y w TSM l Tossal de Sant Miquel Iberian CRS* H? TSM2 Tossal de Sant Miquel Iberian 16224% 16234% 16311Y K 1MAR2 Mas d’Arago Roman CRS H Indicitcs the failure of the recovery of the first fragment. amoun. of samples, some interesting conclusions regarding to the ancient Iberian genetic background could be drawn. Haplogroup V is considered to have originated at the Cantabrian fringe during the last Ice Age, from which it is though to have expanded northwards after the ice retreat ~ 10,010-15,000 YBP [3-4]. However, ancient DNA analysis failed ta detect this haplogroup in ancient Basque population [7]. Its presence in Eastern Spain in Chalcolithic and Iberian periods could be explained as a result of prehistoric migrations from tie north, but also this fact could be indicating a more southern distribution of Palaeolithic ice réfugia. The present work also suggests the presence of a prehistoric African genetic background in eastern Iberia. The existence of genetic African lineage» in prehistory has been ascertained in other North Iberian populations also in CalcoUthic period [2-8]. Together these results point out at a pre-Calcolithic migration from Africa nto Iberia with subsequent genetic replacement. Acknowledgments This work has been funded by the Research Project CGL2C06-07828/BOS of the Spanish Ministry of Education and by he Davalos Fletcher Foundation— Fine Arts Museum of Castellon. Conflict of interest None. References [1] I. Barandiaràn et al., Prehistoria de la Peninsula Ibérica, Ariel Prehistoria, 4th edition, 2004. [21 E. Fernandez, Polimorfismos de DNA mitocondrial en poblaciones anliguas de la Cuenca Mediteninea, Ph.D. Thesis, University of Barcelona, 2005. [3] A. Torroni, et al., MtDNA analysis reveals a major late Paleolithic population expansion from south-western to north-eastern Europe, Am. J. Hum. Genet. 62 (1998) 1137-1152. [4] A. Torroni, et al., A signal, from human mtDNA, of postglacial recoloniza­ tion in Europe, Am. J. Hum. Genet. 69 (4) (2001) 844-852. [51 A. Salas, et al.. The making of the African mtDNA landscape. Am. J. Hum. Genet. 71 (5) (2002) 1082-1111. [61 T. Torres, et al.. Bear dentine aspartic acid racemization analysis; a proxy for the dating of Pleistocene cave infills. Archaeometry 44 (3) (2002) 417- 426. [71 N. Izaguirre, C. de la Rua, A mtDNA analysis in ancient Basque popula­ tions: implications for haplogroup V as a marker for a major paleolithic expansion from southwestern Europe, Am. J. Hum. Genet. 65 (1) (1999) 199-207. [81 A. Alzualde, et al.. Insights into the “isolation” of the Basques: Mtdna, Am. J. Phys. Anthropol. 130 (3) (2006) 394-404. 131 132 ACTUALIZAClÔN - ARTi'CULO 4 El conjunto de muestras analizadas en el ARTICULO 4 fue posteriormente ampiiado, aumentando el numéro de individuos de cada période. Ademàs, los resultados obtenidos fueron analizados segün los criterios de autenticidad y el enfoque computacional descritos en el ARTICULO 3. Se adjuntan los siguientes anexos con los resultados genéticos y computacionales: - Tabla A l: Haplotipos y haplogrupos validados. - Tabla A2: Distancias genéticas (Fst) entre las poblaciones estudiadas. - Anexo I: Figuras de las comparaciones entre Fst observadas y simuladas. - Anexo II: Alineamiento de las secuencias clonadas. 133 TABLAS Tabla A l. Haplotipos y haplogrupos mitocondriaies. Tossel Sent Miquel fberos (Edad Hierro) del Siglo IV-III a.C. TSM2 16311C 10550G K Los Villeres Iberos (Edad Hierro) del Siglo IV-III a.C. LVl 16298C 4580G HVO Puig de la Nau Iberos (Edad Hierro) del Siglo V a.C. PB14 16293T16298C 4580G HVO Puig de le Nau Iberos (Edad Hierro) del Siglo V a.C. PB20 16293T 16298C 4580G HVO Maçanet Edad de los Metales (Bronze Age) 1.500-1000 a.C. IM N 16069T 16126C 13708A J Mas d'Abad Edad de los Metales (Bronze Age) 1.500-1000 a-.C. 3MA 16189C 16224C 16311C 105S0G K Sepulcre Segond de la Costa Edad de los Metales (Chalcolithic) 2500-2000 a.C. COSTl 16136C 16192T 16270T 16304C 3197C 7028T 10398A 10873T 10400C U53b Sepulcre Segond de la Costa Edad de los Metales (Chalcolithic) 2500-2000 a.C. C0ST4 CRS 4580G 7028T 14766C HV Torre d'en Domenèch Edad de los Metales (Calcoli'tico) 2500-2000 a.C. ITD 16224C 16311C 105S0G K Cova de Malpaso Edad de los Metales (Cakolitico) 2500-2000 a.C. IM P 16223T 16362C 10873T 10400C 14766T N* Raco de Race Edad de los Metales (Calcoli'tico) 2500-2000 a.C. RRl 16189C 16223T 16278T 6371T 10873T 14766T X2 Assud de Villarreal Edad de los Metales (Calcoh'tico) 2500-2000 a.C. lAV 16298C 4580A V Tabla A2. Distancias genéticas (Fst) entre las poblaciones analizadas. fbera Edad d e los Neoh'tica Neoh'tica Metales Media Antigua Edad de la Pobladôn Moderne Moderne 0,18525 Eded de los Meteles 0,02232 0,10307 Neolitice Medie 0,012610,23213 0,18178 Neolitice Antigue 0,12978 0,22252 0,02577 0,10417 134 ANEXO Figura A l. Probabilidad de obtener Fst simulados mayores que los Fsj observa dos entre la poblaciôn m oderna (Garcia e t al., 2011) y la de la Ibera (ARTICULO 4), en todos los rangos de Ngexplorados y en correspondencia de los très modelos (TM P, SM, SDGM ). - 0 05 - 0.04 - 0.03 - 0.02 1010 - - 0.011010 - - 0.00 200 20200 40200 60200 80200 200 20200 40200 60200 80200 Neolithic Ne Figura A2. Probabilidad de obtener Fsj simulados mayores que los Fsyobservados entre la poblaciôn moderna (Garcia et al., 2011) y la de la Edad de los Metales (ARlfCULO 4), en todos los rangos de Ne explorados y en correspondencia de los très modelos (IMP, SM, SDGM). I TPM 4010 - 3010 - 2010 - 1010 — 10 SM 3010 2010 - 1010 - 4010 - 3010 - 2010 - 1010 — 10 SDGM 1---- 1---- 1---- T p 0 05 - 0 04 - 0 03 - 0 02 - 0 01 - 0.00 200 20200 40200 60200 80200 200 20200 40200 60200 80200 200 20200 40200 60200 80200 Neolithic Ne Figura A3. Probabilidad de obtener Fst simulados mayores que los FsTobservados entre la poblaciôn Ibera (ARTICULO l)(Gamba et al., 2008)(Gamba et al., 2008)(Gamba et al., 2008)(Gamba et al., 2008) y la de la Edad de los Metales (ARTICULO 4), en todos los rangos de Ne explorados y en correspondencia de los très modelos (TMP, SM, SDGM). TPM0)z 4010 - 3010 - l 2010 I 1010 SM SDGM 4010 - 4010 - 3010 - 3010 - 2010 - 2010 - 1010 - 1010 - - 0.05 - 0 04 - 0.03 - 0 02 - 0.01 - 0.00 200 20200 40200 60200 80200 200 20200 40200 60200 80200 200 20200 40200 60200 80200 Neolithic Ne 135 Figura A4. Probabilidad de o b ten er Fst simulados m ayores que los Fsj observados en tre la poblaciôn Neolitica M ed ia (Sam pietro e t al., 2007) y la Ibera (ARTfCULO 4), en todos los rangos de Ngexplorados y en correspondencia de los très m odelos (TM P , SM , SDG M ). - 0.05 - 0,04 - 0 03 - 0.02 - 0.011010 -1010 - 1010 - - 0.00 200 20200 40200 60200 60200 200 20200 40200 60200 60200 Neolithic Ne 200 20200 40200 60200 60200 Figura AS. Probabilidad de obtener Fst simulados mayores que los Fst observa dos entre la poblaciôn Neoiftica Antigua (ARTICUL05) y la Ibera (ARTfCULO 4) en todos los rangos de Ng explorados y en correspondencia de los très modelos (TMP, SM, SDGM). - 0.05 W - 0.04 - 0 03 - 0 02 - 0 01 - 0.00 200 20200 40200 60200 60200 200 20200 40200 60200 60200 Neolithic Ne Figura A6. Probabilidad de obtener Fst simulados mayores que los Fst observados entre la poblaciôn Neoiftica Media (Sampietro et al., 2007) y la de la Edad de los Metales (ARlfCULO 4), en todos los rangos de Ng explorados y en correspondencia de los très modelos (TMP, SM, SDGM). TPM 4010 - 3010 - ë "S 2010 Q- ^ 1010 SDGMSM 40104010 - 3010 -3010 - 2010 -2010 - 1010 -1010 - 200 20200 40200 60200 60200 200 20200 40200 60200 60200 200 20200 40200 60200 60200 p 0 05 - 0.04 - 0 03 - 0.02 - 0.01 - 0 00 Neolithic Ne 136 Figura A 7. Probabilidad de o b ten er Fst simulados mayores que los Fsj observados entre la poblaciôn N eolitica Antigua (ARTfCULO 5) y la de la Edad de los M eta les (ARTÎCULO 4 ), en todos los rangos de Ng explorados y en correspondencia de los très m odelos (TM P, SM , SDGM ). SM SDGMTPM - 0.05 - 0.04 - 0.03 - 0.02 - 0.01 - 0.00 700 20200 40200 00200 00200 200 20200 40200 00200 00200 Neolithic Ne 200 40200 60200 60200 137 A N E X O Alineamiento de las secuencias clonadas Las secuencias estan identificadas por el nombre de la muestra, el numéro de extracciôn, el de amplificaciôn, el par de cebadores y el numéro del don o la sigla "dir" (secuencia directa). Las secuencias siguen el mismo orden de individuos listados en las Tablas 1 y SI. Los colores identifican los haplotipos descartados (gris = contaminacion por parte del personal del laboratorio/arqueôlogos/antropôlogos, naranja = contaminacion entre muestras) y en azul se destaca el fenômeno de Jumping PCR. DISPONIBLE EN EL CD PROPORCIONADO JUNTO CON ESTA TESIS DOCTORAL. 138 UPDATE - ARTICLE 4 Sample size analysed in the ARTICLE 4 has been extended, increasing the number of individual per each period. Moreover, the results obtained have been analysed following the criteria of authenticity and the computational approach described in the ARTICLE 3. Genetic and computational results are included in the following Appendix: - Table A l: Validated haplotypes and haplogroups. - Table A2: Genetic distances (Fst) among the populations compared. - Appendix I: Comparison between observed and simulated Fsj. - Appendix II: Cloned sequences alignment. 139 TABLES Table A l. Mitochondrial haplotypes and haplogroups. 2 3 = Tossal Sant Miquel Iberic (Iron Age) IV-III Centuries B.C. TSM2 16311C 10550G K Los Villares Iberic (Iron Age) IV-III Centuries B.C. LVl 16298C 4580G HVO Puig de la Nau Iberic (Iron Age) V Century B.C. PB14 16293T 16298C 4580G HVO Puig de la Nau Iberic (Iron Age) V Century B.C. PB20 16293T 16298C 4580G HVO Maçanet Metal Age (Bronze Age) 1.500-1000 B.C. IM N 16069T 16126C 13708A J Mas d'Abad Metal Age (Bronze Age) 1.500-1000 B.C. 3MA 16189C 16224C 16311C 10550G K Sepulcre Segond de la Costa Metal Age (Chalcolithic) 2500-2000 B.C. COSTl 16136C 16192T 16270T 16304C 3197C 7028T 10398A 10873T 10400C U53b Sepulcre Segond de la Costa Metal Age (Chalcolithic) 2500-2000 B.C. C0ST4 CRS 4580G 7028T 14766C HV Torre d'en Domenèch Metal Age (Chalcolithic) 2500-2000 B.C. ITD 16224C 16311C 10550G K Cova de Malpaso Metal Age (Chalcolithic) 2500-2000 B.C. IM P 16223T 16362C 10873T 10400C 14766T N* Raco de Raca Metal Age (Chalcolithic) 2500-2000 B.C. RRl 16189C 16223T 16278T 6371T 10873T 14766T X2 Assud de Villarreal Metal Age (Chalcolithic) 2500-2000 B.C. lAV j16298C 4580A V Table A2. Genetic distances (Fst) among the populations compared. Age of the population Modern Iberic Metal Age Middle Early Neolithic Neolithic Modem 0,18525 Meta! Age 0,02232 0,10307 Middle Neolithic 0,012610,23213 0,18178 Early Neolithic 0,12978 0,22252 -0,02577 0,10417 140 A P P E N D IX I Figure A l. Probability of obtaining simulated Fst greater than observed between modern (Garcia et al., 2011) and Iberic populations (ARTICLE 4), for all Ng ranges explored and in correspondence of the three demographic models tested (TMP, SM, SDGM). Values higher than 0.05 are in white. z 4010 — S I S 3010 - 8 (S 2010 - Q. « 1010 - a 3 10 - - 0 05 - 0,04 - 0 03 - 0 02 - 0.011010 - - 0.00 200 20200 40200 «0200 «200200 20200 40200 «0200 «200 200 20200 40200 « 2 « « 2 « Neolithic Ne Figure A2. Probability of obtaining simulated Fst greater than observed between modern (Garcia et al., 2011) and Metal Age populations (ARTICLE 4), for all Ng ranges explored and in correspondence of the three demographic models tested (TMP, SM, SDGM). Values higher than 0.05 are in white. TPM ■TA, 68 %), como apuntan otros autores (Brotherton et al., 2007; Gilbert et al., 2007). Las consideraciones sobre la contaminacién y la replicaciôn de los resultados aquf descritos ponen de manifiesto la gran importancia en la obtenciôn de todos los perfiles de los manipuladores para poder descartar su perfil del consenso. También juega un papel importante el rastreo de las tandas de extracciôn y amplificaciôn de las muestras, para poder identificar fenômenos de carry-over. Sin embargo, la contaminaciôn ambiental représenta el tipo de contaminante mas diffcil de determiner ya que se desconoce su origen. Los resultados obtenidos en la présente tesis doctoral apuntan a que se trata de moléculas flotantes présentes en el ambiente de trabajo, pues este tipo de contaminaciôn no es replicable. Es a este nivel que la replicaciôn de los resultados inter-laboratorio juega un papel importante, permitiendo identificar el haplotipo consenso y detectar las contaminaciones ambientales de un laboratorio concreto. 208 DISCUSION DISCUSION DE LOS OBJETIVOS ESPECIFICOS - ESTUDIO DIACRÔNICO-POBLACIONAL D.4 Estimaciôn de la continuidad/discontinuidad genética entre los pobladores prehistôricos (neoliticos, calcoliticos, de la Edad del Bronce e iberos) y actuales del noreste de la Peninsula îbérica (Comunidad Valenciana, Cataluna y Aragon) y evaluaciôn del impacto genético del Neolitico en esta misma ârea. La continuidad o discontinuldad genética entre los pobladores del noreste de la Peninsula Ibérica ha sido evaluada desde diferentes perspectivas a lo largo del desarrollo de la présente tesis doctoral. Por un lado se ha analizado la composiciôn de haplotipos y haplogrupos mitocondriales de las diferentes poblaciones estudiadas. Por otro lado se han cuantificado las aportaciones de los distintos pobladores mediante métodos estadfsticos y computacionales. D . 4 . 1 C O M P A R A C l Ô N D E LA C O M P O S I C I Ô N D E H A P L O T I P O S Y H A P L O G R U P O S D E L A S P O B L A C I O N E S N EO Ll 'TI CA S, C A L C O L i T I C A S , D E LA E D A D D E L B R O N C E E Î B E R A S D E L N O R E S T E P E N I N S U L A R E N T R E SI Y C O N O T R A S P O B L A C I O N E S , A N T I G U A S Y A C T U A L E S , D E LA M I S M A R E G I Ô N ( A R T i C U L O S 3 Y 4 ) Para la interpretaciôn de los resultados en un contexto diacrônico, se compararon los haplotipos y los haplogrupos obtenidos en los diferentes periodos estudiados entre si y también con aquellos descritos en la literatura y procedentes de la misma regiôn, el noreste peninsular. Puesto que los resultados aqui discutidos se analizaron separadamente en dos articulos incluidos en la présente tesis doctoral (ARTICULOS 3 y 4) se vuelven a presentar todos los resultados en la Tabla D 5 de este apartado a fin de llevar a cabo una valoraciôn conjunta de los mismos. Ademas, se presentan en la Tabla D 6 todos los haplotipos compartidos entre las poblaciones estudiadas y las poblaciones antiguas 209 Cristina Gamba disponibles en la literatura con las que se han comparado los resultados. En la Figura D 2 también se muestran las frecuencias de haplogrupos con fines comparatives. Se incluyen aquellas que proceden de la misma region geografica correspondientes ai Neolitico Medio (Sampietro et al., 2007) y pertenecientes al periodo ibero (Sampietro et al., 2005), asi como otras poblaciones mesoliticas y neoliticas centroeuropeas (Haak et al., 2005, 2010; Bramanti et al., 2009), de! norte de Europa (Malmstrôm et al., 2009) y del Sur de Francia (Lacan et al., 2011; Deguilloux et al., 2011 b). Se agruparon las muestras estudiadas en très periodos (Neolitico Antiguo, Edad de los Metales e iberos) para que cada grupo alcanzara un numéro minimo de 4 individuos. Por otra parte, a pesar de que la cronologia de los iberos se incluya dentro de la Edad de los Metales (mas concretamente en la Edad del Hierro), se consideraron como un grupo poblacional diferente debido a su reciente cronologia y a otros factores reiacionados con los rituales de enterramiento. Las costumbres funerarias iberas se caracterizaban por la cremacion de los cuerpos. Las muestras analizadas pertenecen a aquella pequeha fracciôn de poblaciôn que tuvo un tratamiento diferente, puesto que para un analisis exitoso de ADN antiguo es necesario emplear huesos y dientes no quemados. Mas concretamente, las muestras procedentes de Los Villares y de Tossal de Sant Miquel se corresponden con individuos infantiles, mientras que las de Puig de la Nau son individuos adultos. En el caso de las inhumaciones infantiles, se ha sugerido en la literatura que se podria tratar de ritos propiciatorios o de protecciôn de la ciudad 0 de la familia, que podrian incluso implicar el sacrificio humano (Oliver Foix, 2004; Barrial Jove, 1990). La localizaciôn de restos animales en los mismos lugares de enterramientos infantiles apoyaria su caracter sacrificial (Oliver Foix, 2004). En lo que concierne a los individuos adultos no incinerados, existen varias hipôtesis alternativas. Es posible que se tratara de un sacrificio, como en el caso de los individuos infantiles, o de una "mala muerte", expresiôn acunada en los ahos 90 (Dedet, 1992) y que hace referenda a aquellas muertes acontecidas de manera inusual para la sociedad. En el caso concreto del yacimiento de Puig de la Nau, la presencia de individuos adultos no incinerados esta asociada a muertes violentas, mas concretamente al culto de las cabezas cortadas (ritual de origen celta que consiste en 210 DISCUSION cortar la cabeza del enemigo y exponerla como trofeo) y a la exposiciôn pùblica de los cuerpos (Oliver Foix, 2004). Todo ello podria indicar que se trataba de una poblaciôn foranea enemiga. Por otro lado, entre Calcolitico y Edad del Bronce no hay referencias arqueolôgicas que sugieran movimientos poblacionales importantes ni de ritos funerarios diferenciales y por esta razôn ambos periodos se incluyeron en el mismo grupo poblacional: la Edad de los Metales. En lo que concierne al Neolitico Antiguo se agruparon las poblaciones Cardiales y Post-Cardiales, puesto que ambas estan ligadas a las primeras fa ses de desarrollo del Neolitico en la Peninsula. En el caso concreto del yacimiento epicardial estudiado aqui (San Pau del Camp) también se registreron niveles cardiales en el mismo yacimiento, pero carentes de restos humanos. 211 Cristina Gamba Tabla D 5 Tabla resum en de los resu ltados ob ten idos en los ARTICULOS 3 y 4 (respectivam ente Tabla A l y Tabla 1). Los hap lo tipos coïncidentes estan m arcados con el m ism o co lo r (de n tro de esta tab la y con la Tabla D 6). Tossal Sant Miquel Edad del Hierro Siglo IV-III a.C. TSM2 16311C 10550G K p Los Villares Edad del Hierro Siglo IV-III a.C. LVl 16298C 4580G HVO I Puig de la Nau Edad del Hierro Siglo V a.C. PB14 16293T 16298C 4580G HVO Puig de la Nau Edad del Hierro Siglo V a.C. PB20 16293T 16298C 4580G HVO Maçanet Edad del Bronce 1.500-1000 a.C. IM N 16069T 16126C 13708A J Mas d'Abad Edad del Bronce 1.500-1000 a-.C. 3MA 16189C 16224C 16311C 10550G K Sepulcre Segond de la Costa Calcolitico 2500-2000 a.C. COSTl 16136C 16192T 16270T 16304C 3197C 7028T 10398A 10873T 10400C U5b3 1 5 % Sepulcre Segond de la Costa Calcolitico 2500-2000 a.C. C0ST4 CRS 4580G 7028T 14766C HV -2 Q) T5 Torre d'en Domenèch Calcolitico 2500-2000 a.C. ITD 16224C 16311C 10550G K Cova de Malpaso Calcolitico 2500-2000 a.C. IM P 16223T 16362C 10873T 10400C 14766T N* Racô de Raca Calcolitico 2500-2000 a.C. RRl 16189C 16223T 16278T 6371T 10873T 14766T X2 Assud de Villarreal Calcolitico 2500-2000 a.C. lAV 16298C 4580A V Sant Pau del Camp Neolitico Epicardial 4.250-3.700 a.C. 6SP0102 16224C 16311C 10550G K Sant Pau del Camp Neolitico Epicardial 4.250-3.700 a.C. 26SP0102 16218T 16328A (16362C) 7028C H20 Sant Pau del Camp Neolitico Epicardial 4 250-3.700 a.C. 27SP0102 ,16147T16223T15362C 7028T 10238T 10873T N* Chaves Neolitico Cardial 5.329-4.999 a.C. 1CH0102 16224C 16311C 10550G K Chaves Neolitico Cardial 5.329-4.999 a.C. 2CH0102 CRS 7028C H o Chaves Neolitico Cardial 5.329-4.999 a.C. 3CH01 16129A 7028C H î s Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA0511 16223T 16362C 4833A 5178C 10238T 10398A 10400C 10873T N* S z Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA09 16223T 16362C 4833A 5178C 10238T 10398A 10400C 10873T N* Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA152223 16224C 16311C 10550G K Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA16 16362C 7028C H Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA24 16136C 16192T 16270T 3197C 14766T US* Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA26 16183C 16189C(het) 16223T 16278T 1719G 6371GT 7028T X I Can Sadurni Neolitico Cardial 5.475-5.305 a.C. CSA29 16147T 16223T 16362C 10238T 10398A 10400C 10873T N* 212 DISCUSION Tabla D 6 Haplo tipos com partidos en tre las m uestras estudiadas y las d isponib les en la lite ra tu ra . Se marcan las coincidencias de haplotipos con los m ismos colores em pleados en la Tabla D 5. 16298C Treilles Francia Neolitico Final 10,34 % (3/29) Lacan et al., 2011 Derenburg, Halberstadt Alemania Neolitico LKB 4,76 % (2/42) Haak et al., 2010 16069T 16126C Treilles Francia Neolitico Final 20,69 % (6/29) Lacan et al., 2011 Cami de Can Grau Espana Neolitico Medio 18,18 % (2/11) Sampietro et al., 2007 Derenburg, Seehausen Alemania Neolitico LKB 7,14 % (3/42) Haak et al., 2005 y 2010 Ostorf Alemania Mesolitico (3000 a.C.) 4,54 % (1/22) Bramanti et al., 2009 16224C 16311C Treilles Francia Neolitico Final 6,89 % (2/29) Lacan et al., 2011 Derenburg, Flomborn Alemania Neolitico LKB 7,14 % (3/42) Haak et al., 2005 y 2010 Ostorf Alemania Mesolitico (3200 a.C.) 4,54 % (1/22) Bramanti et al., 2009 Ilia d'en Reixac Espana l'bero 5,88 % (1/17) Sampietro et al., 2005 CRS Fralsegârden Suecia Neolitico TRB (3.500-2.500 a.C.) 33,33 % (1/3) Malmstrôm et al., 2009 Hohier Fels Alemania Magdaleniense (13.400 a.C.) 4,54 % (1/22) Bramanti et al., 2009 Ilia d'en Reixac Espana fbero 5,88 % (1/17) Sampietro et al., 2005 Treilles Francia Neolitico Final 20,69 % (6/29) Lacan et al., 2011 Cami de Can Grau Espana Neolitico Medio 27,27 % (3/11) Sampietro et al., 2007 Derenburg, Eilsieben, Asparn Schletz Alemania Neolitico LKB 9,52 % (4/42) Haak et al., 2005 y 2010 16183C 16189C 16223T 16278T Treilles Francia Neolitico Final 10,34 % (3/29) Lacan et al., 2011 16311C Derenburg, Flomborn Alemania Neolitico LKB 9,52 % (4/42) Haak et al., 2005 y 2010 Ajvide Mar Baltico Mesolitico PWC (2.800- 2.000 a.C.) 10,52 % (2/19) Malmstrôm et al., 2009 D .4 .1 .1 C O M P O S IC IO N H A P L O T IP IC A DE LAS P O B LA C IO N E S En el conjunto de muestras analizadas destaca la elevada diversidad haplotipica: sobre un total de 25 especimenes analizados y validados, se encontraron 15 haplotipos 213 Cristina Gamba ünicos (79 %) y 4 compartidos (21 %). En funciôn de la distribuclôn de los haplotipos compartidos se realizaron inferencias a nivel familiar y poblacional. Por ejemplo, el haplotipo 16224C 16311C résulta compartido por dos individuos neoliticos cardiales de dos yacimientos diferentes (1CH0102 y CSA152223), un espécimen neolitico epicardial (6SP0102) y otro calcolitico (ITD). Esto indica que se trata de un tipo mitocondrial que estaba présente en el Peninsula Ibérica al menos desde el comienzo del Neolitico. También se ha hallado en otra muestra ibera de la misma region (5,88 %) (Sampietro et al., 2005), en dos muestras neoliticas finales francesas (6,89 %) (Lacan et al., 2011), asf como en el 7,14% de muestras neoliticas (Haak et al., 2005, 2010) y en una muestra mesolitica (4,54 %) de dataciôn reciente (3.200 a.C.) (Bramanti et al., 2009) de Europa central (ver Tabla D 6). Teniendo en cuenta que se ha detectado en diferentes periodos a pesar del reducido numéro de muestras, esto podria indicar cierta frecuencia y continuidad de este haplotipo en la Peninsula Ibérica y en Europa. Esta continuidad se ve confirmada por su presencia en la poblaciôn actual de la regiôn estudiada, asi como en Europa, con frecuencias del 6 % (Garcia et al., 2011) y 3 % (Richards et al., 2000) respectivamente. Dos individuos iberos (PB14 y PB20) podrian estar emparentados a lo largo de la Imea materna puesto que comparten el haplotipo 16293T 16298C y proceden del mismo yacimiento. Para inferir probabilidades de relaciones familiares es necesario conocer la composiciôn genética de la poblaciôn de origen y mas concretamente la frecuencia del haplotipo en cuestiôn. Sin embargo, el hecho de que no haya sido posible detectar este haplotipo especifico en las demas poblaciones antiguas comparadas (ver Tabla D 6), en la poblaciôn europea actual (Richards et al., 2000; Parson et al., 2004; Lee et al., 2008) y en el noreste de la Peninsula Ibérica (Garcia et al., 2011), incrementa la probabilidad de una relaciôn directa entre los dos individuos a lo largo de la linea materna. Una situaciôn parecida afecta a las muestras CSA09 y CSA152223 del yacimiento de Can Sadurni, que comparten el haplotipo 16223T 16362C. En este caso, ademas, el 214 DISCUSION analisis antropolôgico (Blasco et al., 2005; Cabellos, 2008) indica que se trata de un individuo infantil y otro adulto respectivamente. Como en el caso precedente, se trata de una variante mitocondrial no representada en la poblaciôn antigua y actual de la regiôn de procedencia y tampoco a nivel europeo, apuntando a la posibilidad de que se trate de dos individuos reiacionados a lo largo de la Imea materna. Otro haplotipo no representado en las poblaciones actuales es el 16147T 16223T 16362C, que es compartido por los individuos 27SP0102 (Sant Pau del Camp) y CSA29 (Can Sadurni). Como ocurre para los dos casos anteriores, tampoco se encuentra representado en las poblaciones modernas y antiguas con las que se ha comparado. Estos datos apuntan a la presencia de continuidad genética entre el Neolitico Cardial y el sucesivo Epicardial de la misma regiôn geografica. Ademas, como ya se ha comentado en el Apartado D.4.1, el yacimiento de Sant Pau del Camp présenta niveles cardiales, carentes de restos humanos. Alternativamente, estos resultados podrian indicar que ambas poblaciones compartieran un mismo sustrato poblacional. Se trata de dos yacimientos separados por una distancia de 20 Km, mucho mas cercanos entre si que al yacimiento neolitico cardial de Chaves, localizado aproximadamente a 200 Km de ambos. D .4 .1.2 C O M P O S IC IO N DE HAPLOGRUPOS DE LAS POBLACIONES Pasando al analisis de haplogrupos, se observa como el total de los 19 haplotipos se asigna a 9 haplogrupos (ver Tabla D 5). En este caso también merece la pena analizar aquellos compartidos (4) y ünicos (5) en una perspectiva filogenética. El haplogrupo mas representado es el K, que se encuentra en todos los grupos poblacionales y periodos analizados, puesto que lo comparten 2 individuos neoliticos cardiales, 1 epicardial, 1 calcolitico, 1 de la Edad del Bronce y otro ibero. Como ya se apuntô para el haplotipo 16224C 16311C, que es el haplotipo raiz del haplogrupo K y el mas frecuente, se podria tratar de un marcador de continuidad genética entre los periodos estudiados. Se trata de un haplogrupo tipicamente europeo, que présenta una frecuencia del 9 % en la poblaciôn actual (Richards et al., 2000). 215 Cristina Gamba Ademas, este haplogrupo présenta una elevada frecuencia en muestras neoliticas aceramicas de Proximo Oriente, previamente estudiadas por nuestro grupo de investigacion (Fernandez, 2005). En este sentido, la elevada frecuencia del haplogrupo K en estas regiones podria estar revelando una conexion demografica entre ellas. El haplogrupo K se ha detectado en una sola muestra mesolitica de Alemania (Bramanti et al., 2009), representando el 4,54 % de la poblaciôn estudiada (ver Figura D 2). Sin embargo, esta muestra esta asociada a una dataciôn muy reciente (3.200 a.C.) (Bramanti et al., 2009). Aunque este haplogrupo estuviera presente en los pobladores mesoliticos europeos antes de la llegada del Neolitico, la elevada frecuencia del K en las muestras analizadas podria apuntar a un incremento de su frecuencia debido a la llegada de nuevos pobladores. Su elevada frecuencia en muestras neoliticas de Europa Central (~12 %) résulta compatible con esta hipôtesis (Flaak et al., 2005, 2010). Este haplogrupo se encuentra también representado en periodos posteriores, siendo su frecuencia del 7% en la poblaciôn neolitica final de Treilles (Francia) (Lacan et al., 2011) y del 44 % en el conjunto de enterramientos multiples de la cultura calcolitica de la ceràmica cordada de Eulau, Alemania (Haak et al., 2008) (ver Figura D 2). Sin embargo, desde la genética de poblaciones actuales, no se ha sugerido una conexiôn del haplogrupo K con la expansiôn neolitica, sino que se han propuesto como marcadores neoliticos los haplogrupos J, I l y U3, debido a la asociaciôn entre este periodo y su dataciôn molecular (Richards et al., 2000). Como se puede observar en el caso de las muestras analizadas en la présente tesis doctoral, ninguno de ellos esta representado en las muestras neoliticas. Solamente se detectô un haplogrupo J en una muestra de la Edad del Bronce (IMN del yacimiento de Maçanet, ver Tabla D 5), varios miles de ahos posterior. Entre las otras muestras neoliticas analizadas por otros autores, es posible encontrar un solo représentante del haplogrupo U3 (2 %) en Europa central (Haak et al., 2005, 2010), y ningün T1 (ver Figura D 2). 216 DISCUSION Figura D 2 G réfico de la d is tribuc iôn de haplogrupos en las poblaciones antiguas con las que se han com parado los datos de la présente tesis. Referencias b ib liogrâficas: Calcolitico Centro Europa (CWC) [Haak et al. 2008], Iberos G irona, Espana [Sam pietro e t al. 2005], N eo litico A n tiguo Centro Europa (LBK) [Haak et al. 2005, 2010], M eso litico C entro Europa [B ram anti e t al. 2009], N eo litico Final Francia [Lacan e t al. 2011], N eo litico M ed io Barcelona, Espana [Sam pietro et al. 2007], N eo litico M ed io Francia [Deguilloux e t al. 2011], M eso litico N orte de Europa [M a lm strôm e t al. 2009], N eo litico N orte de Europa [M a lm strôm e t al. 2009]. 35 30 25 20 15 10 I t 0 H HV HVO 1 J K Nia RO T U U3 U4 U 4/ H lb U5 V W X2 ■ Neolitico Norte de Europa 1 1 1 ■ Mesolitico Norte de Europa 2 2 6 6 1 ■ Neolitico Medio Francia 1 1 1 ■ Neolitico Medio Barcelona, Espana 4 1 2 2 1 1 ■ Neolitico Final Francia 6 2 6 2 2 1 5 1 4 ■ Mesolitico Centro Europa 1 1 2 2 2 14 ■ Neolitico Antiguo Centro Europa (LBK) 7 3 3 7 6 10 1 1 2 2 ■ (berosGirona, Espana 9 2 1 1 1 1 2 ■ Calcolitico Centro Europa (CWC) 1 1 4 1 2 En cambio, el haplogrupo J se encuentra en un 18% de las muestras del Neolitico Medio de la provincia de Barcelona (Sampietro et al., 2007), en el 7 % de las muestras del Neolitico LBK de Europa central (Haak et al., 2005, 2010), en una de las très muestras neoliticas del norte de Europa (Malmstrôm et al., 2009) y en el 20% de muestras del Neolitico Final del yacimiento francés de Treilles (Lacan et al., 2011) (ver Figura D 2). 217 Cristina Gamba Los haplogrupos T1 y U3 tampoco estan representados en las poblaciones mesoliticas del norte y centro Europa. Mientras que el haplogrupo J esta présente en el 5 % de estas poblaciones (un individuo de Europa central y uno de Europa septentrional, ver Tabla D 6) (Bramanti et al., 2009; Malmstrôm et al., 2009) (ver Figura D 2). Estos resultados sugieren que el haplogrupo J quizas no estuviera necesariamente asociado a la llegada de nueva poblaciôn neolitica. Hay que tener en cuenta, sin embargo, que algunos de los individuos de cultura mesolitica citados estan asociados a una dataciôn muy reciente (airededor de 3.000 a.C.), momento en el cual la cultura neolitica ya se habia expandido pràcticamente por toda Europa. Una hipôtesis alternative séria que en este caso concreto se trata se de inmigrantes neoliticos que cambiaron su estilo de vida para adaptarse al entorno volviendo a una economia de caza y recolecciôn. Sin embargo, a la luz de estos resultados cabe la posibilidad de replantear las inferencias filogenéticas basadas en la genética de poblaciones actuales acerca de las contribuciones neoliticas al acervo europeo actual. En primer lugar, como ya se ha comentado en el Apartado I.4.1.2, la asociaciôn entre la dataciôn molecular de un haplogrupo no tiene por que coincidir con su expansiôn. En segundo lugar, las dataciones moleculares suelen estar asociadas a amplios rangos de error estandar (ver Figura 111). Ademas, no hay acuerdo en la comunidad cientifica acerca de la precisiôn de los métodos de dataciôn molecular del mtDNA (Bandeit, 2007; Ho et al., 2007; Howell et al., 2008), puesto que no es posible realizar una calibraciôn adecuada (Pulquério y Nichols, 2007) y existen discrepancies entre los datos estimados a partir de pedigrees y los de analisis filogenéticos (Howell et al., 2008). El segundo haplogrupo mas representado en las poblaciones estudiadas es el N*, que caracteriza principalmente las poblaciones del Neolitico Cardial y Epicardial, pero también se detectô en un individuo de época calcolitica. Se trata de un haplogrupo muy particular que actualmente se encuentra présente en Europa Oriental (poblaciôn Serbia, 1,71 %) y en poblaciones de Prôximo Oriente (2 % de media) asi como en poblaciôn judia askhenazi europea (0,32 %) y de Prôximo Oriente (1,68 %) (para mas detalles y referencias bibliogrâficas ver Tabla S3 del ARTICULO 3), pero que no esta representado en ninguna otra poblaciôn europea. Sin embargo, un espécimen de Cro- 218 DISCUSION Magnon de hace 25.000 ahos localizado en el Sur de Italia fue clasificado como perteneciente a este haplogrupo, aunque el elevado grado de degradaciôn del ADN no permitio la amplificacion de todos los SNPs que caracterizan al haplogrupo N* (Caramelli et al., 2003). El haplotipo de esta muestra es, sin embargo, diferente al encontrado en las muestras IMP, 27SP0102, CSA0511, CSA09 y CSA29. El caso del haplogrupo N* es muy similar al descrito para muestras neoliticas centroeuropeas (Haak et al., 2005), donde también se encontre una frecuencia muy elevada de un haplogrupo actualmente raro en Europa (0.2 %), el Nia (ver Figura D 2). Ambos hallazgos podrian indicar que las primeras poblaciones neoliticas presentaban unos linajes caracteristicos que sucesivamente se perdieron por dériva genética. El hecho de que el N* caracterice a los habitantes del noreste peninsular desde el Neolitico antiguo Cardial hasta el Calcolitico, apunta nuevamente a la presencia de cierta continuidad genética entre los diferentes pobladores, al menos a partir de la llegada de los primeros agricultores. Sin embargo, su sucesiva desapariciôn podria explicarse mediante mecanismos de dériva genética debido a la reducida contribucion genética de la poblaciôn neolitica a los habitantes autôctonos, deducida a partir de los estudios de simulaciôn (ver Apartado D.4.2.1). También el haplogrupo XI, présente en una de las muestras neoliticas cardiales analizadas (CSA26), no se encuentra en muestras europeas actuales pero si en poblaciones de Prôximo Oriente, como sucede con el N* (ver Tabla S3 del ARTICULO 3). Existe la posibilidad de que este haplogrupo, junto con el N* y quizas el K, fuera introducido en la Peninsula Ibérica al comienzo del Neolitico por parte de poblaciones prôximo-orientales. Similitudes encontradas entre los rituales de enterramiento del Neolitico de Prôximo Oriente y del Neolitico Cardial peninsular (Hodder, 2007; Utrilla et al., 2008) apoyan la existencia de una relaciôn entre ambas regiones a inicios del Neolitico. Concretamente, en el caso del yacimiento de Chaves, el individuo 1CH0102 presentaba un ritual de enterramiento tipicamente prôximo-oriental, en posiciôn fetal al fondo de la fosa, con brazos y piernas flexionados y pegados contra el cuerpo. Dicho individuo pertenece al haplogrupo K, lo que viene a reforzar la hipôtesis anteriormente 219 Cristina Gamba planteada de que este pudiera tratarse de un haplogrupo relacionado con las expansiones Neoliticas desde Proximo Oriente. Otro de los haplogrupos representado en mas de un individuo es el H, que se detectô en 4 especimenes (16 %), todos neoliticos (3 cardiales y uno post-cardial). Se trata del haplogrupo europeo mas frecuente en la actualidad, con una frecuencia de airededor del 50 % en Europa (Richards et al., 2000) y del 43 % en la poblaciôn actual del noreste ibérico (Garcia et al., 2011). Ya que actualmente se encuentra altamente representado, es dificil realizar cualquier tipo de inferencia basada en la distribuciôn del mismo. Pero résulta interesante destacar su baja frecuencia en el conjunto de muestras estudiadas (16 %) y su ausencia en los periodos posteriores al Neolitico. Es posible que este haplogrupo no haya sido detectado en dichos periodos porque se estudiô un reducido tamaho muestral. En las muestras iberas y neoliticas estudiadas por Sampietro y colaboradores (Sampietro et al., 2005, 2007) el haplogrupo H es el haplogrupo mas representado (52 % y 36 % respectivamente), pero en muestras neoliticas francesas y centroeuropeas no supera el 20 % (Haak et al., 2005, 2010; Lacan et al., 2011). En conjunto, estos resultados apuntan a que la frecuencia de este haplogrupo en el pasado no habria sido tan elevada en todas las regiones europeas como lo es en la actualidad, y a que esta habria incrementado sucesivamente probablemente debido a fenômenos de dériva genética. Por otra parte, fue posible définir de manera mas especifica el sub-haplogrupo de la muestra 26SP0102 gracias a las mutaciones caracteristicas de su haplotipo (Roostalu et al., 2007). En base a éstas, este haplogrupo fue clasificado como H20. Como en el caso de los haplogrupos N* y XI, este haplogrupo présenta una frecuencia més elevada en Prôximo Oriente (0,56 %) que en Europa (0,18 %) (Richards et al., 2000) y représenta el 2,5 % de los sub-haplogrupos de Prôximo Oriente (Roostalu et al., 2007), con picos de frecuencia en Jordania, Georgia y Siria (Roostalu et al., 2007). Estos datos apoyan nuevamente el flujo génico entre los dos extremos del Mediterrâneo. Ademas del XI, también se pudo identificar un haplogrupo X2 en una muestra calcolitica (RRl). Al contrario del XI, el X2 esta representado, aunque en bajas frecuencias, en todos los continentes. El 97,2 % de los haplogrupos X de Prôximo 220 DISCUSION Oriente, del Caucaso y de Europa pertenecen al sub-haplogrupo X2 asi como el 100 % de los procedentes de Asia Central y Siberia y el 36,8 % de los norteafricanos (Reidia et al., 2003). De acuerdo con la filogeograffa actual de este haplogrupo, se supone que se origino airededor o posteriormente al ultimo màximo glacial (Reidia et al., 2003). De acuerdo con este estudio, el haplogrupo X2 estan'a representado en el sustrato paleolitico de la regiôn. Sin embargo, es importante destacar que hasta la fecha no ha sido encontrado en ninguna muestra pre-Neoh'tica (Bramanti et al., 2009; Malmstrôm et al., 2009). Sin embargo, si ha sido detectado en varias muestras neoliticas francesas, una del yacimiento de Prissé-la-Charrière (33 %) (Deguilloux et al., 2011 b) y en 4 de de Treilles (14 %) (Lacan et al., 2011). A pesar de la antigua dataciôn molecular de este haplogrupo (17.900 ± 2.900), en base a los datos disponibles, se podria asociar su llegada a Europa durante el Neolitico, poniendo nuevamente en discusiôn las inferencias basadas en la genética actual. La presencia de este haplogrupo en una muestra Calcolitica podria apuntar a una relaciôn entre las regiones francesas y el noreste de la Peninsula Ibérica durante el periodo comprendido entre el Neolitico y el Calcolitico, que podria estar relacionada con la expansiôn de la cultura del vaso campaniforme. Otro haplogrupo compartido entre diferentes individuos es el HV, que incluye el sub- haplogrupo HVO. El primero caracteriza a un espécimen calcolitico (C0ST4), mientras que el segundo esta présente en 3 de los 4 individuos iberos tipados (LVl, PB 14, PB20). El HVO se encuentra a solo dos pasos mutacionales del HV: 72C en HVR-II y 16298C en HVR-I. También el haplogrupo V, detectado en una muestra calcolitica (lAV) se encuentra a dos pasos mutacionales (15904T y 4580A) del HVO. Desde la perspectiva de la genética de poblaciones actuales, estos haplogrupos se han asociado tradicionalmente con el sustrato paleolitico de la diversidad mitocondrial europea (Richards et al., 2000; Torroni et al., 2001). Ademas, se clasificô otro espécimen Cro-Magnon como perteneciente a la rama del haplogrupo HV o Pre-HV, confirmando la antigüedad del macro-haplogrupo (Caramelli et al., 2003). En particular, se supone que el haplogrupo V se originô durante el ultimo méximo glacial en el refugio paleolitico localizado en la franja cantâbrica (Torroni et al., 1998). 221 Cristina Gamba La frecuencia media del haplogrupo V en la poblaciôn europea actual es de un 4,8 % (Torroni et al., 1998), sin embargo este haplogrupo présenta picos màximos de frecuencia en la franja cantabrica y el Pais Vasco (12 %) (Torroni et al., 2001) y en el grupo Saami de Escandinavia (46,4 %) (Tambets et al., 2004). El haplogrupo HVO es poco frecuente en Europa, aunque tiene mayor representaciôn en las costas mediterrâneas, especialmente norteafricanas e ibéricas (Torroni et al., 2001). Teniendo en cuenta que se trata del haplogrupo del que se originô el V, desde la genética de poblaciones actuales se ha sugerido que el HVO, anteriormente llamado pre*V, se originô en Europa Oriental y se expandiô hacia el oeste durante el Gravetiense (Torroni et al., 2001). Un aspecto que résulta interesante destacar es que los haplogrupos HVO y V no habian sido detectados hasta el momento en muestras de épocas calcoliticas e ibéricas de la Peninsula (Izagirre y de la Rua, 1999; Sampietro et al., 2005). Todas las muestras de época ibérica analizadas en el trabajo de Sampietro y colaboradores (Sampietro et al., 2005) -el ünico estudio en el que se analizan individuos de la misma cronologia y regiôn geografica- pertenecian a los principales haplogrupos europeos: H (52,9 %), U (17,6 %), J (11,8 %), pre-HV (5,9 %), K (5,9 %), T (5,9 %). La conclusiôn de este estudio fue que los antiguos iberos no eran significativamente diferentes de la poblaciôn actual europeas. Las diferencias entre nuestros resultados y los obtenidos por Sampietro y colaboradores (2005) pueden deberse bien a la existencia de una gran heterogeneidad genética entre los grupos iberos de Cataluna y los de la Comunidad Valenciana, o bien a una diferente procedencia étnica de los individuos iberos de los dos estudios. Concretamente, la elevada frecuencia del HVO entre las muestras iberas analizadas (75 %) podria representar un caracter distintivo de nuestra poblaciôn. Al no détectarse claras continuidades genéticas con las muestras del periodo precedente, el Calcolitico, podria pensarse que tuvo lugar una ruptura entre ambos periodos. Como ya se ha mencionado antes, la posibilidad de que se trate de un grupo poblacional con diferente origen genético esta apoyada por el registre arqueolôgico, debido al tratamiento funerario diferencial (ver Apartado D.4.1). En el estudio de Sampietro y 222 DISCUSION colaboradores (2005) se analizaron 17 individuos adultos no incinerados procedentes de très yacimientos de la provincia de Gerona, mientras que en la présente tesis doctoral los restos analizados procedian de la provincia de Castellôn. Es posible que las diferencias en la composiciôn genética entre ambos estudios se deban al reducido numéro muestral (4 individuos) de nuestra muestra o al hecho de que dependiendo de la provincia especifica los supuestos enemigos ejecutados fueran de diferente origen y que hubiera conflictos entre poblaciones endogâmicas, como apuntan las grandes fortificaciones de los poblados durante este periodo (ver Apartado I.4.1.1.4). Desde la genética de poblaciones actuales se ha sugerido que el haplogrupo V se originô en la franja cantâbrica durante el ultimo penodo glacial y que desde alli se expandiô hacia el norte después de la retirada de los hielos (Torroni et al., 1998, 2001), hace aproximadamente 12.000 ahos. A partir de entonces se habria producido una recolonizaciôn de las poblaciones aisladas en estos refugios paleoli'ticos hacia el noreste (Torroni et al., 1998, 2001). Sin embargo, el analisis de 121 muestras de 4 yacimientos de época Calcoiftica-Bronce del Pais Vasco demostrô la ausencia total de este haplogrupo en poblaciones vascas antiguas (Izagirre y de la Rua, 1999). Por otra parte, un subtipaje detallado de los haplotipos y haplogrupos présentes en el grupo Saami puso de manifiesto que los linajes de mtDNA del haplogrupo V caracteristicos de esta poblaciôn esta ban mucho mas distribuidos en el este que en el oeste de Europa (Bermisheva et al., 2002; Tambets et al., 2004). Este resultado sugiere que el haplogrupo V habria alcanzado las areas de Finlandia y Escandinavia a través de Europa central y del este (Tambets et al., 2004). Teniendo en cuenta todos estos datos, la presencia de este haplogrupo en el noreste de la Peninsula Ibérica en una muestra calcolitica podria explicarse como una distribuciôn mâs meridional de los refugios paleoliticos. Otro de los haplogrupos tradicionalmente asociados al sustrato Paleolitico es el U5, cuyo tiempo de coalescencia (TMRCA) se estimô en 45.000 - 55.000 ahos (Richards et al., 2000). Este haplogrupo es uno de los haplogrupos mâs ampliamente distribuidos en Eurasia, con picos de frecuencia en la poblaciôn vasca (en Guipüzcoa alcanza el 15 %) (Garcia et al., 2011) y en Escandinavia (el U5b estâ representado en airededor 223 Cristina Gamba del 41 % en la poblaciôn Saami) (Tambets et al., 2004). También estâ présente en bajas frecuencias en el Norte de Africa (Tambets et al., 2004) y en Prôximo Oriente (con frecuencias de airededor del 2 %) (Richards et al., 2000; Tambets et al., 2004). Debido a su distribuciôn y diferenciaciôn actual se ha propuesto que o bien se originô en Europa o al menos fue alli dônde se diversificô su filogenia, de manera que su presencia en los otros continentes se debena a migraciones desde Europa (Richards et al., 2000). Por ejemplo, se ha sugerido que su presencia en Prôximo Oriente, donde estâ asociada esencialmente a grupos kurdos, armenios y azéris, podria apuntar al origen europeo de los mismos (Richards et al., 2000). También el haplogrupo U5, y mâs concretamente el U5b, ha sido propuesto junto con los haplogrupos V, Hl, H3, como un marcador de la expansiôn post-glacial desde los refugios paleoliticos hacia el norte de Europa, siguiendo la retirada de los hielos al final del LGM. Estas inferencias se basan en sus clinas de frecuencia, mâs elevadas en los supuestos refugios como la franja cantâbrica (Torroni et al., 1998, 2001, 2006; Loogvali et al., 2004; Pereira et al., 2005; Alvarez-lglesias et al., 2009). La elevada frecuencia del haplogrupo U5 en muestras mesoliticas centroeuropeas (63 %) (Bramanti et al., 2009) y del norte de Europa (31 %) (Malmstrôm et al., 2009) en principio apoyaria esta hipôtesis. En el conjunto de muestras estudiadas este haplogrupo estâ présente en un individuo de época neolitica cardial (CSA24, U5*) y en uno calcolitico (COSTl, U5b3). Asi el individuo CSA24 podria plantear cierta continuidad genética entre el sustrato mesolitico y las primeras poblaciones neoliticas de la regiôn. Este dato se ha visto confirmado por el reciente hallazgo de este haplogrupo en muestras mesoliticas de yacimientos del levante en estudios realizados por nuestro equipo de investigaciôn (Gamba et al., 2011). En lo que concierne especificamente al sub-haplogrupo U5b3, éste estâ actualmente poco representado en Europa, con una frecuencia por debajo del 1 % en todas las poblaciones, exceptuando Cerdeha, donde alcanza una frecuencia del 3,8 % (Pala et al., 2009). Se ha propuesto recientemente que este sub-haplogrupo se originô y se expandiô a partir de un refugio paleolitico localizado en la Peninsula Itâlica siguiendo una ruta costera, puesto que los Alpes representaban una barrera geogrâfica (Pala et 224 DISCUSION al., 2009). Debido a la elevada endogamia sarda, consecuencia de su situaciôn geogrâfica aislada, éste haplogrupo habria alcanzado una frecuencia mayor en esta regiôn. La presencia de este mismo haplogrupo en un individuo calcolitico podria apuntar a la introducciôn de este haplogrupo desde las costas italianas o francesas, durante la ruta expansiva del Neolitico o en épocas posteriores. En su conjunto, los datos analizados apuntan a cierta continuidad genética entre los diferentes periodos estudiados del noreste de la Peninsula Ibérica, esencialmente debida a la presencia del haplogrupo K en todos ellos. Entre los resultados mâs interesantes merece la pena destacar las afinidades de la poblaciôn neolitica con las poblaciones prôximo orientales actuales, debido a la presencia de los haplogrupos N* y XI. Los resultados obtenidos también sugieren que probablemente estos haplogrupos se habrian perdido por dériva genética después del Calcolitico, periodo en el que su frecuencia disminuye. Por otra parte, la poblaciôn ibera analizada destaca también por su composiciôn genética diferencial, debida esencialmente a la elevada frecuencia del haplogrupo HVO. En principio esto parece sugerir que aquellos individuos no incinerados segün la prâctica comün de la época podrian pertenecer a una poblaciôn forânea, quizâs enemiga, aunque el reducido nümero muestral analizado obliga a ser cautos con estas deducciones. D.4.2 UTILIZACION DE METODOS FILOGENETICOS, ESTADISTICOS Y COMPUTACIONALES PARA LA INTERPRETACIÔN DE LOS RESULTADOS, QUE INCLUYEN LA ESTIMACIÔN DE LA CONTINUIDAD/DISCONTINUIDAD GENÉTICA ENTRE DIFERENTES PERIODOS Y LA EVALUACIÔN DEL IMPACTO DEL NEOLITICO EN LA REGIÔN ESTUDIADA (ARTICULOS 3 Y 4) Después de analizar la composiciôn genética de las poblaciones estudiadas a nivel de haplotipos y haplogrupos, se consideraron las hipôtesis de continuidad y discontinuidad genética entre los diferentes periodos mediante el empleo de anâlisis estadisticos y computacionales. Asi fue posible formular las hipôtesis mâs probables para los fenômenos demogrâficos de la regiôn. Se implementaron simulaciones 225 Cristina Gamba bayesianas coalescentes empleando diferentes modelos de continuidad genética, para poder identificar el escenario que mâs se ajustaba a los resultados obtenidos. Una de las soluciones aportadas por la estadi'stica y la computacion a los problèmes derivados de la escasa disponibilidad de muestras antiguas es el empleo de simulaciones, que permiten reconstruir posibles escenarios demogrâficos y calculer estadisticos con los que comparer los datos reales. Ademâs, permiten inserter los datos observados dentro de estos modelos, que emplean tamahos poblacionales cercanos a las estimaciones arqueolôgicas para cada uno de los pen'odos estudiados. Actualmente, se trata de la técnica disponible mâs adecuada para la correcte interpretaciôn de los resultados. Mediante la comparaciôn de diferentes modelos demogrâficos (ver Figura 2 del ARTICULO 3), fue posible destacar cômo la ausencia de estructura en el escenario panmi'ctico (TPM, Total Panmixia Mode! o Modelo de Panmixia Total) era menos probable que los otros dos modelos estructurados que se consideraron (SM, Split Model o Modelo con separaciôn y SDGM, Split with Differential Growth Model o Modelo con separaciôn y crecimiento diferencial). Este resultado no es sorprendente, puesto que una poblaciôn panmi'ctica en la regiôn estudiada desde inicios del Paleolitico hasta la actualidad no es verosi'mil, dado que existen movimientos poblacionales documentados en pen'odos prehistôricos e histôricos. Sin embargo, este modelo ha sido empleado en diferentes publicaciones para evaluar el impacto del Neolitico en Europa Central (Haak et al., 2005; Bramanti et al., 2009). Por ejemplo, en el trabajo de Bramanti y colaboradores (2009), los resultados apuntaban a una ruptura genética entre los pobladores mesoliticos y neoliticos. El empleo de otros modelos de continuidad genética habrian podido explicar los datos para algunos de los valores testados, excluyendo una compléta ruptura genética (Rasteiro y Chikhi, enviado a PNAS). Esto evidencia la importancia del método empleado en la interpretaciôn de los resultados. A raiz de eso, en la presente tesis doctoral se trabajô con très modelos diferentes para acercarse a aquél que mejor explicaba los resultados. El modelo TPM, previamente 226 DISCUSION empleado en los trabajos citados, fue igualmente incluido para poder comparar los resultados con escenarios mâs verosimiles (SM y SDGM). Para cada uno de los très modelos, se llevaron a cabo comparaciones por pares entre las très poblaciones antiguas estudiadas (Neolitico Antiguo, Edad de los Metales e fberos) y los datos procedentes de la literatura de poblaciones antiguas de Neolitico Medio (Sampietro et al., 2007) y modernas (Garcia et al., 2011) de la misma regiôn geogrâfica, con el fin de evaluar los principales procesos demogrâficos que afectaron a la regiôn estudiada a lo largo de la Prehistoria. La razôn por la que no se analizaron conjuntamente la poblaciôn del Neolitico Medio (Sampietro et al., 2007) y la del Neolitico Antiguo (de la présente tesis doctoral) se debe a que la primera incluye datos de un yacimiento en el que no se han descrito niveles cardiales subyacentes, lo que podria sesgar los resultados en el caso de no estar implicada en la llegada de los primeros agricultores en la Peninsula Ibérica. Obsérvese que las conclusiones del anâlisis descriptive de los datos (ver Tabla D 7) se ven reflejadas y sostenidas por el anâlisis computacional. Es decir, que las distancias genéticas observadas (E st) entre las diferentes poblaciones son directamente proporcionales a las simuladas. Tabla D 7 Distancias genéticas (Fst) en tre las poblaciones analizadas (Tabla A2 del Anexo I del ARTICULO 4). Edad de la Poblaciôn Moderna ibera Edad de los Neolitica Neolitica Metales Media Antigua Moderna 0,18525 Edad de los Meta es 0,02232 0,10307 Neo itica Media 0,23213 0,012610,18178 Neolitica Antigua 0,12978 0,22252 -0,02577 0,10417 El anâlisis estadistico y computacional se basô en las Est por las siguientes razones: - Entre las variables comparables y proporcionadas por los programas empleados para el câlculo de las variables observadas (Arlequin) (Excoffier y Lischer, 2010) y el câlculo de las simuladas (BayeSSC) (Excoffier et al., 2000), las Est representaban aquellas mâs 227 Cristina Gamba informativas a nivel de caracterizacion poblacional. En las fa ses preliminares del analisis estadistico se testaron otras (como la heterozigosidad) que fueron descartadas por falta de diferencias significativas. - Se emplearon estos estadisticos también para que los resultados de la presente tesis doctoral fueran comparables con aquellos publicados por otros autores, que estudiaron problematicas demograficas similares comparando las distancias genéticas (Fst) entre los conjuntos poblacionales antiguos y modernos estudiados (Haak et al., 2005; Bramanti et al., 2009; Malmstrôm et al., 2009). D .4 .2 .1 c o m p a r a c i ô n ENTRE D IS T A N C IA S G EN ETIC AS O BS E R V AD A S Y S IM U L A D A S La comparaciôn entre las distancias genéticas observadas y simuladas permite identificar los modelos y los rangos poblacionales que mâs se adecüan a los datos observados. Lo que se quiere destacar es para que valores de tamaho poblacional efectivo (Ne) neolitico y paleolitico las distancias genéticas simuladas son mayores de las observadas y con qué probabilidad. Cuando se da este fenômeno (al menos en el 5 % de los casos) en el que los valores simulados consiguen ser tan altos como los observados, se puede interpretar como buen ajuste del modelo a los datos. En el caso contrario (valores simulados menores que los observados en mâs del 95 % de los casos), se interpréta que los modelos y rangos poblacionales empleados no permiten explicar los resultados. La obtenciôn de Fsr simulados menores que los observados en todos los rangos testados ha sido interpretada por otros autores como presencia de discontinuidad genética (Bramanti et al., 2009; Malmstrôm et al., 2009) en aquellos casos en que el modelo testado no era capaz de explicar elevadas Fsj entre las poblaciones comparadas. En los grâficos de comparaciôn entre Fsr (Figura D 3 y D 4) se pueden distinguir fâcilmente estas probabilidades gracias al côdigo de colores empleado para representar la probabilidad de obtener Fsr simuladas mayores que las observadas (el color bianco se refie re a probabilidades superiores al 5 %). 228 DISCUSION En los modelos empleados se exploran diferentes tamahos muestrales paleoliticos y neoliticos. Los tamahos poblacionales efectivos durante el Paleolitico Superior y el Neolitico fueron estimados en base a los datos demogrâficos disponibles para estos periodos teniendo en cuenta el ârea geogrâfica objeto de estudio (noreste de la Peninsula Ibérica). La densidad poblacional efectiva durante el Paleolitico se ha estimado en airededor de 0,064 individuos por Km^ mientras que la neolitica se supone que era veinte veces mayor (Steele et al., 1998; AIroy, 2001). Asi para la region estudiada se calculé un tamaho efectivo de 700 para el Paleolitico Superior y 15.000 para el Neolitico. Pero para dar mayor flexibilidad a los modelos empleados se emplearon amplios rangos, 10 - 5.000 para el Paleolitico Superior y 200 - 100.000 para el Neolitico. Sin embargo, después de explorar estos rangos mediante un método de aproximaciôn bayesiana (ABC), fue posible identificar un buen ajuste del rango de Ne para el Paleolitico Superior, mientras que para el Neolitico los datos apuntaban a una mayor probabilidad de la primera parte de los rangos explorados. Asi se simularon Est para diferentes combinaciones y distribuciones de rangos poblacionales. Se analizaron 10 valores para el rango del Paleolitico Superior y 30 valores para el Neolitico. En este segundo caso, se distribuyeron 20 valores en la primera parte del rango (200-20.000), debido a su mayor probabilidad y 10 valores en la parte restante (20.000-11)0.000) (ver Material y Métodos del ARTICULO 3). En la Tabla D 8 se detalla un resumen de los resultados obtenidos en todas las comparaciones por pares, para facilitar la comprensiôn de la discusiôn de estos resultados. Tabla D 8 Resumen de los resultados obtenidos en las comparaciones entre Fst observadas y simuladas, elaborado a partir de los grâficos presentados en el présente apartado. Se especifican por cada pareja de poblaciones comparadas para qué valores es posible detectar Fst simuladas mayores que las observadas en al menos el 5 % de los casos. Neolitico Antiguo Neolitico Medio Edad Metales Iberos Poblaciôn actual Neolitico Antiguo - - - - - Neolitico Medio Solo para Ne neoliticos reducidos - - - - Edad Metales Todos los rangos Todoslos rangos - - - Iberos Solo para N« neoliticos muy reducidos Solo para N, neoliticos reducidos Todoslos rangos - - Poblaciôn actual Solo para Ne neoliticos reducidos Todos los rangos Todoslos rangos Solo para Ne neoliticos muy reducidos - 229 Cristina Gamba Este estudio comparativo ha revelado diferencias sustanciales entre la pobiaciôn neolitica antigua (que incluye el periodo cardial y post-cardial) y les demas periodos. Respecte a su relacion con la pobiaciôn moderna (Garcia et al., 2011), los datos observados se pueden explicar solamente para un rango muy reducido de datos explorados en las simulaciones, compatible con un tamaho efectivo limitado de los primeros pobladores neoh'ticos (entre 200 y 1.000/2.000) en los très modelos explorados (ver Figura D 3). Dentro de ellos, los SM y SDGM permiten explicar los resultados con tamahos poblacionales neoliticos de hasta 2.000, mientras que el TPM, solo hasta 1.000. Este resultado apoya el mejor ajuste de los modelos estructurados a los datos observados. Dado que el modelo SM refleja una aportaciôn genética reducida de los pobladores neoh'ticos mientras que el SDGM refleja una aportaciôn mucho mayor, la imposibilidad de identificar uno de estos dos modelos como mas probable se debe al ajuste parecido de los dos modelos a los datos observados. Estos resultados apuntan a cierta contribuciôn genética de los primeros agricultores, compatible con la llegada de pequehos grupos al principio del Neolitico. De ahi la interpretaciôn demografica de una colonizaciôn pionera de la regiôn (ver Discusiôn del ARTICULO 3), que apoyan'a modelos de difusiôn intermedios a ce rca de la llegada del Neolitico en la Peninsula Ibérica (Zilhâo, 2000, 2001). También se investigô la razôn por la que era dificil explicar los resultados para los demas rangos poblacionales explorados, asi como el elevado Est observado entre la pobiaciôn neoh'tica antigua y la moderna. A nivel cualitativo, la pobiaciôn neoh'tica esta caracterizada por una elevada frecuencia del haplogrupo N* (31 %, ver Tabla D 5) que, como se comentô en el Apartado D.4.1.2, esta ausente en la pobiaciôn moderna (ver Tabla S2 del ARTICULO 5). Esto implica valores de Est muy elevados y dificilmente explicables bajo los très modelos testados. 230 DISCUSIÔN Figura D 3 Probabilldad de ob tene r Fst sim ulados m ayores que los F jt observados en tre parejas de poblaciones en los très m odelos exp lorados (TMP, SM, SDGM). Ng: tam ano e fectivo poblaciona l. Ng-Neo: rango de Ng. El co lo r bianco se re fie re a valores superiores a 0.05 (5 %). Gràficos inclu idos en los ARTICULOS3y4. Neoh'tlco Antiguo - Pobiaciôn Moderna (Ne-Neo 200-100.000) O .C B JDO zm n nCU) N, - Neolltico Neoli'tico Antiguo - Pobiaciôn Moderna (Ne-Neo 200-10 8 ^wo H XO 2200 4200 #200 #200 200 2200 4300 #200 #200 200 2200 4300 #200 #200 N, - Neoirtico Neolltico Antiguo - Neolltico Medio N, - Neolltico Neolltico Medio-Pobiaciôn Moderna TPM XX) ZBGD 40S0C »)3nn xnxm -|— I— I— r 200 20200 40200 #0200 4nann SOGM 1 1 1— 200 20200 40200 #0200 10200 N, - Neolltico Neolltico Antiguo - Edad de los Metales TPM 3010 -O — 2010 S. , 1010 - Z 1---1---1---T 300 30200 40COC #0300 #0200 SDQM -|— I— I— r 300 30200 40200 #0300 #0300 000) 006 005 004 003 0 (£ 0 01 000 200 20200 40200 10200 «0200 Neolltico Medio - Edad de los Metales TPM ^ 3 0 . 0 - 1 I S. z" SM SDGM 200 20200 40200 #0200 #0200 1— I— r 300 40200 #0300 231 Cristina Gamba Sin embargo, cuando se relaciona la pobiaciôn del Neolltico Medio con la pobiaciôn actual de la misma region geografica, los datos obtenidos pueden explicarse para todas las combinaciones de tamano muestral, apuntando a una homogeneidad genética entre las dos poblaciones (ver Figura D 3) y confirmando las conclusiones del trabajo de Sampietro y colaboradores (2007). Este resultado esta reflejado incluso en el analisis cualitativo de la composiciôn de haplotipos y haplogrupos de la pobiaciôn neolitica media, en la que aparecen representados los principales tipos mitocondriales actuales (ver Tabla S2 del ARTICULO 3). En cuanto a la comparaciôn de la pobiaciôn neoh'tica antigua con el siguiente periodo prehistôrico (Neolltico Medio) (Sampietro et al., 2007), también se détecta cierta diferenciaciôn genética, aunque en menor grado (ver Figura D 3). También es posible destacar mayores diferencias entre los très modelos testados: los modelos estructurados, y especialmente el SDGM, pueden explicar las Fst observadas para un mayor rango de combinaciones de tamanos poblacionales, apuntando nuevamente al mejor ajuste de estos modelos a los datos estudiados. Al tratarse de dos poblaciones antiguas para las que se dispone de pocos datos observados (13 para el Neolltico Antiguo y 11 para el Neolltico Medio), los modèles empleados permiten explicar los resultados por un mayor rango respecte a la comparaciôn entre la pobiaciôn neoh'tica antigua y la moderna. Esto se debe a que fenômenos como la dériva genética pueden explicar mas facilmente cambios en la composiciôn genética. La diferenciaciôn genética entre Neolltico Medio y Antiguo es debida, a nivel cualitativo, a la composiciôn haploti'pica diferencial de las dos poblaciones, como ocurria con la pobiaciôn moderna. En la pobiaciôn del Neolltico Medio estân representados los principales haplogrupos europeos (ver Tabla D 5 y Tabla S2 del ARTICULO 5), mientras que en la neolitica antigua se détecta n haplogrupos no representados en estas poblaciones (XI y N*, ver Tabla D 5). Este resultado se podn'a explicar en el caso de que la dériva genética hubiera jugado un papel importante, que acarreara la pérdida de algunas variantes mitocondriales y la modificaciôn de las frecuencias haploti'picas. Esto explican'a la pérdida del haplogrupo N* en la pobiaciôn moderna y en la del Neolltico Medio. El 232 DISCUSION hecho de que se encuentre un haplogrupo N* en una muestra calcolitica apunta a su persistencia al menos hasta ese periodo, aunque en menor frecuencia. Por otro lado, su ausencia en el conjunto de muestras del Neolltico Medio (Sampietro et al., 2007) podria ser debido a que no se trata de un conjunto representativo, puesto que incluye 11 individuos procedentes de un solo yacimiento, que ademas no présenta niveles neoliticos cardiales. Se comparô también la pobiaciôn neoh'tica antigua con las poblaciones calcoh'tica y de la Edad del Bronce (conjuntamente definidas como Edad de los Metales). En este caso puede verse que es posible explicar los resultados a nivel de todos los rangos de pobiaciôn estudiados en todos los modelos ensayados (ver Figura D 3). A nivel cualitativo, ambos grupos poblacionales comparten diferentes haplotipos y haplogrupos. Por ejemplo, en ambos casos el haplogrupo K esta representado en mas de un individuo y la pobiaciôn calcoh'tica también présenta un individuo caracterizado por el haplogrupo N*. Estos resultados apuntan a la existencia de continuidad genética entre el Neolltico Antiguo y los sucesivos periodos prehistôricos (Calcoh'tico y Edad del Bronce). Por otra parte, se observa una situadôn parecida cuando se compara la Edad de los Metales con todos los restantes periodos estudiados (ver Figura D 3 y D 4), sugiriendo homogeneidad genética entre todos estos pen'odos, Estos resultados parecen discordantes con los anteriores, ya que entre el Neolltico Antiguo y Medio asi como entre el Neolltico Antiguo y la pobiaciôn moderna se détecta cierta diferenciaciôn genética. Sin embargo, ambas poblaciones resultan genéticamente homogéneas con la pobiaciôn de la Edad de los Metales (ver Figura D 3). Estos resultados se pueden explicar debido a los bajos valores de Est obtenidos entre la pobiaciôn de la Edad de los Metales y estas poblaciones (Neolltico Antiguo, Medio y pobiaciôn actual, ver Tabla D 7). Asi la probabilidad de obtener valores simulados mayores respecte a los observados résulta altamente probable independientemente del modelo. Ahora bien, lo que résulta mas complicado de explicar es la razôn por la que estos valores de Est son tan bajos. Por un lado la pobiaciôn de la Edad de los Metales présenta un numéro reducido de individuos (8) pero no mucho mas reducido que las poblaciones neoliticas 233 Cristina Gamba media y antigua (11 y 13 individuos respectivamente). La razôn mas probable puede residir en la manera en la que se calculan los Fst, que esencialmente se basan en las diferencias mutacionales entre los haplotipos comparados. Asi su valor disminuye en funciôn de las mutaciones compartidas entre los haplotipos de las poblaciones comparadas. La pobiaciôn de la edad de los metales incluye haplotipos compartidos o parcialmente compartidos con las otras très poblaciones. Sin embargo, dependiendo de la comparaciôn, comparte unas u otras mutaciones (ver Tabla D 5 y D 6). Por ejemplo, respecto al Neolltico Antiguo présenta dos haplotipos coincidentes (16224C 16311C y 16223T 16362C) y otro parcialmente coïncidente (16136C, 16192T 16270T (16304C)). Respecto a la pobiaciôn del Neolltico Medio comparte dos haplotipos (CRS y 16069C 16126C). Por lo que respecta la pobiaciôn moderna, comparte con ella los haplotipos que actualmente estan mayormente representados (CRS: 40,4 %, 16224C 16311C: 6,6 %, 16298C: 5,4 % y 16069C 16126C: 5,4 %). En lo que respecta al conjunto de muestras iberas, esta pobiaciôn présenta una elevada diferenciaciôn genética con todas las demas poblaciones, exceptuando la Edad de los Metales (ver Figura D 4). Como ya se comentô en el anterior apartado, 3 de las 4 muestras estudiadas se corresponden con el haplogrupo HVO. Asi existen dos posibilidades que podrian explicar los resultados obtenidos. En primer lugar, habrfa que considerar si la pobiaciôn ibera estudiada es representative de las poblaciones iberas del momento. Por una parte, hay que tener en cuenta que ünicamente se estudiaron 4 muestras, lo que podria haber sesgado el resultado de alguna manera. Por otra, y como ya se ha discutido en el apartado anterior, los individuos analizados presentaban un ritual funerario diferente al de las poblaciones iberas de la Peninsula. Como ya se ha apuntado, esto podria significar que se tratara de una pobiaciôn alôctona enemiga. 234 DISCUSION Figura D 4 Probabilidad de ob tene r Fst sim ulados m ayores que los Fsj observados en tre parejas de poblaciones, en correspondencia de los très m odelos explorados (TMP, SM, SDGM). Ng: tam ano e fectivo poblacional. Ne-Neo: rango de Ng. El co lo r bianco se re fie re a valores superiores a 0.05 (5 %), Gràficos inclu idos en el ARTICULO 3 y 4. (beros - Edad de los Metales 0 * 0 - TPM #0*0 - SM «MO - 8DQM u5 3040 - wo - JMO - S »0 - »0 - mo - CL ««o - 1010 - "1 - I l r r 1 1 1 1 T XX) XBQO 4KHD M iyn 0 X 0 300 30200 40200 «0300 «0300 200 40200 «0300 «0300 300 30200 40200 «0300 «0300 300 30200 400m «0300 «0300 Ng - Neolltico fberos - Pobiaciôn M oderna aoo 30S0D 40200 «0300 «0300 300 20200 40800 «0300 «0300 N. - Neolltico XXI xao o 40SOO Ên^m #0x 0 006 004 003 002 001 000 006 004 003 002 QCn 000 235 Cristina Gamba Por Otra parte, en segundo lugar, podria ser que la pobiaciôn estudiada si fuera representativa de las poblaciones ibéricas, por lo que las elevadas distancias genéticas observadas y simuladas se deberian a una composiciôn genética diferencial de esta pobiaciôn. Sin embargo esta segunda hipôtesis résulta menos probable debido a la diferente composiciôn genética que présenta respecto a otro conjunto de muestras iberas estudiadas por otros autores (Sampietro et al., 2005), en la que no esta representado ninguno de los haplotipos ni de los haplogrupos encontrados en el conjunto ibero de la présente tesis doctoral. 0 .4 .2 .2 SELECCION DEL M O D E L O M A S A D E C U A D O Si se observa n todos los gràficos en su conjunto, es importante destacar que los modelos estructurados consiguen explicar los resultados para un rango mayor de poblaciones efectivas a nivel de todas las comparaciones efectuadas. A continuaciôn se describen los analisis estadisticos que apoyan el mejor ajuste de los modelos SM y SDGM al conjunto de datos estudiados. Mediante los analisis de ABC {Approximate Bayesian Computation), fue posible demostrar que los modelos que asumen una estructura previa de las poblaciones Paleolitica y Neoh'tica (SM y SDGM) son mas probables que el modelo sin estructura (TPM) (ver las probabilidades correspondientes en la Tabla 2 del ARTICULO 3). Ademas, si se lleva a cabo una comparaciôn por pares entre los modelos, se obtienen probabilidades a posteriori mas elevadas (>72 %) para los escenarios estructurados. Con los resultados obtenidos en la présente tesis doctoral no fue posible discernir entre estos dos modelos demograficos por diferentes razones. En primer lugar, los datos genéticos empleados pertenecen, en su totalidad, a épocas posteriores a la estructura que se ha disehado en los modelos, es decir que son mas recientes de hace 7.500 ahos. El empleo de datos que precedan a esta fecha permitiria afinar la selecciôn del modelo mas adecuado. Teniendo en cuenta que la rama izquierda de los modelos estructurados représenta la pobiaciôn local y la derecha la pobiaciôn fuente (ver Figura 2 del ARTICULO 3), séria necesario anadir datos genéticos del Mesoli'tico del noreste 236 DISCUSION de Espana e informaciôn de la pobiaciôn neolitica de Prôximo Oriente. En ambos casos se trataria de datos que estarian incluidos exactamente en el periodo empleado para estructura r los modelos, es decir entre hace 10.000 y 7.500 ahos. Al no disponer de estos datos, se llevô a cabo una prueba en la que la edad de la estructura se redujo a 7.395 ahos, de manera que las siete muestras de Can Sadurni quedaran justo antes de la misma (en la rama izquierda, como si representaran el sustrato mesolitico) y las de Chaves y Sant Pau del Camp justo después. Los resultados de selecciôn de modelos en este caso mejoraron sensiblemente, identificando como modelo mas adecuado el SDGM asociado a una probabilidad superior al 90 %. Para validar los resultados y las conclusiones obtenidas, se estimô el poder discriminatorio del método empleado para la selecciôn del modelo mas probable. Se seleccionaron 500 valores al azar dentro del conjunto de datos simulados (1 millôn por modelo). Estos valores se consideraron como si fueran observados y se calculô la probabilidad de asignaciôn a cada uno de los modelos, evaluando cuàntas veces se correspondia esta probabilidad con el modelo correcto (ver Tabla D 9). Tabla D 9 Probabilidad de identificar el modelo de procedencia seieccionando 500 valores al azar dentro del conjunto de datos simulados (1 millôn) por cada uno de los modelos: TPM (primera linea), SM (segunda linea) y SDGM (tercera linea) (Tabla 54 del ARTICULO 3). % de atribuciôn a cada modelo TPM SM SDGM TPM 60,20 15,06 24,20 SM 45,40 26,00 28,60 SDGM 31,40 24,80 43,80 En orden, los datos procedentes del TPM se asignaron correctamente a este modelo en el 60% de los casos (y en el restante 40% a los otros dos modelos), aquellos procedentes del SDGM en un 44 % y en el SM solamente en un 26 %. Esto es debido a las mayores diferencias entre TPM y los otros dos modelos que los dos modelos estructurados (SM y SDGM) entre si. En el caso de TPM y SDGM, los porcentajes mas altos de asignaciôn corresponden al modelo correcto. En el caso del SM, aunque el porcentaje mas alto cae dentro del modelo TPM, este porcentaje no se diferencia significativamente de los otros dos (26,00 % y 28,60 %, ver Tabla D 9). Este resultado 237 Cristina Gamba podria ser debido a que el SM représenta un modelo intermedio entre TPM y SDGM, lo que conllevaria un porcentaje de error mas elevado en la identificacion del modelo. En su conjunto, todos estos resultados apuntan a que los modelos estructurados (SM y SDGM) son mucho mas compatibles con los datos reales respecto a modelos panmicticos, poco verosimiles incluso desde un punto de vista conceptual. Como ya se ha comentado, el modelo TPM fue incluido en este estudio para poder comparar los resultados con los de otros autores (Haak et al., 2005; Bramanti et al., 2009; Malmstrôm et al., 2009), que lo emplearon como ünico modelo para testar continuidad genética. Futuras investigaciones para la identificacion de modelos mas adecuados y la inserciôn de nuevos datos podrân ayudar a identificar mas claramente el modelo demografico mas adecuado para comprender las aportaciones del Neolltico a la genética actual. 238 DISCUSION D ISCUSION DE LOS OBJETIVOS - RELACIONES FAMIL IARES D.5 Verificaciôn de las hipôtesis de parentesco y de determinaciôn del sexo formuladas a partir de otras disciplinas (arqueologfa, historiografia, genealogia, antropologia) mediante el analisis genético de marcadores nucleares STR en un conjunto de muestras medievales procedentes de sepulturas multiples (Iglesia de San Esteban de Cuéllar, Segovia). Durante el desarrollo de la présente tesis se ha demostrado la posibilidad de obtener perfiles de STRs nucleares pràcticamente completes en muestras medievales mediante el empleo del kit MiniFiler (Mulero et al., 2008). La obtenciôn de resultados tan satisfactorios probablemente se deba no solo a la alta sensibilidad del kit, sino también y sobre todo a la muy buena preservaciôn de las muestras. No hay que olvidar que una de las principales caracteristicas de este conjunto de muestras es su elevado grado de preservaciôn tisular. No en vano se trataba de especimenes momificados de forma natural. Este proceso de momificaciôn natural depende del entorno de deposiciôn y se trata de un fenômeno que se ve favorecido por diferentes factores, como una desecaciôn rapida de los tejidos incluso en ambientes calidos, un ambiente alcalino o la ausencia de microorganismos (Lynnerup, 2007). En el caso de las muestras estudiadas, la momificaciôn fue favorecida por un ambiente seco, proporcionado por los sepulcros de piedra en los que se inhumaron los cuerpos. Ademas, en el interior de algunos de los sepulcros se encontrô una gran cantidad de cal, una sustancia que absorbe la humedad ambiental, favoreciendo aün mas el fenômeno de momificaciôn natural de los cuerpos. D . 5 . 1 I N T E R P R E T A C I Ô N D E L O S P E R F I L E S S T R S ( A R T I C U L O 5 ) El éxito de este estudio fue condicionado, ademas de por las buenas condiciones de preservaciôn de las muestras, por la correcta interpretaciôn de los perfiles genéticos. A 239 Cristina Gamba la hora de llevar a cabo estudios de perfiles de STRs con muestras degradadas o LTDNA, en inglés Low Template DNA (bajo numéro de ADN molde), se suele presenter un conjunto de problematicas especificas que las distinguen del analisis e interpretaciôn de muestras de ADN fresco (Balding y Buckleton, 2009; Gill et al., 2009). Por esta razôn, la correcta lecture e interpretaciôn de los perfiles représenta el punto de partida para estudios de este tipo. En primer lugar, los picos correspondientes a la amplificaciôn de los diferentes sistemas deben tener una altura (medida en RFU, Relative Fluorescence Units o Unidades Relatives de Fluorescencia) lo suficientemente elevada como para no confundirla con el ruido de fondo. Siguiendo las recomendaciones vigentes, no se consideraron como validos los picos por debajo de las 50 RFU (Gjertson et al., 2007). Ademas, résulta importante la identificaciôn de posibles artefactos ligados a la baja concentraciôn de ADN. En el présente estudio se identificaron el desequilibrio alélico en heterocigotos [allelic imbalance), la pérdida aleatoria de informaciôn genética de uno de los alelos de un locus [allelic dropout) y la pérdida de informaciôn genética de un locus completo [locus dropout). Sin embargo existen otros artefactos no detectados en el présente trabajo que podrian afectar a la interpretaciôn de los resultados de muestras LTDNA, como la presencia de amplicones de altura reducida en correspondencia de una unidad de repeticiôn inferior a la verdadera (llamados stutter) y la detecciôn de contaminaciones puntuales y no replicables, conocido como drop-in (Gill et al., 2000; Whitaker et al., 2001; Kloosterman y Kersbergen, 2003; Budowle et al., 2009). En las muestras medievales de la Iglesia de San Esteban, se observa el fenômeno del allelic imbalance repetidamente. Este artefacto consiste en el desequilibrio en la altura de los picos del electroferograma en sistemas heterocigotos. En muestras frescas y correctamente amplificadas, la altura del pico de menor tamano suele ser aproximadamente el 90 % de la del pico de mayor tamaho (Gill et al., 1997). Aunque existen diferentes estàndares en los diferentes laboratorios forenses, en general se suele requérir una relaciôn de al menos el 60 % (Gill et al., 1997). En el caso de las muestras de la Iglesia de San Esteban, la altura de los picos de menor tamaho llegô a 240 DISCUSION representar incluso el 30% de la altura de los picos de mayor tamaho. Para poder confirmer que el pico de menor tamaho no fuera un artefacto, se analizaron los perfiles obtenidos en las diferentes amplificaciones y extracciones, hasta llegar a un consenso. Ademas se excluyô la posibilidad de que se tratara de stutters debido a que en amplificaciones independientes el pico de menor altura se presentaba alternativamente a nivel del alelo de mayor o menor tamaho. La razôn por la que se puede presenter el fenômeno del allelic imbalance se debe a la degradaciôn y a la baja concentraciôn de ADN, que pueden conllevar la amplificaciôn preferente de un alelo frente al otro (Hummel, 2003; Butler, 2005), También puede ocurrir en muestras frescas en el caso de que uno de los dos alelos présente una mutaciôn en la regiôn de hibridaciôn de los cebadores, provocando un decremento en la eficiencia de amplificaciôn del alelo en cuestiôn (Butler, 2005). No obstante, los cebadores empleados en este tipo de analisis suelen hibridar en zonas con una probabilidad de mutaciôn muy reducida (Clayton et al., 1998). También fue posible détecta r el fenômeno del allelic dropout, que consiste en la amplificaciôn al azar de un ünico alelo en una muestra heterocigota para un determinado marcador (Butler, 2005). A priori, esto podria parecer una situaciôn extrema del fenômeno de allelic imbalance, puesto que el resultado es la detecciôn de un solo pico en un locus heterocigoto. Sin embargo, Findlay y colaboradores (Findlay et al., 2001) sugirieron que se trataba de dos fenômenos diferentes. Estos autores afirman que a la hora de preparar una PCR se ahade solo una porciôn del extracto de ADN. Si se esta trabajando con muestras degradadas, la concentraciôn de ADN en el extra cto podria ser tan baja que el volumen ahadido a la mezcla de PCR solo contenga uno de los dos alelos. Como en el caso anterior, gracias a la repeticiôn de los experimentos fue posible détecta r este fenômeno para poder establecer el haplotipo consenso. Es decir, que en aquellas ocasiones en las que se obtuvieron dos alelos distintos, en amplificaciones diferentes y para el mismo marcador, se asumiô que se trataba de allelic dropout (ver Tabla D 10). 241 Cristina Gamba Tabla D 10 Perfiles de las muestras am plificadas con el kit M iniFiler. Los alelos con un asterisco (en las celdas grises) se re fie ren al fenôm eno del allelic dropout y la presencia de un guiôn, a la ausencia de resu ltados (locus drop-out). Individuo Muestra PCR D13S317 D7S820 AMEL D2S1338 D21S11 D16S539 D18S51 CSFIPO EGA ISC IS C l 1 12/13 - - 18/19 - - 13/14 10/11 - 2 - - - - - - - 11* - 1SC2 1 13* - X* 18/19 - - 13* 10 /11 - 2 12* - X/Y 18/19 - - 13/14 10/11 - Perfil consenso 12/13 - X/Y 18/19 - - 13/14 10/11 - 2SC 2SC1 1 11/12 - X/Y 19* - - 13/14 10/11 - < 2 11/12 - X/Y 17/19 - - 13/14 10/11 - .Q E 2SC2 1 11/12 - - - - - 13* 10 /11 - ,2 2 - - - - - - 13* 10 /11 - Perfil consenso 11/12 - XY 17/19 - - 13/14 10/11 - 3SC 3SC1 1 10/12 8/9 X/Y 19/24 28/32.2 12/13 11/18 10 /11 23/24 2 10/12 8/9 X/Y 19/24 28/32.2 12/13 11/18 10/11 23/24 3SC2 1 10/12 8/9 X/Y 19/24 28/32.2 12/13 11/18 10 /11 23/24 2 10/12 8/9 X/Y 19/24 28/32.2 12/13 11/18 10 /11 23/24 Consensus profile 10/12 8/9 X/Y 19/24 28/32.2 12/13 11/18 10/11 23/24 4SC 4SC1 1 11 8 X 24* - - - 11 22 m 2 11 - X - 28/30 - 15/16 11 22 .o E 4SC2 1 11 - X 20* - - 13/16 11 - .2 2 11 - X 20/24 - - 13/16 11 22 Perfil consenso 11/11 8/8 X/X 20/24 28/30 - 13/16 11/11 22/22 5SC SSCI 1 9/11 10/12 X 17/25 28/30 13 14/17 10/12 22/23 2 9/11 10/12 X 17/25 28/30 13 14/17 10/12 22/23 SSC2 1 9/11 10/12 X 17/25 28/30 13 14/17 10/12 22/23 2 9/11 10/12 X 17/25 28/30 13 14/17 10/12 22/23 2 Perfil consenso 9/11 10/12 X/X 17/25 28/30 13/13 14/17 10/12 22/23 E 3 6SC 6SC1 1 10/11 8/10 X/Y 19/24 28/32.2 9/12 17/18 11/12 24 2 10/11 8/10 X/Y 19/24 28/32.2 9/12 17/18 11/12 24 6SC2 1 10/11 8/10 X/Y 19/24 28/32.2 9* 17/18 11/12 24 2 10/11 8/10 X/Y 19/24 28/32.2 9* 17/18 11/12 24 Perfil consenso 10/11 8/10 X/Y 19/24 28/32.2 9/12 17/18 11/12 24/24 7SC 7SC1 1 11/13 8/12 X/Y 24/25 29/32 9 12/15 11/12 19/23 2 11/13 8/12 X/Y 24/25 29/32 9 12/15 11/12 19/23 Q 7SC2 1 11/13 8/12 X/Y 24/25 29/32 9 12/15 11/12 19/23 .3 E 2 11/13 8/12 X/Y 24/25 29/32 9 12/15 11/12 19/23 i2 7SC3 1 11/13 X/Y 24/25 29/32 - 12/15 12» 19* 2 - - - - - - - 12» - Perfil consenso 11/13 8/12 X/Y 24/25 29/32 9/9 12/15 11/12 19/23 Por ejemplo, la muestra 1SC2 présenta para el marcador D13S317 los alelos 12 y 13 en dos amplificaciones independientes, interpretandose que, debido al allelic dropout, en cada PCR se ha amplificado uno de los dos alelos présentes en la muestra. Esto hace que dudemos de todos aquellos sistemas genéticos que muestren un solo alelo, ya que 242 DISCUSION cabe la posibilidad de que otro alelo distinto, présente en la muestra, no se baya amplificado. Por esta razôn la repeticiôn de los analisis mediante extracciones independientes de diferentes muestras de un mismo individuo y diferentes amplificaciones a partir del mismo extracto es de vital importancia para una correcta interpretaciôn de los resultados obtenidos. En el caso del individuo ISC es posible ver que entre las dos amplificaciones llevadas a cabo para cada una de las dos muestras se han podido tipar entre 1 y 5 sistemas por PCR, apuntando a la escasez de ADN en la muestra. El tercer artefacto mas frecuente en muestras LTDNA es el locus dropout, o pérdida de informaciôn de un locus. Dicho fenômeno también fue detectado en el conjunto de muestras estudiadas. A pesar de obtener perfiles genéticos parciales en algunas de las amplificaciones, fue posible reconstruir el haplotipo completo como es el caso de la muestra 7SC. En cambio, para los individuos ISC, 2SC y 4SC el perfil consenso es a su vez parcial debido a que no fue posible amplificar algunos marcadores en ninguna de las amplificaciones realizadas (ver Tabla D 10). Los sistemas principalmente afectados por el locus dropout son aquellos que presentan una mayor longitud (EGA, D21S11 y D7S820), sin embargo este fenômeno también afectô a un sistema de reducido tamaho (D16S539), por el que se han descrito mutaciones a nivel de la regiôn de uniôn del primer especifico (Feller, 2009). En la Figura S2 (Material Suplementario del ARTICULO 5) se detallan las diferentes longitudes de cada uno de los fragmentos analizados. D.5.2 INTERPRETACIÔN DE LOS RESULTADOS GENÉTICOS OBTENIDOS A LA LUZ DE HIPÔTESIS ARQUEOLÔGICAS, VALORÂNDOLOS CONJUNTAMENTE CON LA INFORMACIÔN GENEALÔGICA, HISTÔRICA, ARQUEOLÔGICA Y ANTROPOLÔGICA DISPONIBLE (ARTICULO 5) En su conjunto, este trabajo représenta un ejemplo de una de las aplicaciones del ADN antiguo: la determinaciôn de relaciones familiares en un contexto histôrico y arqueolôgico. Mediante la integraciôn de informaciôn procedente de diferentes disciplinas, que incluyen la arqueologfa, la antropologia, la genealogia y la genética, fue 243 Cristina Gamba posible llevar a cabo un estudio de relaciones de parentesco en un conjunto de sepulcros medievales. Los siete individuos analizados proceden de un grupo de sepulcros de interés histôrico, puesto que estaban localizados en posiciones privilegiadas de la Iglesia de San Esteban de Cuéllar, reservadas a miembros de familias nobles durante la Edad Media. De hecho, las inscripciones de las tumbas hacian referenda a personalidades de la familia Côrdoba Hinestrosa, probablemente emparentada con Alfonso IX de Leôn (Palomino Làzaro et al., 2009). De ahi el gran interés en el estudio de las relaciones familiares de los siete individuos hallados en los cuatro sepulcros mediante un analisis multidisciplinar. Si en un futuro fuera posible obtener la informaciôn genética de descendientes vivos (o muertos), séria posible llegar a identificar a los individuos estudiados. Los hallazgos mas significativos de este trabajo se refieren a dos aspectos: - La determinaciôn molecular del sexo y la comparaciôn de los resultados con las inscripciones y los datos antropolôgicos. - El analisis de parentesco entre los individuos supuestamente relacionados. D.5.2.1 DETERMINACION MOLECULAR DEL SEXO La determinaciôn molecular del sexo résulta de gran interés sobre todo en el caso de no disponer de un esqueleto completo o de individuos inmaduros. En ambos casos, la determinaciôn morfométrica del sexo se ve imposibilitada por la falta de informaciôn. Sin embargo, la genética molecular puede permitir su determinaciôn, como es el caso de los dos individuos infantiles estudiados. Ademas, el gen de la amelogenina, incluido en el kit MiniFiler, présenta un tamaho reducido, permitiendo facilmente su amplificaciôn en restos degradados. 244 DISCUSION Como puede verse en la Tabla D 10 y en Tabla 3 del ARTfCULO 5 fue posible determiner el sexo de todos los individuos estudiados. En primer lugar, se compararon los resultados obtenidos con las determinaciones realizadas por el equipo antropolôgico mediante métodos morfométricos. Los resultados genéticos fueron consistentes con los antropolôgicos en cuatro de los cinco individuos adultos. Sin embargo, para el esqueleto 5SC, clasificado antropolôgicamente como varôn, se pudo amplificar tan solo el marcador correspondiente al cromosoma X. Teniendo en cuenta que para cada uno de los extractos de ADN de este individuo fue posible amplificar repetidamente todos los sistemas incluidos en el kit MiniFiler, se excluye la posibilidad de que la amplificaciôn del cromosoma X représente un allelic dropout. Por otra parte, la probabilidad de que un hombre présente una deleciôn en el fragmento de la amelogenina amplificado en su cromosoma Y y por tanto sea clasificado errôneamente como mujer es muy reducida. Esta frecuencia fue estimada en una amplia base de datos de pobiaciôn europea en un 0,02 % (Steinlechner et al., 2002). A favor de la identificaciôn del esqueleto 5SC como mujer, esta la inscripciôn de la tumba, que cita "Doha Urraca Garcia de Tapia", por lo que cabria esperar su presencia en el sepulcro. Asi los resultados obtenidos mediante el estudio genético permitieron la correcciôn del sexo de este individuo y la corroboraciôn de la hipôtesis histôrica basada en la inscripciôn de la tumba. D.5.2.2 RELACIONES FAMILIARES La comparaciôn entre resultados genéticos e hipôtesis arqueolôgicas permitiô evaluar las posibles relaciones de parentesco entre los individuos estudiados. A partir de los haplotipos consenso se calcularon las LR (razones de verosimilitud, en inglés Likelihood Ratios) y W (probabilidad condicionada a posteriori, calculada a partir del LR, asumiendo la igualdad de las dos hipôtesis - a priori = 0,5) (Gjertson et al., 2007) con un program a (FAMILIAS) especificamente disehado para el estudio de pedigrees a lte rn a tifs y ampliamente empleado en genética forense (Egeland et al., 2000). 245 Cristina Gamba Uno de los intereses arqueologicos era identificar los posibles padres de los dos individuos infantiles (ISC y 2SC). Para ambos solo fue posible amplificar y tipar 4 de los 8 sistemas autosomicos (ver Tabla D 10), reduciendo de manera significativa las probabilidades de filiacion asociadas. En primer lugar, dado que estaban enterrados junto con el individuo masculino 3SC, se investigô la posibilidad de que se tratara de su padre. Sin embargo presentaba con ambos nihos una exclusiôn en el sistema D18S51, con una distancia minima de dos pasos mutacionales (entre alelo 11 y 13, ver Tabla D 10), que se interpréta como probabilidad de paternidad nula. También existe la posibilidad de que se tratara de hijos ilegitimos y por ello no es posible encontrar evidencias genéticas. Se suponfa que los individuos infantiles eran hermanos y que si no eran hijos del individuo 3SC, podrian ser hijos de alguno de los otros individuos enterrados en los otros très sepulcros y enterrados o movidos al sepulcro A sucesivamente. En este caso, los perfiles de ISC y 2SC compartian al menos un alelo en los 4 sistemas tipados (ver Tabla D 10), por lo que la probabilidad de hermandad alcanzô un 68% a pesar del escaso numéro de marcadores analizados. No fue posible encontrar ningün individuo adulto que fuera compatible como padre o madré de ambos nihos. Sin embargo, el individuo 5SC no presentaba ninguna exclusiôn con uno de ellos (2SC, ver Tabla D 10) y se calculô una probabilidad de maternidad del 68 %. El perfil genético de esta mujer no era compatible con el del otro niho, presentando exclusiones en el 50 % de los marcadores analizados (2 sobre 4). Una probabilidad de hermandad o maternidad de airededor del 68 %, como la que se ha obtenido en el présente estudio (ISC / 2SC y 5SC / 2SC), no se admitiria en una prueba estandar forense, sobre todo si se tiene en cuenta que hoy en dia se obtienen valores de probabilidad superiores en varios ôrdenes de magnitud (LR>10ü.0üü y W>99.999 %) (Buckleton et al., 2004). Sin embargo, dado que se trata de muestras arqueolôgicas en las que résulta dificil recuperar ADN, se hace necesario valorar la informaciôn genética como un dato mas en el contexto general de la informaciôn global del estudio. 246 DISCUSION A pesar de los bajos porcentajes obtenidos, estos resultados podrian apoyar diferentes hipôtesis arqueolôgicas: (1) ISC y 2SC podrian tener padres diferentes y la madré de 2SC podria ser 5SC con una probabilidad del 68 %; (2) ISC y 2SC podrian ser hermanos con una probabilidad del 68%, pero en este caso ninguno de los padres estaria enterrado en el conjunto de tumbas analizadas. Sin embargo, los datos arqueolôgicos disponibles no nos permiten decantarnos por ninguna de las dos hipôtesis. Otra de las hipôtesis arqueolôgicas mas firmes, se referia a la posible relaciôn genética paterno-filial entre los individuos 5SC y 6SC, debido a su enterramiento conjunto (sepulcro C) y a la coincidencia entre la edad de la muerte de los dos individuos. Los resultados genéticos no confirmaron esta posibilidad puesto que se encontraron 3 exclusiones sobre 8 sistemas comparados (ver Tabla D 10). No obstante, para los individuos 3SC y 6SC, que presentaban perfiles completos y estaban enterrados en dos tumbas diferentes (A y C respectivamente), se identified una relaciôn paterno-filial asociada a una elevada probabilidad (99,98 %), que los situa incluso por encima del limite para una prueba de paternidad establecido por la jurisprudencia espahola (W=99,75 % correspondiente a un LR= 400, a priori de 0.5, sentencia n^ 593/1992 del Tribunal Supremo, 1992). También en este caso existia cierta sospecha arqueolôgica de esta relaciôn, puesto que en el sepulcro C se podia intuir una inscripciôn poco clara que parecia referirse a la presencia de Gabriel Lôpez de Côrdoba-Hinestrosa en su interior. Segün el archivo histôrico, este ultimo fue el padre de Martin Lôpez de Côrdoba-Hinestrosa (3SC), enterrado en la tumba A. El analisis genético permitiô confirmer esta hipôtesis arqueolôgica. Los valores obtenidos para el indice de paternidad entre 3SC y 6SC y la probabilidad de paternidad fueron respectivamente 4422.24 y 99.98 %, comparables con los valores que se obtienen en el campo forense. Para la interpretaciôn de los resultados hay que tener en cuenta que a la hora de calculer las probabilidades es necesario conocer las frecuencias alélicas de la pobiaciôn a la que pertenecen los individuos estudiados. Estas frecuencias se emplean en el denominador para calculer la probabilidad de coincidencia por azar. Sin embargo, el présente caso no existe informaciôn de la frecuencia y distribuciôn de estos alelos, dado que los individuos estudiados pertenecen a poblaciones pretéritas, cuyas 247 Cristina Gamba distribuciones de frecuencias no tienen por que coincidir con las actuales. Dada la imposibilidad de obtener estos datos, se emplearon aquellos correspondientes a pobiaciôn actual general espahola. AI utilizer las frecuencias de una pobiaciôn actual, estamos suponiendo que ha habido una continuidad genética en estas poblaciones desde el periodo estudiado hasta la actualidad. Este hecho no esta probado, por lo tanto es muy posible que en el calculo se cometa un error, ya sea por sobrestimaciôn o por infraestimaciôn de las frecuencias, error del que no podemos controlar ni su magnitud ni su posible efecto. Otra cuestiôn relacionada en cierta manera con lo anterior es nuestro desconocimiento del grado de endogamia de los grupos humanos a los que pertenecian estos individuos. Lin alto grado de endogamia hace mas probable que los individuos compartan alelos por azar y esto haria que estuviésemos sobrevalorando los indices de paternidad, maternidad o hermandad. 248 CONCLUSIONES 249 250 CONCLUSIONES CONCLUSIONES (ESPANOL) CONCLUSIONES - METODOLOGIA Y VALIDACION DE LOS RESULTADOS Métodos expérimentales 1. El analisis comparativo de diferentes métodos de extracciôn de ADN ha permitido seleccionar e implementar en el laboratorio el protocole disehado por Rohiand y Hofreiter (2007), basado en el empleo de silica, en sustituciôn del protocole habitualmente empleado (basado en el empleo de Fenol/Cloroformo), puesto que esta asociado a una elevada eficiencia en la obtenciôn de resultados replicables. Este protocole élimina eficazmente las moléculas inhibidoras, évita la exposiciôn a sustancias tôxicas volatiles, permite solapar diferentes tandas de extracciôn, filtrar las soluciones y emplear material estéril en todo momento, es escalable y, en el caso de muestras bien preservadas, el GuSCN puede ser sustituido por dorure sôdico (NaCI), abaratando considerablemente el coste del protocolo. 2. Se ha demostrado la elevada eficiencia del Multiplex PCR kit de QIAGEN en la amplificaciôn de aDNA, aunque su elevada sensibilidad también se asocia a una amplificaciôn de moléculas contaminantes en el caso de muestras muy degradadas o con bajo contenido de ADN. Permite, sin embargo, amplificar muestras con alto contenido de inhibidores, por lo que el costo- beneficio de todos estos factores es claramente positivo. 3. Ha sido posible obtener informaciôn genética de marcadores nucleares a partir de muestras antiguas mediante la utilizaciôn de herramientas disehadas para el campo forense, como el AmpFÎSTR* MiniFiler™ PCR Amplification Kit de Applied Biosystems, aunque el éxito en la amplificaciôn esta sujeto a la buena preservaciôn de las muestras. Asi mismo, el software 251 Cristina Gamba empleado ha sido de utilidad para aceptar y/o rechazar hipôtesis arqueolôgicas de parentesco. 4. Con los protocolos utilizados ha sido posible obtener informaciôn genética reproducible a partir de muestras de mas de 7.000 ahos de antigüedad de entornos templados. Prospecciôn 5. La procedencia de la muestra es la variable que mas influye en la recuperaciôn de ADN a partir de muestras arqueolôgicas. El entorno de deposiciôn parece jugar un papel fundamental en la preservaciôn molecular del ADN, mas importante que la antigüedad de la muestra. 6. La cuantificaciôn espectrofotométrica del ADN mediante la absorbancia de UV no refleja el contenido de ADN amplificable ni el contenido de moléculas inhibidoras, revelandose como una medida no apta para estudios prospectives en el campo del ADN antiguo. Validaciôn de los resultados 7. La contaminaciôn detectada mediante amplificaciôn reiterada y secuenciaciôn de los blancos de extracciôn (7 %) corresponde a contaminaciôn ambiental. Es presumible que estos contaminantes ambientales también afecten a muestras degradadas. Sin embargo, no es posible confundir este tipo de contaminaciôn con los resultados endôgenos a la muestra, ya que ünicamente los resultados endôgenos son reproducibles. 8. La ausencia de contaminaciôn en los blancos de PCR no es suficiente para garantizar su ausencia en las muestras. Esta puede ser detectada mediante la comparaciôn de los perfiles genéticos obtenidos con los de los manipuladores y de las muestras analizadas en paralelo. 252 CONCLUSIONES 9. Las principales fuentes de contaminaciôn detectadas secuenciando los amplificados son el investigador y el personal que ha manipulado la muestra con anterioridad a su analisis en el laboratorio (antropôlogos y arqueôlogos). Por lo tanto la obtenciôn de perfiles genéticos de todas aquellas personas que hayan entrado en contacto con la muestra es de suma importancia. 10. La replicaciôn del 62,96% de los resultados en un segundo laboratorio (LAPP-PACEA, Université de Bordeaux 1 - CNRS, Talence, Francia) refuerza la validez de los resultados obtenidos. CONCLUSIONES - ESTUDIO DIACRONICO-POBLACIONAL Haplotipos y Haplogrupos 11. Los haplotipos compartidos entre diferentes individuos de un mismo yacimiento (Puig de la Nau y Can Sadurni) sugieren la presencia de relaciones directes a lo largo de la Imea materna o cierto grado de endogamia. 12. El haplotipo 16147T 16223T 16362C, compartido entre un individuo neolltico cardial de Can Sadurni y uno post-cardial de Sant Pau del Camp, es compatible con una hipôtesis de continuidad genética entre estos dos periodos, puesto que no se ha detectado en las demas poblaciones antiguas y modernas comparadas. 13. El ünico haplogrupo detectado en todos los conjuntos poblacionales estudiados es el haplogrupo K, que podria representar un marcador de continuidad genética desde el Neolltico hasta la pobiaciôn ibera en el noreste de la Peninsula Ibérica. Este haplogrupo se encuentra présente en muestras neoliticas de Prôximo Oriente, Europa Central y Francia, apuntando a su posible asociaciôn con la expansiôn neolitica. 253 Cristina Gamba 14. En las muestras neoliticas estudiadas no se han detectado aquellos haplogrupos (J, T1 y U3) asociados a la expansion neoh'tica desde la genética de poblaciones actuales. Estos resultados sugieren que estos haplogrupos no estuvieron necesariamente asociados con la llegada de nueva pobiaciôn neoh'tica, poniendo en discusiôn las conclusiones derivadas de estudios basados en la genética de poblaciones actuales. 15. Los resultados obtenidos sugieren afinidad entre las primeras comunidades neoliticas del Levante espahol y la pobiaciôn actual de Prôximo Oriente, por la presencia de haplogrupos compartidos (N* y XI), poco comunes en la pobiaciôn europea actual. Estos datos sugieren un movimiento poblacional desde Prôximo Oriente asociado a la neolitizaciôn del noreste de la Peninsula Ibérica. 16. En el conjunto de datos analizados, también destaca la presencia del haplogrupo US asociado a la cultura mesoh'tica centro y norte europea. Este resultado podn'a sugerir cierta continuidad genética con el sustrato paleoh'tico. Modelos demograficos y simulaciones 17. Los modelos panmicticos no son adecuados para el estudio de los procesos demograficos ocurridos en Europa y en la Peninsula Ibérica desde la llegada del hombre moderno hasta la actualidad, sin embargo los modelos estructurados permiten explicar los datos genéticos de manera mas exhaustiva. 18. Los resultados de simulaciôn llevados a cabo con la pobiaciôn neoh'tica antigua sugieren la llegada a principios del Neolltico de pequehos grupos genética y culturalmente en conexiôn con Prôximo Oriente. También sugieren que durante este periodo la dériva genética jugô un papel importante y que el modelo que mejor se ajusta a los resultados es una colonizaciôn pionera de los primeros grupos neoh'ticos en el noreste de la Peninsula Ibérica. 254 CONCLUSIONES 19. Los resultadüs apuntan a la presencia de cierta continuidad genética desde el Neolitico Medio hasta la actualidad, exceptuando la poblacion ibera. Esta ultima présenta cierta diferenciaciôn respecte a todas las demas poblaciones. Dado que los individuos analizados no fueron incinerados como requeria la tradiciôn funeraria de ese periodo, cabe pensar que pertenecieran a un grupo étnico diferenciado con una composiciôn genética distinta. Para confirmer esta hipotesis séria necesario ampliar el conjunto muestral. CONCLUSIONES - RELACIONES FAMILIARES 20. La repeticiôn de las fa ses de extracciôn y amplificaciôn de ADN para un mmimo de dos muestras por individuo y la correcte interpretaciôn de los perfiles genéticos de nuDNA ha permitido obtener cuatro perfiles completes y très parciales a partir de siete muestras medievales. 21. Ha side posible determiner el sexe molecularmente en el 100 % de los cases, incluidos los individuos infantiles, para los cuales no fue posible una determinaciôn antropométrica. Ademas, se ha determinado el sexe femenino del individuo 5SC, clasificado antropométricamente como varôn, confirmando la concordancia entre la inscripcion de la tumba (que reza Doha Urraca Garda de Tapia) y el cuerpo inhumado en su interior. 22. El analisis genético ha permitido excluir la hipotesis arqueolôgica de paternidad entre los individuos infantiles enterrados junte con un individuo adulte. Sin embargo, este ultime se ha podido relacionar con otro espécimen enterrado en un sepulcro diferente con una elevada probabilidad (99,98%), confirmando otra hipotesis arqueolôgica que suponia una relaciôn paterno-filial entre ellos, basada en inscripciones sépulcrales poco claras. 255 Cristina Gamba 23. Existe una probabilidad menos elevada (68%) de que los dos individuos infantiles sean hermanos o de que uno de ellos sea hijo del individuo femenino 5SC. Estas probabilidades reducidas se deben a la obtenciôn de perfiles parciales para los individuos infantiles. En estos casos la amplificaciôn de ADN résulta menos eficiente debido a la ausencia de piezas dentales. 256 CONCLUSIONS 257 258 CONCLUSIONS CONCLUSIONS - METHODOLOGY AND VALIDATION OF THE RESULTS Experimental Methods 1. The comparative analysis of different DNA extraction methods has allowed us to select the protocol designed by Rohland and Hofreiter (2007), based on the use of silica, as a substitute for the Phenol/Chloroform based method that was commonly used in our laboratory. The former protocol is highly efficient in obtaining validated results and in eliminating inhibitors. Moreover, it does not imply exposure to toxic volatile reagents, it is scalable and it allows the overlapping of different extraction sets, the filtering of the solutions and the use of sterile materials. When working with well- preserved samples, GuSCN can be replaced by NaCI, considerably reducing the costs of the protocol. 2. It has been shown that the Multiplex PCR kit (QIAGEN) is an efficient protocol for aDNA amplification. Although its high sensitivity may bring with it a greater probability of amplifying contaminants when working with extremely damaged samples, it allows the analyses of inhibited DNA extracts. In this sense, the cost-benefit ratio is positive. 3. It has been possible to obtain genetic information from nuclear markers in ancient samples using some tools designed for the field of forensics, such as the AMPF€STR® MiniFiled'^ PCR Amplification Kit [Applied Biosystems). However, in this case amplification success depends on sample preservation. Moreover, the software has been extremely useful in accepting and/or rejecting archaeological hypotheses of kinship. 259 4. The methodological approach made it possible to obtain reproducible genetic information from samples that were over 7,000 years old and had come from temperate environments. Prospection 5. Sample origin and preservation are the variables that most influence the recovery of DNA from archaeological samples. The depositional environment seems to play a more important role than sample age in DNA molecular preservation. 6. Spectrophotometric quantification of DNA by UV absorbance does not show either the amplifiable DNA content or the presence of inhibitory molecules. This is not an appropriate screening method in the field of ancient DNA. Validation of results 7. The contamination detected through the repeated amplification of extraction blanks (7 %) corresponds to environmental DNA. These air contaminants are also expected to affect degraded samples. However, it is not possible to confuse this kind of contamination with endogenous DNA because only endogenous results are reproducible. 8. The fact that contamination in PCR blanks goes undetected is not enough to guarantee its absence in the samples. This kind of contamination can be detected by comparing genetic profiles of the samples with the ones obtained from the researchers in charge of handling them and with other samples analysed in parallel. 9. Major sources of contamination detected by PCR amplicon sequencing include the laboratory researchers and previous handlers (anthropologists and archaeologists). Therefore, obtaining handlers' profiles is of utter importance. 260 CONCLUSIONS 10. The replication of results (62.96 %) in a second laboratory (LAPP-PACE, Université de Bordeaux 1 - CNRS, Talence, France) strengthens the validity of the results obtained. CONCLUSIONS - DIACHRONIC-POPULATIONS STUDY Haplotypes and Haplogroups 11. Shared haplotypes among skeletons from the same site (Puig de la Nau and Can Sadurni) suggest the existence of maternal lineage relationships or a certain degree of intra-site endogamy. 12. The haplotype 16362C 16223T 16147T is shared between one Cardial Neolithic individual from Can Sadurni and one post-Cardial specimen from Sant Pau del Camp. This might reflect some genetic continuity between these two periods, since this haplotype has not been found in the ancient and modern populations compared. 13. The only mitochondrial haplogroup found in all ancient datasets is haplogroup K. This might represent a marker of genetic continuity from the Neolithic to the Iberian age in North Eastern Iberia. In addition, this haplogroup has been detected in Near Eastern Neolithic samples and in Neolithic specimens from Central Europe and France, pointing to a possible association of this marker with Neolithic expansion. 14. Flaplogroups J, T l, and U3, linked to Neolithic expansion according to modern population genetics studies, have not been found in the Neolithic samples studied here. This result suggests that these haplogroups were not necessarily linked to the arrival of the Neolithic populations, which casts doubts upon the conclusions drawn from studies based on modern population genetics. 15. The results obtained suggest some affinities between North Eastern Iberian Early Neolithic communities and current Near Eastern populations, since 261 they share haplogroups N* and XI, both uncommon in modern European populations. These data suggest a Neolithic migration from the Near East to North Eastern Iberia. 16. Haplogroup U5, which has been associated to Central and Northern European Mesolithic culture, is also present in our ancient dataset. This result might suggest a certain degree of genetic continuity w ith the previous Palaeolithic substrate. Demographic models and simulations 17. Panmictic models are not suitable for the study of the demographic processes that took place in Europe and in the Iberian Peninsula since the arrival of modern humans. Structured models explain ancient and modern genetic data more accurately. 18. Early Neolithic population simulation results suggest that small groups with genetic and cultural connections to the Near East arrived at the beginning of the Neolithic. Moreover, these results highlight the important role that genetic drift played during this period. In this framework, the model which best f it with the results obtained in North Eastern Iberia is a pioneer colonization of the first Neolithic groups. 19. Our results suggest the presence of some genetic continuity from the Middle Neolithic to present times, except for the Iberian period, which is genetically different from all other populations compared. The Iberian specimens analyzed were not incinerated, as required by the funerary tradition of that period. As a consequence, it is possible that they belonged to a distinct ethnic group with a different genetic pool. To confirm this hypothesis it would be necessary to extend our dataset. 262 CONCLUSIONS CONCLUSIONS - KINSHIP RELATIONSHIPS 20. Four complete and three partial nuDNA profiles were obtained from seven medieval specimens. This was possible by repeating DNA extractions and amplifications for a minimum of two samples per individual and by a suitable interpretation of the genetic profiles. 21. Sex was molecularly determined in all the individuals studied, including infants, for whom an anthropometric determination was not possible. Furthermore, individual 5SC, anthropometrically classified as a male, was genetically typed as a female. This confirms the correlation between the inscription found at the tomb (which reads Mrs. Urraca Garcia de Tapia) and the body buried inside. 22. The archaeological hypothesis of paternity between the two infants buried with an adult was ruled out through genetic analysis. However, the latter was genetically related to another specimen buried in a different tomb, with a high probability of paternity (99.98 %). This result confirms another archaeological hypothesis that assumed a father-son relationship between them based on unclear sepulchral inscriptions. 23. The sibling relationship between the two infants and the maternity of one of them by 5SC are supported by lower probabilities (68%). Partial profiles recovered for both infants are responsible of these low probability values. The absence of dental samples in newborn individuals made DNA amplification less efficient. 263 264 BIBLIOGRAFIA 265 266 Allouche M, Hamdoum M, Mangin P, y Castella V. 2008. Genetic identification of decomposed cadavers using nails as DNA source. Forensic Science International: Genetics 3:46-49. Alonso A, Martin P, Albarran C, Garcia P, Garcia 0, de Simon LF, Garcia-Flirschfeld J, Sancho M, de La Rua C, y Fernandez-Piqueras J. 2004. Real-time PCR designs to estimate nuclear and mitochondrial DNA copy number in forensic and ancient DNA studies. Forensic Sci. Int 139:141-149. Alroy J. 2001. A Multispecies Overkill Simulation of the End-Pleistocene Megafaunal Mass Extinction. Science 292:1893 -1896. Alvarez AJ, Khanna M, Toranzos GA, y Stotzky G. 1998. Amplification of DNA bound on clay minerals. Molecular Ecology 7:775-778. Alvarez Garcia A, Munoz I, Pestoni C, Lareu MV, Rodriguez-Calvo MS, y Carracedo A. 1996. Effect of environmental factors on PCR-DNA analysis from dental pulp. Int. J. Legal Med 109:125-129. Alvarez-lglesias V, Mosquera-Miguel A, Cerezo M, Quintans B, Zarrabeitia MT, Cusco I, Lareu MV, Garcia O, Pérez-Jurado L, Carracedo A, et al. 2009. New population and phylogenetic features of the internal variation within mitochondrial DNA macro- haplogroup RO. PLoS ONE 4:e5112. Ammerman AJ, y Cavalli-Sforza LL. 1971. Measuring the Rate of Spread of Early Farming in Europe. Man 6:674-688. Ammerman AJ, y Cavalli-Sforza LL. 1984. The Neolithic Transition and the Genetics of Populations in Europe. Princeton Univ Pr. Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon 1C, Nierlich DP, Roe BA, Sanger F, et al. 1981. Sequence and organization of the human mitochondrial genome. Nature 290:457-465. Andrews RM, Kubacka I, Chinnery PF, Lightowlers RN, Turnbull DM, y Howell N. 1999. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA. Nat Genet 23:147. Arroyo-Pardo E, Ocana MA, Arroyo JJ, Pérez-Pérez A, Turbon D, Trancho G, Rodn'guez-Albarran MS, Casas JD, Robledo B, y Bandrés F. 2002. HPLC and UV-Spectrophotometry Examination of Ancient DNA and PCR Inhibitors in Old Human Remains. Ancient Biomolecules 4:33. Balaresque P, Bowden GR, Adams SM, Leung H-Y, King TE, Rosser ZH, Goodwin J, Moisan J-P, Richard C, Millward A, et al. 2010. A Predominantly Neolithic Origin for European Paternal Lineages. PLoS Biol 8:el000285. Balding DJ, y Buckleton J. 2009. Interpreting low template DNA profiles. Forensic Science International: Genetics 4:1-10. Bandelt H-J, Macaulay V, y Richards M eds. 2006. Estimation of Mutation Rates and Coalescence Times: Some Caveats. En: Human Mitochondrial DNA and the Evolution of 267 Cristina Gamba Homo sapiens. Vol. 18. Springer Berlin Heidelberg. Bandelt H-J. 2007. Clock debate: when times are a-changin': Time dependency of molecular rate estimates: tempest in a teacup. Heredity 100:1-2. Barandiaran I, Marti Oliver B, y Rincon Martinez M. 2007. Prehistoria de la Peninsula Ibérica. 6o ed. Editorial Ariel, S.A. Barbujani G, Bertorelle G, y Chikhi L. 1998. Evidence for Paleolithic and Neolithic gene flow in Europe. Am J Hum Genet 62:488-492. Barbujani G, y Bertorelle G. 2001. Genetics and the population history of Europe. Proceedings of the National Academy of Sciences 98:22 -25. Barbujani G, y Chikhi L. 2006. DNAs from the European Neolithic. Heredity 97:84-85. Barbujani G, y Goldstein DB. 2004. Africans and Asians abroad: genetic diversity in Europe. Annu Rev Genomics Hum Genet 5:119-150. Beckmann JS, Estivill X, y Antonarakis SE. 2007. Copy number variants and genetic traits: closer to the resolution of phenotypic to genotypic variability. Nat. Rev. Genet 8:639-646. Belle EMS, Ramakrishnan U, Mountain JL, y Barbujani G. 2006. Serial coalescent simulations suggest a weak genealogical relationship between Etruscans and modern Tuscans. Proc. Natl. Acad. Sci. U.S.A 103:8012-8017. Bermejo Tirado J. 2007. Breve historia de los iberos. Ediciones Nowtilus, S.L. Bermisheva M, Tam bets K, Villems R, y Khusnutdinova E. 2002. Diversity of mitochondrial DNA haplotypes in ethnic populations of the Volga-Ural region of Russia. Mol. Biol. (Mosk.) 36:990-1001. Bernabeu J. 2002. The social and symbolic context of Neolithization. En: El paisaje en el Neoli'tico mediterraneo. Valencia: Saguntum-PLAV, extra 5. p 209-235. Bernabo Brea L 1946. Gli Scavi nella caverna delle Arene Candide. Bordighera: Istituto di Studi Liguri. Bertranpetit J, y Cavalli-Sforza LL. 1991. A genetic reconstruction of the history of the population of the Iberian Peninsula. Ann. Hum. Genet 55:51-67. Blasco A, Edo M, Villalba MJ, y Sana M. 2005. Primeros datos sobre la utilizacion sépulcral de la Cueva de Can Sadurni (Begues, Baix Llobregat) en el Neolitico Cardial. En: Actas del III Congreso del Neolitico en la Peninsula Ibérica. Pablo Arias, Roberto Otanon, Cristina Garcia-Monco. Santander: Servicio de Publicaciones, Universidad de Cantabria. Blow MJ, Zhang T, Woyke T, Speller CF, Krivoshapkin A, Yang DY, Derevianko A, y Rubin EM. 2008. Identification of ancient remains through genomic sequencing. Genome Res 18:1347-1353. Blazquez J, Alvar J, y Wagner C. 1999. Fenicios y cartagineses en el Mediterraneo. Ediciones Catedra, S.A. Bocquet-Appel J-P, y Bar-Yosef 0. 2008. The Neolithic Demographic Transition and its Consequences. Dordrecht: Springer Netherlands. 268 Bogdanowicz W , Allen M , Branicki W , Lembring M , Gajewska M , y Kupiec T. 2009. Genetic identification of putative remains o f the famous astronom er Nicolaus Copernicus. Proceedings of the National Academy o f Sciences 106:12279 -12282. Bollongino R, Tresset A, y Vigne J-D. 2008. Environment and excavation: Pre-lab impacts on ancient DNA analyses. Comptes Rendus Palevol 7:91-98. Bosch Gimpera P. 1919. Prehistoria catalana. En: Enciclopedia catalana. Vol. XVI. Editorial catalana. Barcelona. Bosch Gimpera P. 1932. Etnologia de la peninsula ibérica. Barcelona: Editorial Alpha. Bosch Gimpera P. 1940. The Types and Chronology of W estern European Beakers. M an:6-10. Bouakaze C, Keyser C, Amory S, Crubézy E, y Ludes B. 2007. First successful assay o f Y-SNP typing by SNaPshot minisequencing on ancient DNA. Int. J. Legal M ed 121:493-499. Bouwman AS, y Brown TA. 2002. Comparison Between Silica-based Methods for the Extraction of DNA from Fluman Bones from 18th to M id-19th Century London. Ancient Biomolecules 4:173-178. Bramanti B, Thomas MG, Haak W , Unterlaender M , Jores P, Tam bets K, Antanaitis-Jacobs I, Haidle M N , Jankauskas R, Kind C-J, et al. 2009. Genetic Discontinuity Between Local Hunter-Gatherers and Central Europe's First Farmers. Science 326:137-140. Briggs AW, Good JM, Green RE, Krause J, Maricic T, Stenzel U, Lalueza-Fox C, Rudan P, B raj ko vie D, Kucan Z, et al. 2009. Targeted Retrieval and Analysis o f Five Neandertal mtDNA Genomes. Science 325:318 -321. Brotherton P, Endicott P, Sanchez JJ, Beaumont M , Barnett R, Austin J, y Cooper A. 2007. Novel high-resolution characterization of ancient DNA reveals C > U-type base modification events as the sole cause o f post m ortem miscoding lesions. Nucleic Acids Res 35:5717- 5728. Buckleton JS, Clayton T, y Triggs C. 2004. Parentage Testing. En: Forensic DNA Evidence Interpretation, lo ed. CRC Press, p 349-402. Budowle B, Eisenberg AJ, y van Daal A. 2009. Validity of low copy num ber typing and applications to forensic science. Croat. M ed. J. 50:207-217. Burger J, Hum mel S, Hermann B, y Henke W . 1999. DNA preservation: a microsatellite-DNA study on ancient skeletal remains. Electrophoresis 20:1722-1728. Burger J, Kirchner M , Bramanti B, Haak W , y Thomas M G. 2007. Absence o f the lactase- persistence-associated allele in early Neolithic Europeans. Proceedings of the National Academy of Sciences 104:3736 -3741. Busby GBJ, Brisighelli F, Sànchez-Diz P, Ramos-Luis E, Martinez-Cadenas C, Thomas MG, Bradley DG, Gusmao L, W inney B, Bodmer W, et al. 2011. The peopling of Europe and the cautionary tale of Y chromosome lineage R-M 269. Proceedings of the Royal Society B: Biological Sciences. Butler JM. 2005. Forensic DNA typing: biology, technology, and genetics of STR markers. Academic Press. 269 Cristina Gamba Cabellos T. 2008. Cova de Can Sadurni (Bergues, Baix de Llobregat). Muestras seleccionadas para el analisis de ADN. Informe Antropolôgico. Universidad Complutense de Madrid. Cai D, Tang Z, Han L, Speller CF, Yang DY, Ma X, Cao J, Zhu H, y Zhou H. 2009. Ancient DNA provides new insights into the origin of the Chinese domestic horse. Journal of Archaeological Science 36:835-842. Cann RL, Stoneking M, y Wilson AC. 1987. Mitochondrial DNA and human evolution. Nature 325:31-36. Cano RJ, Borucki MK, Higby-Schweitzer M, Poinar HN, Poinar GO Jr, y Pollard KJ. 1994. Bacillus DNA in fossil bees: an ancient symbiosis? Appl. Environ. Microbiol 60:2164-2167. Cano RJ, Poinar HN, Pieniazek NJ, Acra A, y Poinar GO Jr. 1993. Amplification and sequencing of DNA from a 120-135-million-year-old weevil. Nature 363:536-538. Capelli C, Onofri V, Brisighelli F, Boschi I, Scarnicci F, Masullo M, Ferri G, Tofanelli S, Tagliabracci A, Gusmao L, et al. 2009. Moors and Saracens in Europe; estimating the medieval North African male legacy in southern Europe. Eur. J. Hum. Genet 17:848-852. Caramelli D, Lalueza-Fox C, Capelli C, Lari M, Sampietro ML, Gigli E, Milani L, Pilli E, Guimaraes S, Chiarelli B, et al. 2007. Genetic analysis of the skeletal remains attributed to Francesco Petrarca. Forensic Science International 173:36-40. Caramelli D, Lalueza-Fox C, Vernesi C, Lari M, Casoli A, Mallegni F, Chiarelli B, Dupanloup I, Bertranpetit J, Barbujani G, et al. 2003. Evidence for a genetic discontinuity between Neandertals and 24,000-year-old anatomically modern Europeans. Proc. Natl. Acad. Sci. U.S.A 100:6593-6597. Cavalli-Sforza LL, Menozzi P, y Piazza A. 1994. The history and geography of human genes. Princeton University Press. Cavalli-Sforza LL, y Minch E. 1997. Paleolithic and Neolithic lineages in the European mitochondrial gene pool. Am J Hum Genet 61:247-254. Cherni L, Fernandes V, Pereira JB, Costa MD, Goios A, Frigi S, Yacoubi-Loueslati B, Amor MB, Slama A, Amorim A, et al. 2009. Post-last glacial maximum expansion from Iberia to North Africa revealed by fine characterization of mtDNA H haplogroup in Tunisia. American Journal of Physical Anthropology 139:253-260. Chikhi L, Destro-Bisol G, Bertorelle G, Pascali V, y Barbujani G. 1998. Clines of nuclear DNA markers suggest a largely Neolithic ancestry of the European gene pool. Proc Natl Acad Sci USA95:9053-9058. Chikhi L, Nichols RA, Barbujani G, y Beaumont MA. 2002. Y genetic data support the Neolithic demie diffusion model. Proc. Natl. Acad. Sci. U.S.A 99:11008-11013. Childe VG. 1930. The origin of the Bell-Beaker. Man XXX. Chilvers ER, Bouwman AS, Brown KA, Arnott RG, Prag AJNW, y Brown TA. 2008. Ancient DNA in human bones from Neolithic and Bronze Age sites in Greece and Crete. Journal of Archaeological Science 35:2707-2714. Chinnery PF. 2006. Mitochondrial DNA in Homo Sapiens. En: Bandelt H-J, Macaulay V, Richards M, editores. Human Mitochondrial DNA and the Evolution of Homo sapiens. Vol. 18. 270 Nucleic Acids and Molecular Biology. Springer Berlin Heidelberg, p 3-15. Clark PL), Dyke AS, Shakun JD, Carlson AE, Clark J, Wohlfarth B, Mitrovica JX, Hostetler SW, y McCabe AM. 2009. The Last Glacial Maximum. Science 325:710 -714. Clayton TM, Whitaker JP, Sparkes R, y Gill P. 1998. Analysis and interpretation of mixed forensic stains using DNA STR profiling. Forensic Sci. Int 91:55-70. Coble MD, Loreille OM, Wadhams MJ, Edson SM, Maynard K, Meyer CE, Niederstatter H, Berger C, Berger B, Falsetti AB, et al. 2009. Mystery Solved: The Identification of the Two Missing Romanov Children Using DNA Analysis. PLoS ONE 4:e4838. Cohen MN. 1984. Paleopathology at the Origins of Agriculture, lo ed. Academic Press. Collins MJ, Penkman KEH, Rohland N, Shapiro B, Dobberstein RC, Ritz-Timme S, y Hofreiter M. 2009. Is amino acid racemization a useful tool for screening for ancient DNA in bone? Proceedings of the Royal Society B: Biological Sciences 276:2971 -2977. Condemi S. 2011. Continuity and Discontinuity in the Peopling of Europe. Springer. Cooper A, y Poinar HN. 2000. Ancient DNA: Do It Right or Not at All. Science 289:1139. Cruciani F, Trombetta B, Antonelli C, Pascone R, Valesini G, Scaizi V, Vona G, Melegh B, Zagradisnik B, Assum G, et al. 2011. Strong intra- and inter continental differentiation revealed by Y chromosome SNPs M269, U106 and U152. Forensic Sci Int Genet 5:e49-52. Csanyi B, Bogacsi-Szabo E, Tomory G, Czibula A, Priskin K, Csosz A, Mende B, Lango P, Csete K, Zsolnai A, et al. 2008. Y-Chromosome Analysis of Ancient Hungarian and Two Modern Hungarian-Speaking Populations from the Carpathian Basin. Annals of Human Genetics 72:519-534. Currat M, Poloni E, y Sanchez-Mazas A. 2010. Human genetic differentiation across the Strait of Gibraltar. BMC Evolutionary Biology 10:237. DeSalle R, Barcia M, y Wray C. 1993. PCR jumping in clones of 30-million-year-old DNA fragments from amber preserved termites (Mastotermes electrodominicus). Experientia 49:906-909. DeSalle R, Gatesy J, Wheeler W, y Grimaldi D. 1992. DNA sequences from a fossil termite in Oligo-Miocene amber and their phylogenetic implications. Science 257:1933-1936. Deguilloux M-F, Ricaud S, Leahy R, y Pemonge M-H. 2011a. Analysis of ancient human DNA and primer contamination: one step backward one step forward. Forensic Sci. Int. 210:102- 109. Deguilloux M-F, Soler L, Pemonge M-H, Scar re C, Joussaume R, y Laporte L. 2011b. News from the west: Ancient DNA from a French megalithic burial chamber. Am. J. Phys. Anthropol. 144:108-118. Delibes de Castro G, y Fernandez Miranda M. 1999. Los origenes de la civilizacion: el calcolitico en el Viejo Mundo. Smtesis. Dennell R. 1992. The origins of European crop agriculture. En: The Origins of Crop Agriculture. P. J. Watson and W. Cowan. Washington: Smithsonian Institute Publications, p 71-100. Dolukhanov P. 1993. Foraging and farming groups in north-eastern and north-western Europe: 271 Cristina Gamba identity and interaction. En: Cultural Transformations and Interactions in Eastern Europe. Chapman J, Dolukhanov P. Aldershot: Avebury. Dupanloup I, Bertorelle G, Chikhi L, y Barbujani G. 2004. Estimating the Impact of Prehistoric Admixture on the Genome of Europeans. Molecular Biology and Evolution 21:1361 - 1372. Egeland T, Mostad PF, Mevâg B, y Stenersen M. 2000. Beyond traditional paternity and identification cases. Selecting the most probable pedigree. Forensic Sci. Int 110:47-59. Eiroa JJ. 2006. Nociones de Prehistoria general. Editorial Ariel. Endicott P, y Ho SYW. 2008. A Bayesian evaluation of human mitochondrial substitution rates. Am. J. Hum. Genet 82:895-902. Ennafaa H, Cabrera VM, Abu-Amero KK, Gonzalez AM, Amor MB, Bouhaha R, Dzimiri N, Elgaaied AB, y Larruga JM. 2009. Mitochondrial DNA haplogroup H structure in North Africa. BMC Genet 10:8. Estebaranz F, Fernandez E, Martinez L, Gamba C, Alrousan M, Turbon D, Arroyo Pardo E, Ignasi 0ms J, Pérez Pérez A, y Anfruns J. 2008. Anàlisi antropologica de les restes neolitiques de la caserna de Sant Pau (biometria, denticio, ADNA i mmicroestriaciô dentària). Quarhis: Quaderns d'Arqueologia i Histôria de la Ciutat de Barcelona:76-82. Excoffier L, Novembre J, y Schneider S. 2000. Computer note. SIMCOAL: a general coalescent program for the simulation of molecular data in interconnected populations with arbitrary demography. Journal of Heredity 91:506 -509. Excoffier L, y Lischer HEL. 2010. Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows. Molecular Ecology Resources 10:564-567. Faerman M, Filon D, Kahila G, Greenblatt CL, Smith P, y Oppenheim A. 1995. Sex identification of archaeological human remains based on amplification of the X and Y amelogenin alleles. Gene 167:327-332. Feller EA. 2009. Evaluation of the AmpFISTRRTM MiniFiler (TM) typing Kit: Mixture and non- probative studies. Fernandez E, Ortiz JE, Pérez-Pérez A, Prats E, Turbon D, Torres T, y Arroyo-Pardo E. 2009. Aspartic acid racemization variability in ancient human remains: implications in the prediction of ancient DNA recovery. Journal of Archaeological Science 36:965-972. Fernandez E. 2005. Polimorfismos de DNA mitocondrial en poblaciones antiguas de la cuenca mediterranea. Findlay I, Chan F-Y, Forbes K, y Mitchelson KR. 2001. High throughput genetic diagnosis of single and small numbers of cells. Today's Life Science 13:40-46. Fisher RA. 1937. The Wave of Advance of Advantageous Genes. Annals of Eugenics 7:355-359. Fletcher D. 1963. Nuevos datos sobre las relaciones neoliticas entre las costas espanolas y el Mediterraneo Oriental. En: Homenaje a P. Bosch Gimpera.. p 167-172. Fortea J, y Marti B. 1984. Consideraciones sobre los inicios del Neolitico en el Mediterraneo 272 espanol. Zephyrus XXXV1I-XXXVIII:167-199. Fortea J. 1973. Los complejos microlaminares y geométricos del Epipaleolitico mediterraneo espanol. Fullola i Pericot J, y Nadal Lorenzo J. 2005. Introduccion a la prehistoria. Editorial UOC, S.L. Gabriel SB, Schaffner SF, Nguyen H, Moore JM, Roy J, Blumenstiel B, Higgins J, DeFelice M, Lochner A, Faggart M, et al. 2002. The Structure of Haplotype Blocks in the Human Genome. Science 296:2225 -2229. Gamba C, Fernandez E, Oliver A, Tirado M, Baeza C, Lopezparra A, y Arroyopardo E. 2008. Population genetics and DNA preservation in ancient human remains from Eastern Spain. Forensic Science International: Genetics Supplement Series 1:462-464. Gamba C, Fernandez E, Tirado M, Palomo S, Deguilloux M-F, Pemonge M-H, y Arroyo-Pardo E. 2011. ADN ancien d'échantillons néolithiques de la péninsule Ibérique. En: Bulletins de la Société Préhistorique Française. Actes du XXVIle Congrès Préhistorique de France Transitions, Ruptures et Continuité durant la Préhistoire Transitions, Ruptures, and Continuity in Prehistory. Bordeaux - Les Eyzies. Gamble C, Davies W, Pettitt P, Hazelwood L, y Richards M. 2005. The Archaeological and Genetic Foundations of the European Population During the Late Glacial: Implications For. Cambridge Archaeological Journal 15:193-223. Gamble C, Davies W, Pettitt P, y Richards M. 2004. Climate change and evolving human diversity in Europe during the last glacial. Philos Trans R Soc Lond B Biol Sci 359:243-254. Garcia 0, Fregel R, Larruga JM, Alvarez V, Yurrebaso I, Cabrera VM, y Gonzalez AM. 2011. Using mitochondrial DNA to test the hypothesis of a European post-glacial human recolonization from the Franco-Cantabrian refuge. Heredity 106:37-45. Garcia-Bour J, Pérez-Pérez A, Alvarez S, Fernandez E, Lopez-Parra AM, Arroyo-Pardo E, y Turbon D. 2004. Early population differentiation in extinct aborigines from Tierra del Fuego-Patagonia: ancient mtDNA sequences and Y-chromosome STR characterization. Am. J. Phys. Anthropol 123:361-370. Garrido-Pena R. 2007. El fenômeno campaniforme: un siglo de debates sobre un enigma sin resolver. En: Acercandonos al pasado: Prehistoria en 4 actos. El fenômeno campaniforme: un siglo de debates sobre un enigma sin resolver. Madrid: Museo Arqueolôgico Nacional. Ministerio de Cultura. Gerstenberger J, Hummel S, Schultes T, Hack B, y Herrmann B. 1999. Reconstruction of a historical genealogy by means of STR analysis and Y-haplotyping of ancient DNA. Eur. J. Hum. Genet 7:469-477. Gilbert MTP, Binladen J, Miller W, Wiuf C, \A/illerslev E, Poinar H, Carlson JE, Leebens-Mack JH, y Schuster SC. 2007. Recharacterization of ancient DNA miscoding lesions: insights in the era of sequencing-by-synthesis. Nucleic Acids Res 35:1-10. Gilbert MTP, Hansen AJ, Willerslev E, Rudbeck L, Barnes I, Lynnerup N, y Cooper A. 2003a. Characterization of Genetic Miscoding Lesions Caused by Postmortem Damage. Am J Hum Genet 72:48-61. Gilbert MTP, Shapiro B, Drummond A, y Cooper A. 2005. Post-mortem DNA damage hotspots 273 Cristina Gamba in Bison (Bison bison) provide evidence for both damage and mutational hotspots in human mitochondrial DNA. Journal of Archaeological Science 32:1053-1060. Gilbert MTP, Willerslev E, Hansen AJ, Barnes I, Rudbeck L, Lynnerup N, y Cooper A. 2003b. Distribution Patterns of Postmortem Damage in Human Mitochondrial DNA. The American Journal of Human Genetics 72:32-47. Gilbert MTP. 2006. Postmortem Damage of Mitochondrial DNA. En: Bandelt H-J, Macaulay V, Richards M, editores. Human Mitochondrial DNA and the Evolution of Homo sapiens. Vol. 18. Springer Berlin Heidelberg, p 91-115. Gill P, Ivanov PL, Kimpton C, Piercy R, Benson N, Tully G, Evett I, Hagelberg E, y Sullivan K. 1994. Identification of the remains of the Romanov family by DNA analysis. Nat Genet 6:130- 135. Gill P, Puch-Solis R, y Curran J. 2009. The low-template-DNA (stochastic) thresholda€"lts determination relative to risk analysis for national DNA databases. Forensic Science International: Genetics 3:104-111. Gill P, Sparkes R, y Kimpton C. 1997. Development of guidelines to designate alleles using an STR multiplex system. Forensic Sci. Int 89:185-197. Gill P, Whitaker J, Flaxman C, Brown N, y Buckleton J. 2000. An investigation of the rigor of interpretation rules for STRs derived from less than 100 pg of DNA. Forensic Sci. Int 112:17-40. Gimbutas M. 1970. Proto-Indo-European Culture: The Kurgan Culture during the Fifth, Fourth, and Third Millennia B.C. En: Indo-European and Indo-Europeans: Papers Presented at the Third Indo-European Conference at the University of Pennsylvania. Cardona, George; Hoenigswald, Henry M.; Senn, Alfred. Philadelphia: University of Pennsylvania Press, p 155-197. Gjertson DW, Brenner CH, Baur MP, Carracedo A, Guidet F, Luque JA, Lessig R, Mayr WR, Pascali VL, Prinz M, et al. 2007. ISFG: Recommendations on biostatistics in paternity testing. Forensic Science International: Genetics 1:223-231. Glasel JA. 1995. Validity of nucleic acid purities monitored by 260nm/280nm absorbance ratios. BioTechniques 18:62-63. Golenberg EM, Giannasi DE, Clegg MT, Smiley CJ, Durbin M, Henderson D, y Zurawski G. 1990. Chloroplast DNA sequence from a miocene Magnolia species. Nature 344:656-658. Gonzalez AM, Brehm A, Pérez JA, Maca-Meyer N, Flores C, y Cabrera VM. 2003. Mitochondrial DNA affinities at the Atlantic fringe of Europe. Am. J. Phys. Anthropol 120:391-404. Gonçalves R, Freitas A, Branco M, Rosa A, Fernandes AT, Zhivotovsky LA, Underhill PA, Kivisild T, y Brehm A. 2005. Y-chromosome lineages from Portugal, Madeira and Açores record elements of Sephardim and Berber ancestry. Ann. Hum. Genet 69:443-454. Gray RD, y Atkinson QD. 2003. Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature 426:435-439. Green RE, Krause J, Briggs AW, Maricic T, Stenzel U, Kircher M, Patterson N, Li H, Zhai W, Fritz MH-Y, et al. 2010. A Draft Sequence of the Neandertal Genome. Science 328:710 -722. 274 Guilaine J. 1966. Vases Campaniformes décorés à la cordelette dans le sud de France. Arqueologi'a e Historia Xll:287-301. Guilaine J. 2003. La diffusion de l'agriculture en Europe: une hypothèse arythmique. En: De la vague a la tombe. La conquête néolithique de la Méditerranée (8000-2000 avant J.-C). Seuil. Paris, p 103-112. Guy Straus L. 1989. Age of the modem Europeans. Nature 342:476-477. Gérard N, Berriche S, Aouizérate A, Diéterlen F, y Lu cotte G. 2006. North African Berber and Arab influences in the western Mediterranean revealed by Y-chromosome DNA haplotypes. Hum. Biol 78:307-316. Haak W, Balanovsky 0, Sanchez JJ, Koshel S, Zaporozhchenko V, Adler CJ, Der Sarkissian CSI, Brandt G, Schwarz C, Nicklisch N, et al. 2010. Ancient DNA from European early neolithic farmers reveals their near eastern affinities. PLoS Biol 8:el000536. Haak W, Brandt G, de Jong HN, Meyer C, Ganslmeier R, Heyd V, Hawkesworth C, Pike AWG, Meller H, y Alt KW. 2008. Ancient DNA, Strontium isotopes, and osteological analyses shed light on social and kinship organization of the Later Stone Age. Proc Natl Acad Sci L) SA 105:18226-18231. Haak W, Forster P, Bramanti B, Matsumura S, Brandt G, Tanzer M, Villems R, Renfrew C, Gronenborn D, Alt KW, et al. 2005. Ancient DNA from the First European Farmers in 7500-Year-Old Neolithic Sites. Science 310:1016 -1018. Hagelberg E, Sykes B, y Hedges R. 1989. Ancient bone DNA amplified. Nature 342:485. Hagelberg E, y Clegg JB. 1991. Isolation and characterization of DNA from archaeological bone. Proc. Biol. Sci 244:45-50. Handt O, Hoss M, Krings M, y Paabo S. 1994. Ancient DNA: Methodological challenges. Experientia 50:524-529. Hashiyada M, Nakayashiki N, y Funayama M. 2009. Utility validation of extraction of genomic DNA from hard tissues, bone and nail, using PrepFiler "̂ ̂ Forensic DNA Extraction Kit. Forensic Science International: Genetics Supplement Series 2:172-173. Hawass Z, Gad YZ, Ismail S, Khairat R, Fathalla D, Hasan N, Ahmed A, Elleithy H, Ball M, Gaballah F, et al. 2010. Ancestry and Pathology in King Tutankhamun's Family. JAMA: The Journal of the American Medical Association 303:638 -647. Hedges REM, y Millard AR. 1995. Bones and Groundwater: Towards the Modelling of Diagenetic Processes. Journal of Archaeological Science 22:155-164. Herrmann B. 1994. Ancient DNA: recovery and analysis of genetic material from paleontological, archaeological, museum, medical, and forensic specimens. Springer. Heyer E, Zietkiewicz E, Rochowski A, Yotova V, Puymirat J, y Labuda D. 2001. Phylogenetic and familial estimates of mitochondrial substitution rates: study of control region mutations in deep-rooting pedigrees. Am. J. Hum. Genet 69:1113-1126. Higuchi R, Bowman B, Freiberger M, Ryder OA, y Wilson AC. 1984. DNA sequences from the quagga, an extinct member of the horse family. Nature 312:282-284. 275 Cristina Gamba Ho SYW, Shapiro B, Phillips MJ, Cooper A, y Drummond AJ. 2007. Evidence for Time Dependency of Molecular Rate Estimates. Systematic Biology 56:515 -522. Hodder I. 2007. Excavating Catalhoyuk: South, North and KOPAL area reports from the 1995-99 seasons. McDonald Institute for Archaeological Research. Hofreiter M, Jaenicke V, Serre D, Haeseler A von, y Paabo S. 2001a. DNA sequences from multiple amplifications reveal artifacts induced by cytosine deamination in ancient DNA. Nucleic Acids Res 29:4793-4799. Hofreiter M, Serre D, Poinar HN, Kuch M, y Paabo S. 2001b. Ancient DNA. Nat Rev Genet 2:353-359. Howell N, Howell C, y Elson JL. 2008. Molecular clock debate: Time dependency of molecular rate estimates for mtDNA: this is not the time for wishful thinking. Heredity 101:107- 108. Hummel S. 2003. Ancient DNA typing: methods, strategies, and applications. Springer. Hanni C, Brousseau T, Laudet V, y Stehelin D. 1995. isopropanol precipitation removes PCR inhibitors from ancient bone extracts. Nucleic Acids Research 23:881 -882. Hoss M, Jaruga P, Zastawny TH, Dizdaroglu M, y Paabo S. 1996. DNA Damage and DNA Sequence Retrieval from Ancient Tissues. Nucleic Acids Research 24:1304 -1307. Ingman M, Kaessmann H, Paabo S, y Gyllensten U. 2000. Mitochondrial genome variation and the origin of modern humans. Nature 408:708-713. Izagirre N, y de la Rua C. 1999. An mtDNA analysis in ancient Basque populations: implications for haplogroup V as â marker for a major paleolithic expansion from southwestern europe. Am J Hum Genet 65:199-207. Jehaes E, Pfeiffer H, Toprak K, Decorte R, Brinkmann B, y Cassiman JJ. 2001. Mitochondrial DNA analysis of the putative heart of Louis XVII, son of Louis XVI and Marie-Antoinette. Eur. J. Hum. Genet 9:185-190. Jobling MA, Hurles M, y Tyler-Smith C. 2003. Human Evolutionary Genetics: Origins, Peoples and Disease, lo ed. Garland Science. Jobling MA, y Tyler-Smith C. 2003. The human Y chromosome: an evolutionary marker comes of age. Nat Rev Genet 4:598-612. Jorda F. 1998. Prehistoria. Editorial Credos. Juan-Cabanilles J, y Marti B. 2002. Poblamiento y procesos culturales en la peninsula ibérica del VII al Vmilenio a.C. En: El paisaje en el Neolitico mediterraneo. Valencia: Saguntum- PLAV, extra 5. p 45-89. Kemp BM, Malhi RS, McDonough J, Bolnick DA, Eshleman JA, Rickards O, Martinez-Labarga C, Johnson JR, Lorenz JG, Dixon EJ, et al. 2007. Genetic analysis of early holocene skeletal remains from Alaska and its implications for the settlement of the Americas. Am. J. Phys. Anthropol 132:605-621. Kemp BM, y Smith DG. 2005. Use of bleach to eliminate contaminating DNA from the surface of bones and teeth. Forensic Sci. Int 154:53-61. 276 Keyser C, Bouakaze C, Crubézy E, Nikolaev VG, Montagnon D, Reis T, y Ludes B. 2009. Ancient DNA provides new insights into the history of south Siberian Kurgan people. Hum Genet 126:395-410. Keyser-Tracqui C, Crubézy E, y Ludes B. 2003. Nuclear and Mitochondrial DNA Analysis of a 2,000-Year-Old Necropolis in the Egyin Gol Valley of Mongolia. Am J Hum Genet 73:247- 260. Kloosterman AD, y Kersbergen P. 2003. Efficacy and limits of genotyping low copy number (LCN) DNA samples by multiplex PCR of STR loci. J. Soc. Biol 197:351-359. Knapp M, y Hofreiter M. 2010. Next Generation Sequencing of Ancient DNA: Requirements, Strategies and Perspectives. Genes 1:227-243. Kolman CJ, y Tuross N. 2000. Ancient DNA analysis of human populations. Am. J. Phys. Anthropol 111:5-23. Krause J, Fu Q, Good JM, Viola B, Shunkov MV, Derevianko AP, y Paabo S. 2010. The complete mitochondrial DNA genome of an unknown hominin from southern Siberia. Nature 464:894-897. Kricker MC, y Drake JW. 1990. Heat mutagenesis in bacteriophage T4: another walk down the transversion pathway. J. Bacteriol 172:3037-3039. Krings M, Capelli C, Tschentscher F, Geisert H, Meyer S, von Haeseler A, Grossschmidt K, Possnert G, Paunovic M, y Paabo S. 2000. A view of Neandertal genetic diversity. Nat Genet 26:144-146. Krings M, Stone A, Schmitz RW, Krainitzki H, Stoneking M, y Paabo S. 1997. Neandertal DNA sequences and the origin of modern humans. Cell 90:19-30. Kurosaki K, Matsushita T, y Ueda S. 1993. Individual DNA identification from ancient human remains. Am. J. Hum. Genet. 53:638-643. Lacan M, Keyser C, Ricaut F-X, Brucato N, Duranthon F, Guilaine J, Crubézy E, y Ludes B. 2011. Ancient DNA reveals male diffusion through the Neolithic Mediterranean route. Proceedings of the National Academy of Sciences 108:9788 -9791. Lanting J, y van del Waals J. 1974. Beaker Culture Relations in the Lower Rhine Basin. En: Glockenbechersimposion Oberried. Lanting et al. Bussum-Haarlem. p 1-80. Lassen C, Hummel S, y Herrmann B. 1994. Comparison of DNA extraction and amplification from ancient human bone and mummified soft tissue. Int. J. Legal Med. 107:152-155. Lee HC, Pagliaro EM, Berka KM, Folk NL, Anderson DT, Ruano G, Keith TP, Phipps P, Herrin GL Jr, y Garner DD. 1991. Genetic markers in human bone: I. Deoxyribonucleic acid (DNA) analysis. J. Forensic Sci 36:320-330. Lindahl T. 1993. Instability and decay of the primary structure of DNA. Nature 362:709-715. Lindahl T. 1997. Facts and artifacts of ancient DNA. Cell 90:1-3. Loogvali E-L, Roostalu U, Malyarchuk BA, Derenko MV, Kivisild T, Metspalu E, Tam bets K, Reidia M, Tolk H-V, Parik J, et al. 2004. Disuniting Uniformity: A Pied Cladistic Canvas of mtDNA Haplogroup H in Eurasia. Molecular Biology and Evolution 21:2012 -2021. 277 Cristina Gamba Lorenz MG, y Wackernagel W. 1987. Adsorption of DNA to sand and variable degradation rates of adsorbed DNA. Appl Environ Microbiol 53:2948-2952. Lull Santiago V, Gonzalez Marcén P, y Risch R. 1991. Arqueologia de Europa, 2250-1200 a.C. : una introduccion a la edad del bronce. Editorial Smtesis, S.A. Lynnerup N. 2007. Mummies. American Journal of Physical Anthropology 134:162-190. Malaspina P, Tsopanomichalou M, Duman T, Stefan M, Silvestri A, Rinaldi B, Garcia O, Giparaki M, Plata E, Kozlov Al, et al. 2001. A multistep process for the dispersal of a Y chromosomal lineage in the Mediterranean area. Ann. Hum. Genet 65:339-349. Mallory J. 1997. Yamna Culture. En: Encyclopedia of Indo-European culture. Fitzroy Dearborn. Malmstrom H, Gilbert MTP, Thomas MG, Brandstrom M, Stora J, Molnar P, Andersen PK, Bendixen C, Holmlund G, y Gôtherstrôm A. 2009. Ancient DNA Reveals Lack of Continuity between Neolithic Hunter-Gatherers and Contemporary Scandinavians. Current Biology 19:1758-1762. Malmstrom H, Linderholm A, Liden K, Stora J, Molnar P, Holmlund G, Jakobsson M, y Gotherstrom A. 2010. High frequency of lactose intolerance in a prehistoric hunter- gatherer population in northern Europe. BMC Evolutionary Biology 10:89. Malmstrom H, Stora J, Dalén L, Holmlund G, y Gôtherstrôm A. 2005. Extensive Human DNA Contamination in Extracts from Ancient Dog Bones and Teeth. Molecular Biology and Evolution 22:2040 -2047. Malyarchuk B, Derenko M, Grzybowski T, Perkova M, Rogalla U, Vanecek T, y Tsybovsky I. 2010. The Peopling of Europe from the Mitochondrial Haplogroup US Perspective. PLoS ONE 5:el0285. Malyarchuk B, Rogozin I, Berikov V, y Derenko M. 2002. Analysis of phylogenetically reconstructed mutational spectra in human mitochondrial DNA control region. Human Genetics 111:46-53. Manen C, Marchand G, y Faustino Carvalho A. 2007. Le Néolithique ancien de la péninsule Ibérique : vers une nouvelle évaluation du mirage africain ? En: Congrès du Centenaire : Un siècle de construction du discours scientifique en Préhistoire. Vol. 3. Manfredi G, Thyagarajan D, Papadopoulou LC, Pallotti F, y Schon EA. 1997. The fate of human sperm-derived mtDNA in somatic cells. Am. J. Hum. Genet 61:953-960. Ma rota I, Basile C, Ubaldi M, y Rollo F. 2002. DNA decay rate in papyri and human remains from Egyptian archaeological sites. Am. J. Phys. Anthropol 117:310-318. Marti Oliver B. 2007. El Neolitico. En: Prehistoria de la Peninsula Ibérica. 6o ed. Editorial Ariel, S.A. p 155-247. Maya JL. 2007. El Bronce Final y los inicios de la Edad del Hierro. En: Prehistoria de la Peninsula Ibérica. 6o ed. Editorial Ariel, S.A. McDougall I, Brown FH, y Fleagle JG. 2005. Stratigraphie placement and age of modern humans from Kibish, Ethiopia. Nature 433:733-736. Menozzi P, Piazza A, y Cavalli-Sforza L. 1978. Synthetic maps of human gene frequencies in 278 Europeans. Science 201:786 -792. Meyer S, Weiss G, y von Haeseler A. 1999. Pattern of Nucleotide Substitution and Rate Heterogeneity in the Hypervariable Regions I and II of Human mtDNA. Genetcs 152:1103-1110. Millar CD, Huynen L, Subramanian S, Mohandesan E, y Lambert DM. 2008. New developmerts in ancient genomics. Trends Ecol. Evol. (Amst.) 23:386-393. Montiel Duarte R. 2001. Estudio diacronico de la variabilidad del DNA mitocondrial en poblacion catalana. Available from: http://tdx.cat/handle/10803/3641 Mulero JJ, Chang CW, Lagacé RE, Wang DY, Bas JL, McMahon TP, y Hennessy LK. 2008. Development and Validation of the Am|6BTR® MiniFilerTM PCR Amplification Kit: A MiniSTR Multiplex for the Analysis of Degraded and/or PCR Inhibited DNA. Journal of Forensic Sciences 53:838-852. Muller J, y van Willigen S. 2001. New radiocarbon evidence for European Bell Beakers and the consequences for the diffusion of the Bell Beaker Phenomenon. En: Bell beakers today: pottery, people, culture, symbols in prehistoric Europe. Franco Nicolis. p 59-75. Mullis KB, y Faloona FA. 1987. Specific synthesis of DNA in vitro via a polymerase-catalyzed chain reaction. Meth. Enzymol 155:335-350. Myres NM, Rootsi S, Lin AA, Jarve M, King RJ, Kutuev I, Cabrera VM, Khusnutdinova EK, Pshenichnov A, Yunusbayev B, et al. 2011. A major Y-chromosome haplogroup Rib Holocene era founder effect in Central and Western Europe. Eur J Hum Genet 19:95- 101. Nagy D, Tomory G, Csanyi B, Bogacsi-Szabo E, Czibula A, Priskin K, Bede 0, Bartosiewicz L, Downes CS, y Rasko I. 2011. Comparison of lactase persistence polymorphism in ancient and present-day Hungarian populations. American Journal of Physical Anthropology 145:n/a. Neustupny J. 1963. The Bell Beaker Culture In Bohemia And Moravia. Academic Journal Offprint From Mexico. Nielsen-Marsh CM, y Hedges REM. 2000. Patterns of Diagenesis in Bone I: The Effects of Site Environments. Journal of Archaeological Science 27:1139-1150. Novelletto A. 2007. Y chromosome variation in Europe: continental and local processes in the formation of the extant gene pool. Ann. Hum. Biol 34:139-172. Nunez C, Sosa C, Baeta M, Geppert M, Turnbough M, Phillips N, Casalod Y, Bolea M, Roby R, Budowle B, et al. 2011. Genetic analysis of 7 medieval skeletons from Aragonese Pyrenees. Croat Med J 52:336-343. Oota H, Saitou N, Matsushita T, y Ueda S. 1995. A genetic study of 2,000-year-old hunran remains from Japan using mitochondrial DNA sequences. Am. J. Phys. Anthropol. 98:133-145. Orlando L, Darlu P, Toussaint M, Bonjean D, Otte M, y Hanni C. 2006. Revisiting Neandertal diversity with a 100,000 year old mtDNA sequence. Curr. Biol 16:R400-402. Otto ni C, Primativo G, Hooshiar Kashani B, Achilli A, Martinez-Labarga C, Biondi G, Torroni A, y 279 http://tdx.cat/handle/10803/3641 Cristina Gamba Rickards 0. 2010. Mitochondrial haplogroup HI in north Africa: an early holocene arrival from Iberia. PLoS ONE 5:el3378. Ovchinnikov IV, Gotherstrom A, Romanova GP, Kharitonov VM, Liden K, y Goodwin W. 2000. Molecular analysis of Neanderthal DNA from the northern Caucasus. Nature 404:490- 493. van Oven M, y Kayser M. 2009. Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation. Hum. Mutat. 30:E386-E394. O'Rourke DH, Hayes MG, y Carlyle SW. 2000. Ancient DNA studies in physical anthropology. Annual Review of Anthropology:217-242. Pakendorf B, y Stoneking M. 2005. Mitochondrial DNA and human evolution. Annu. Rev. Genom. Human Genet. 6:165-183. Pala M, Achilli A, Olivieri A, Kashani BH, Perego UA, Sanna D, Metspalu E, Tam bets K, Tamm E, Accetturo M, et al. 2009. Mitochondrial Haplogroup U5b3: A Distant Echo of the Epipaleolithic in Italy and the Legacy of the Early Sardinians. The American Journal of Human Genetics 84:814-821. Palanichamy M, Zhang C-L, Mitra B, Malyarchuk B, Derenko M, Chaudhuri T, y Zhang Y-P. 2010. Mitochondrial haplogroup Nla phylogeography, with implication to the origin of European farmers. BMC Evolutionary Biology 10:304. Palomino Lazaro AL, Moratinos Garcia M, y Pastor Vasquez J. 2009. Retazos de ayer. En: Patrimonio: Fundacion del patrimonio de Castilla y Leon. Vol. 37.. p 51-58. Pantoja JG. 2003. Historia antigua: Grecia y Roma. Editorial Ariel. Passarino G, Semino 0, Magri C, Al-Zahery N, Benuzzi G, Quintana-Murci L, Andellnovic S, Bullc-Jakus F, Liu A, Arslan A, et al. 2001. The 49a,f haplotype 11 is a new marker of the EU19 lineage that traces migrations from northern regions of the black sea. Human Immunology 62:922-932. Pellicer M. 1964. El Neolitico y el Bronze de la Cueva de la Cariguela de Pinar (Granada). Trabajos de Prehistoria del Seminario de Historia Primitiva del Hombre de la Universidad de Madrid XV. Pereira F, Queiros S, Gusmao L, Nijman IJ, Cuppen E, Lenstra JA, Consortium E, Davis SJM, Nejmeddine F, y Amorim A. 2009. Tracing the History of Goat Pastoralism: New Clues from Mitochondrial and Y Chromosome DNA in North Africa. Molecular Biology and Evolution 26:2765 -2773. Pereira L, Cunha C, Alves C, y Amorim A. 2005. African female heritage in Iberia: a reassessment of mtDNA lineage distribution in present times. Hum. Biol 77:213-229. Pereira V, Gomes V, Amorim A, Gusmao L, y Joao Prata M. 2010. Genetic characterization of uniparental lineages in populations from Southwest Iberia with past malaria endemicity. Am. J. Hum. Biol 22:588-595. Pereira V, Tomas C, Amorim A, Morling N, Gusmao L, y Prata MJ. 2011. Study of 25 X- chromosome SNPs in the Portuguese. Forensic Sci Int Genet 5:336-338. Pericic M, Lauc LB, Klaric IM, Rootsi S, Janicijevic B, Rudan I, Terzic R, Colak I, Kvesic A, Popovic 280 D, et al. 2005. High-Resolution Phylogenetic Analysis of Southeastern Europe Traces Major Episodes of Paternal Gene Flow Among Slavic Populations. Molecular Biology and Evolution 22:1964 -1975. Perry WL 3rd, Bass WM, Riggsby WS, y Sirotkin K. 1988. The autodegradation of deoxyribonucleic acid (DNA) in human rib bone and its relationship to the time interval since death. J. Forensic Sci 33:144-153. Plaza S, Calafell F, Helal A, Bouzerna N, Lefranc G, Bertranpetit J, y Comas D. 2003. Joining the pillars of Hercules: mtDNA sequences show multidirectional gene flow in the western Mediterranean. Ann. Hum. Genet 67:312-328. Poinar GO Jr. 1994. The range of life in amber: significance and implications in DNA studies. Experientia 50:536-542. Poinar HN, Cano RJ, y Poinar GO. 1993. DNA from an extinct plant. Nature 363:677. Poinar HN, Hofreiter M, Spaulding WG, Martin PS, Stankiewicz BA, Bland H, Evershed RP, Possnert G, y Paabo S. 1998. Molecular Coproscopy: Dung and Diet of the Extinct Ground Sloth Nothrotheriops shastensis. Science 281:402 -406. Poinar HN, Hoss M, Bada JL, y Paabo S. 1996. Amino Acid Racemization and the Preservation of Ancient DNA. Science 272:864 -866. Poinar HN, Schwarz C, Qi J, Shapiro B, MacPhee RDE, Buigues B, Tikhonov A, Huson DH, Tomsho LP, Auch A, et al. 2006. Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA. Science 311:392 -394. Poinar HN. 2002. The genetic secrets some fossils hold. Acc. Chem. Res 35:676-684. Poinar HN. 2003. The top 10 list: criteria of authenticity for DNA from ancient and forensic samples. International Congress Series 1239:575-579. Price TD. 2000. Europe's First Farmers. Cambridge University Press. Prüfer K, Stenzel U, Hofreiter M, Paabo S, Kelso J, y Green RE. 2010. Computational challenges in the analysis of ancient DNA. Genome Biol 11:R47. Pulquério MJF, y Nichols RA. 2007. Dates from the molecular clock: how wrong can we be? Trends in Ecology & Evolution 22:180-184. Paabo 5, Higuchi RG, y Wilson AC. 1989. Ancient DNA and the polymerase chain reaction. The emerging field of molecular archaeology. J. Biol. Chem 264:9709-9712. Paabo 5, Poinar H, Serre D, Jaenicke-Despres V, Hebler J, Rohland N, Kuch M, Krause J, Vigilant L, y Hofreiter M. 2004. Genetic analyses from ancient DNA. Annu. Rev. Genet 38:645- 679. Paabo S, y Wilson AC. 1988. Polymerase chain reaction reveals cloning artefacts. Nature 334:387-388. Paabo 5, y Wilson AC. 1991. Miocene DNA sequences - a dream come true? Curr. Biol 1:45-46. Paabo S. 1985. Preservation of DNA in ancient Egyptian mummies. Journal of Archaeological Science 12:411-417. 281 Cristina Gamba Paabo S. 1989. Ancient DNA: extraction, characterization, molecular cloning, and enzymatic amplification. Proceedings of the National Academy of Sciences 86:1939 -1943. Paabo S. 1990. Amplifying ancient DNA. En: PCR Protocols: A Guide to Methods and Applications. London and San Diego: Academic Press, p 159-166. Quatrefages A, y Hamy E. 1874. La race de Cro-Magnon dans l'espace et dans le temps. Bulletins de la Société d'Anthropologie de Paris 9:260-266. Quintana-Murci L, y Fellous M. 2001. The human Y chromosome: the biological role of a «functional wasteland». J Biomed Biotechnol 1:18-24. Quintans B, Alvarez-lglesias V, Salas A, Lareu M, y Carracedo A. 2004. Typing mtDNA SNPs of forensic and population interest with snapshot. International Congress Series 1261:419- 421. Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, Metspalu M, Metspalu E, Kivisild T, Gupta R, et al. 2010. Ancient human genome sequence of an extinct Palaeo- Eskimo. Nature 463:757-762. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, Fiegler H, Shapero MH, Carson AR, Chen W, et al. 2006. Global variation in copy number in the human genome. Nature 444:444-454. Reidia M, Kivisild T, Metspalu E, Kaldma K, Tambets K, Tolk H, Parik J, Loogvali E, Derenko M, y Malyarchuk B. 2003. Origin and Diffusion of mtDNA Haplogroup X. The American Journal of Human Genetics 73:1178-1190. Renfrew C. 1987. Archaeology and Language: The Puzzle of Indo-European Origins. London: Jonathan Cape Ltd. Renfrew C. 1990. Archaeology and Language: The Puzzle of Indo-European Origins. Cambridge University Press. Rhouda T, Martinez-Redondo D, Gomez-Duran A, Elmtili N, Idaomar M, Diez-Sanchez C, Montoya J, Lôpez-Pérez MJ, y Ruiz-Pesini E. 2009. Moroccan mitochondrial genetic background suggests prehistoric human migrations across the Gibraltar Strait. Mitochondrion 9:402-407. Richards M, Côrte-Real H, Forster P, Macaulay V, Wilkinson-Herbots H, Demaine A, Papiha S, Hedges R, Bandelt HJ, y Sykes B. 1996. Paleolithic and neolithic lineages in the European mitochondrial gene pool. Am. J. Hum. Genet 59:185-203. Richards M, Macaulay V, Hickey E, Vega E, Sykes B, Guida V, Rengo C, Sellitto D, Cruciani F, Kivisild T, et al. 2000. Tracing European founder lineages in the Near Eastern mtDNA pool. Am. J. Hum. Genet 67:1251-1276. Richards M, Macaulay V, Sykes B, Pettitt P, Hedges R, Forster P, y Bandelt H-J. 1997. Reply to Cavalli-Sforza and Minch. Am J Hum Genet 61:251-254. Richards M, Macaulay V, Torroni A, y Bandelt H-J. 2002. In Search of Geographical Patterns in European Mitochondrial DNA. Am J Hum Genet 71:1168-1174. Richards M, y Sykes B. 1998. Reply to Barbujani et al. The American Journal of Human Genetics 62:491-492. 282 Richards M. 2003. The Neolithic Invasion of Europe. Annu. Rev. Anthropol. 32:135-162. Richards MB, Macaulay VA, Bandelt H-J, y Sykes BC. 1998. Phylogeography of mitochondrial DNA in western Europe. Ann Human Genet 62:241-260. Rieder J, y Wartke R-B. 2009. Iron. En: Brill's New Pauly. Cancik, Hubert; Schneider, Helmuth. Brill. Rincon Martinez MA. 2007. El Calcolitico y la Edad del Bronce. En: Prehistoria de la Peninsula Ibérica. 6o ed. Editorial Ariel, S.A. Robin ED, y Wong R. 1988. Mitochondrial DNA molecules and virtual number of mitochondria per cell in mammalian cells. J. Cell. Physiol 136:507-513. Rogaev El, Grigorenko AP, Moliaka YK, Faskhutdinova G, Goltsov A, Lahti A, Hildebrandt C, Kittler ELW, y Morozova I. 2009. Genomic identification in the historical case of the Nicholas II royal family. Proceedings of the National Academy of Sciences 106:5258 - 5263. Rohland N, y Hofreiter M. 2007a. Ancient DNA extraction from bones and teeth. Nat. Protocols 2:1756-1762. Rohland N, y Hofreiter M. 2007b. Comparison and optimization of ancient DNA extraction. BioTechniques 42:343-352. Romanowski G, Lorenz MG, y Wackernagel W. 1991. Adsorption of plasmid DNA to mineral surfaces and protection against DNase I. AppI Environ Microbiol 57:1057-1061. Roostalu U, Kutuev I, Loogvali E-L, Metspalu E, Tambets K, Reidia M, Khusnutdinova E, Usanga E, Kivisild T, y Villems R. 2007. Origin and Expansion of Haplogroup H, the Dominant Human Mitochondrial DNA Lineage in West Eurasia: The Near Eastern and Caucasian Perspective. Molecular Biology and Evolution 24:436 -448. Rootsi S, Kivisild T, Benuzzi G, Help H, Bermisheva M, Kutuev I, Barac L, Pericic M, Balanovsky O, Pshenichnov A, et al. 2004. Phylogeography of Y-Chromosome Haplogroup I Reveals Distinct Domains of Prehistoric Gene Flow in Europe. The American Journal of Human Genetics 75:128-137. Rosser ZH, Zerjal T, Hurles ME, Adojaan M, Alavantic D, Amorim A, Amos W, Armenteros M, Arroyo E, Barbujani G, et al. 2000. Y-chromosomal diversity in Europe is clinal and influenced primarily by geography, rather than by language. Am. J. Hum. Genet 67:1526- 1543. Rowley-Conwy P. 2009. Human Prehistory: Hunting for the Earliest Farmers. Current Biology 19:R948-R949. Sambrook J, y Russell DW. 2001. Molecular cloning: a laboratory manual. CSHL Press. Sampietro M., Lao 0, Caramelli D, Lari M, Pou R, Marti M, Bertranpetit J, y Lalueza-Fox C. 2007. Palaeogenetic evidence supports a dual model of Neolithic spreading into Europe. Proc Biol Sci 274:2161-2167. Sampietro ML, Caramelli D, Lao 0, Calafell F, Comas D, Lari M, Agusti B, Bertranpetit J, y Lalueza-Fox C. 2005. The Genetics of the Pre-Roman Iberian Peninsula: A mtDNA Study of Ancient Iberians. Annals of Human Genetics 69:535-548. 283 Cristina Gamba San Valero Aparisi J. 1948. La Peninsula hispanica en el mundo neolitico. En: Seminario de Historia Primitiva del Hombre. Madrid. Sangmeister E. 1963. La civilisation du vase campaniforme. En: Actes du Premier Colloque Atlantique (Brest, 1961): Les civilisations atlantiques du néolithique a l'Age du Fer. Rennes, p 25-26. Schaffner SF. 2004. The X chromosome in population genetics. Nat Rev Genet 5:43-51. Schlumbaum A, Campos PF, Volken S, Volken M, Hafner A, y Schibler J. 2010. Ancient DNA, a Neolithic legging from the Swiss Alps and the early history of goat. Journal of Archaeological Science 37:1247-1251. Schonberg A, Theunert C, Li M, Stoneking M, y Nasidze I. 2011. High-throughput sequencing of complete human mtDNA genomes from the Caucasus and West Asia: high diversity and demographic inferences. Eur J Hum Genet. Schwartz M, y Vissing J. 2002. Paternal inheritance of mitochondrial DNA. N. Engl. J. Med 347:576-580. Schwartz M, y Vissing J. 2003. New patterns of inheritance in mitochondrial disease. Biochem. Biophys. Res. Commun 310:247-251. Schwartz TR, Schwartz EA, Mieszerski L, McNally L, y Kobilinsky L. 1991. Characterization of deoxyribonucleic acid (DNA) obtained from teeth subjected to various environmental conditions. J. Forensic Sci 36:979-990. Scozzari R, Cruciani F, Pangrazio A, Santolamazza P, Vona G, Moral P, Latini V, Varesi L, Memmi MM, Romano V, et al. 2001. Human Y-chromosome variation in the Western Mediterranean area; implications for the peopling of the region. Human Immunology 62:871-884. Semino O, Magri C, Benuzzi G, Lin AA, Al-Zahery N, Battaglia V, Maccioni L, Triantaphyllidis C, Shen P, Oefner PJ, et al. 2004. Origin, Diffusion, and Differentiation of Y-Chromosome Haplogroups E and J: Inferences on the Neolithization of Europe and Later Migratory Events in the Mediterranean Area. Am J Hum Genet 74:1023-1034. Semino 0, Passarino G, Brega A, Fellous M, y Santachiara-Benerecetti AS. 1996. A view of the neolithic demie diffusion in Europe through two Y chromosome-specific markers. Am J Hum Genet 59:964-968. Semino 0, Passarino G, Oefner PJ, Lin AA, Arbuzova S, Beckman LE, De Benedictis G, Francalacci P, Kouvatsi A, Limborska S, et al. 2000. The genetic legacy of Paleolithic Homo sapiens sapiens in extant Europeans: a Y chromosome perspective. Science 290:1155-1159. Serre D, Langaney A, Chech M, Teschler-Nicola M, Paunovic M, Mennecier P, Hofreiter M, Possnert G, y Paabo S. 2004. No Evidence of Neandertal mtDNA Contribution to Early Modern Humans. PLoS Biol 2:e57. Sewell J, Quinones I, Ames C, Multaney B, Curtis S, Seeboruth H, Moore S, y Daniel B. 2008. Recovery of DNA and fingerprints from touched documents. Forensic Science International: Genetics 2:281-285. 284 Shoubridge EA. 2001. Nuclear genetic defects of oxidative phosphorylation. Human Molecular Genetics 10:2277 -2284. Simoni L, Calafell F, Pettener D, Bertranpetit J, y Barbujani G. 2000a. Geographic Patterns of mtDNA Diversity in Europe. The American Journal of Human Genetics 66:262-278. Simoni L, Calafell F, Pettener D, Bertranpetit J, y Barbujani G. 2000b. Reconstruction of Prehistory on the Basis of Genetic Data. Am J Hum Genet 66:1177-1179. Smith Cl, Chamberlain AT, Riley MS, Cooper A, Stringer CB, y Collins MJ. 2001. Neanderthal DNA: Not just old but old and cold? Nature 410:771-772. Smith Cl, Chamberlain AT, Riley MS, Stringer C, y Collins MJ. 2003. The thermal history of human fossils and the likelihood of successful DNA amplification. J. Hum. Evol 45:203- 217. Soares P, Achilli A, Semino O, Davies W, Macaulay V, Bandelt H-J, Torroni A, y Richards MB. 2010. The archaeogenetics of Europe. Curr. Biol 20:R174-183. Sokal RR, Oden NL, y Wilson C. 1991. Genetic evidence for the spread of agriculture in Europe by demie diffusion. Nature 351:143-145. Stankiewicz BA, Poinar HN, Briggs DEG, Evershed RP, y Poinar GO. 1998. Chemical preservation of plants and insects in natural resins. Proceedings of the Royal Society of London. Series B: Biological Sciences 265:641 -647. Steele J, Adams J, y Sluckin T. 1998. Modelling Paleoindian dispersals. World Archaeol 30:286- 305. Steinlechner M, Berger B, Niederstatter H, y Parson W. 2002. Rare failures in the amelogenin sex test. Int. J. Legal Med 116:117-120. Stoneking M, Sherry ST, Redd AJ, y Vigilant L. 1992. New Approaches to Dating Suggest a Recent Age for the Human mtDNA Ancestor. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences 337:167 -175. Stoneking M, y Krause J. 2011. Learning about human population history from ancient and modern genomes. Nat. Rev. Genet 12:603-614. Stoneking M. 2000. Hypervariable Sites in the mtDNA Control Region Are Mutational Hotspots. Am J Hum Genet 67:1029-1032. Stringer C, y Andrews P. 2005. The Complete World of Human Evolution. First Edition. Thames & Hudson. Svoboda JA. 2007. The Gravettian on the Middle Danube. PALEO 19:203-220. Swinfield CE, Graham EAM, Nuttall D, Maguire S, Kemp A, y Rutty GN. 2009. The use of DNA stabilizing solution to enable room temperature storage and transportation of buccal and trace sample swabs. Forensic Science International: Genetics Supplement Series 2:183-184. Tambets K, Rootsi S, Kivisild T, Help H, Serk P, Loogvali E-L, Tolk H-V, Reidia M, Metspalu E, Pliss L, et al. 2004. The Western and Eastern Roots of the Saami—the Story of Genetic «Outliers» Told by Mitochondrial DNA and Y Chromosomes. Am J Hum Genet 74:661- 285 Cristina Gamba 682. Tarradell M. 1965. Una hipôtesis que se desvanece: El papel de Africa en las raices de los pueblos hispànicos. En: Homenaje a Jaime Vicens Vives. Vol. 1. Barcelona, p 173-181. Terberger T, y Street M. 2002. Hiatus or continuity? New results for the question of pleniglacial settlement in Central Europe. Antiquity 76:691-698. Tomas C, Sanchez J, Barbare A, Brandt-Casadevall C, Hernandez A, Ben Dhiab M, Ramon M, y Morling N. 2008. X-chromosome SNP analyses in 11 human Mediterranean populations show a high overall genetic homogeneity except in North-west Africans (Moroccans). BMC Evolutionary Biology 8:75. de Torres T, Ortiz JE, Llamas FJ, Canoira L, Julia R, y Garcia-Martinez MJ. 2002. Bear dentine aspartic acid racemization analysis: a proxy for the dating of Pleistocene cave infills. Archaeometry 44:417-426. Torroni A, Achilli A, Macaulay V, Richards M, y Bandelt H-J. 2006. Harvesting the fruit of the human mtDNA tree. Trends Genet 22:339-345. Torroni A, Bandelt HJ, D'Urbano L, Lahermo P, Moral P, Sellitto D, Rengo C, Forster P, Savontaus ML, Bonné-Tamir B, et al. 1998. mtDNA analysis reveals a major late Paleolithic population expansion from southwestern to northeastern Europe. Am J Hum Genet 62:1137-1152. Torroni A, Bandelt HJ, Macaulay V, Richards M, Cruciani F, Rengo C, Martinez-Cabrera V, Villems R, Kivisild T, Metspalu E, et al. 2001. A signal, from human mtDNA, of postglacial recolonization in Europe. Am. J. Hum. Genet 69:844-852. Torroni A, Richards M, Macaulay V, Forster P, Villems R, Norby S, Savontaus M, Huoponen K, Scozzari R, y Bandelt H. 2000. mtDNA Haplogroups and Frequency Patterns in Europe. The American Journal of Human Genetics 66:1173-1177. Torroni A, Schurr TG, Cabell MF, Brown MD, Neel JV, Larsen M, Smith DG, Vullo CM, y Wallace DC. 1993. Asian affinities and continental radiation of the four founding Native American mtDNAs. Am. J. Hum. Genet 53:563-590. Treinen F. 1970. Les poteries campaniformes en France. Gallia Préhistoire Xlll:53-107, 263-332. Tully LA, Parsons TJ, Steighner RJ, Holland MM, Marino MA, y Prenger VL. 2000. A sensitive denaturing gradient-Gel electrophoresis assay reveals a high frequency of heteroplasmy in hypervariable region 1 of the human mtDNA control region. Am. J. Hum. Genet 67:432-443. Tuross N. 1994. The biochemistry of ancient DNA in bone. Experientia 50:530-535. Utrilla M del P, Lorenzo Jl, Baldellou V, Sopena MC, y Ayuso P. 2008. Enterramiento masculino en fosa, cubierto de cantos rodados, en el neolitico antiguo de la cueva de Chaves. En: IV Congreso del Neolitico Peninsular. Vol. 2. Alicante: Museo Arqueologico de Alicante - MARQ. p 131-140. Vanek D, Saskova L, y Koch H. 2009. Kinship and Y-Chromosome Analysis of 7th Century Human Remains: Novel DNA Extraction and Typing Procedure for Ancient Material. Croat Med J 50:286-295. 286 Vasan S, Zhang X, Zhang X, Kapurniotu A, Bernhagen J, Teichberg S, Basgen J, Wagle D, Shih D, Terlecky I, et al. 1996. An agent cleaving glucose-derived protein crosslinks in vitro and in vivo. Nature 382:275-278. Vass AA. 2001. Beyond the grave - understanding human decomposition Arpad A. Vass. Microbiology Today 28:190-192. Vahharova M, y Drozdova E. 2008. Sex determination of skeletal remains of 4000 year old children and juveniles from Hostice 1 za Hanou (Czech Republic) by ancient DNA analysis. Anthropological Review 71:63-70. Vega Toscano L, Bernabeu J, y Chapa Brunet T. 2003. La prehistoria. Editorial Smtesis, S.A. Vernesi C, Di Benedetto G, Caramelli D, Secchieri E, Simoni L, Katti E, Malaspina P, Novelletto A, Marin VT, y Barbujani G. 2001. Genetic characterization of the body attributed to the evangelist Luke. Proc. Natl. Acad. Sci. U.S.A 98:13460-13463. Wakeley J. 1993. Substitution rate variation among sites in hypervariable region 1 of human mitochondrial DNA. J Mol Evol 37. Waldbaum JC. 1978. From Bronze to Iron: The Transition from the Bronze Age to the Iron Age in the Eastern Mediterranean. Studies in Mediterranean Archaeology LIV. Wallin IE. 1923. The Mitochondria Problem. The American Naturalist 57:255-261. Whitaker JP, Cotton EA, y Gill P. 2001. A comparison of the characteristics of profiles produced with the AMPFISTR SGM Plus multiplex system for both standard and low copy number (LCN) STR DNA analysis. Forensic Sci. Int 123:215-223. Whitehouse D, y Whitehouse R. 1977. Archaeological Atlas of the World. New edition. Thames & Hudson Ltd. Willerslev E, Hansen AJ, Binladen J, Brand TB, Gilbert MTP, Shapiro B, Bunce M, Wiuf C, Gilichinsky DA, y Cooper A. 2003. Diverse Plant and Animal Genetic Records from Holocene and Pleistocene Sediments. Science 300:791 -795. Willerslev E, y Cooper A. 2005. Ancient DNA. Proc Biol Sci 272:3-16. Wilson IG. 1997. Inhibition and facilitation of nucleic acid amplification. AppI Environ Microbiol 63:3741-3751. Wong KK, deLeeuw RJ, Dosanjh NS, Kimm LR, Cheng Z, Horsman DE, MacAulay C, Ng RT, Brown CJ, Eichler EE, et al. 2007. A Comprehensive Analysis of Common Copy-Number Variations in the Human Genome. Am J Hum Genet 80:91-104. Woodward, Weyand N, y Bunnell M. 1994. DNA sequence from Cretaceous period bone fragments. Science 266:1229 -1232. Xu H, Zhao Y, Liu Z, Zhu W, Zhou Y, y Zhao Z. 2011. Bisulfite genomic sequencing of DNA from dried blood spot microvolume samples. Forensic Science International: Genetics In Press, Corrected Proof. Yang DY, Eng B, Waye JS, Dudar JC, y Saunders SR. 1998. Technical note: improved DNA extraction from ancient bones using silica-based spin columns. Am. J. Phys. Anthropol 105:539-543. 287 Cristina Gamba Yeates C, Gillings MR, Davison AD, Altavilla N, y Veal DA. 1998. Methods for microbial DNA extraction from soil for PCR amplification. Biol Proced Online 1:40-47. Yousten AA, y Rippere KE. 1997. DNA similarity analysis of a putative ancient bacterial isolate obtained from amber. FEMS Microbiology Letters 152:345-347. Zalloua PA, Platt DE, El Sibai M, Khalife J, Makhoul N, Haber M, Xue Y, Izaabel H, Bosch E, Adams SM, et al. 2008. Identifying genetic traces of historical expansions: Phoenician footprints in the Mediterranean. Am. J. Hum. Genet 83:633-642. Zerjal T, Xue Y, Bertorelle G, Wells RS, Bao W, Zhu S, Qamar R, Ayub Q, Mohyuddin A, Fu 5, et al. 2003. The Genetic Legacy of the Mongols. Am J Hum Genet 72:717-721. Zhivotovsky LA, Underhill PA, Cinnioglu C, Kayser M, Morar B, Kivisild T, Scozzari R, Cruciani F, Destro-Bisol G, Spedini G, et al. 2004. The Effective Mutation Rate at Y Chromosome Short Tandem Repeats, with Application to Human Population-Divergence Time. Am J Hum Genet 74:50-61. Zilhao J. 2000. From the Mesolithic to the Neolithic in the Iberian Peninsula. En: Europe's first farmers. Price, T. D. Cambridge: Cambridge University Press, p 144-182. Zilhao J. 2001. Radiocarbon evidence for maritime pioneer colonization at the origins of farming in west Mediterranean Europe. Proceedings of the National Academy of Sciences 98:14180 -14185. Zischler H, Geisert H, von Haeseler A, y Paabo S. 1995. A nuclear «fossil» of the mitochondrial D-loop and the origin of modern humans. Nature 378:489-492. Zvelebil M. 1980. The rise of the nomads in Central Asia. En: Cambridge Encyclopedia of Archaeology. A. Sherratt. Cambridge: Cambridge University Press, p 320-3. Zvelebil M. 2000. The social context of the agricultural transition in Europe. En: Archaeogenetics. Colin Renfrew and Katie Boyle. Cambridge: McDonald Institute, p 57- 79. Zvelebil M. 2001. The agricultural transition and the origins of Neolithic society in Europe. Documenta Praehistorica XXVIII:l-29. 288 289 290 Contenido del CD Alineamientos de las secuencias clonadas correspondientes a los Articules 3 y 4. CD content Cloned sequences alignments correspondent to the Articles 3 and 4. 291