<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-06-27T16:05:28Z</responseDate><request verb="GetRecord" identifier="oai:docta.ucm.es:20.500.14352/15225" metadataPrefix="mets">https://docta.ucm.es/rest/oai/request</request><GetRecord><record><header><identifier>oai:docta.ucm.es:20.500.14352/15225</identifier><datestamp>2023-09-06T21:14:36Z</datestamp><setSpec>com_20.500.14352_1</setSpec><setSpec>col_20.500.14352_8</setSpec></header><metadata><mets xmlns="http://www.loc.gov/METS/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" ID="&#xa;&#x9;&#x9;&#x9;&#x9;DSpace_ITEM_20.500.14352-15225" TYPE="DSpace ITEM" PROFILE="DSpace METS SIP Profile 1.0" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd" OBJID="&#xa;&#x9;&#x9;&#x9;&#x9;hdl:20.500.14352/15225">
   <metsHdr CREATEDATE="2026-06-27T18:05:28Z">
      <agent ROLE="CUSTODIAN" TYPE="ORGANIZATION">
         <name>Docta Complutense</name>
      </agent>
   </metsHdr>
   <dmdSec ID="DMD_20.500.14352_15225">
      <mdWrap MDTYPE="MODS">
         <xmlData xmlns:mods="http://www.loc.gov/mods/v3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
            <mods:mods xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">advisor</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Sánchez Ruiz-Granados, Antonio Alejandro</mods:namePart>
               </mods:name>
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Arranz Janeiro, Ricardo</mods:namePart>
               </mods:name>
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Concepción Echeverría, Lidia</mods:namePart>
               </mods:name>
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Caño Vega, Juan Ramón del</mods:namePart>
               </mods:name>
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Ponce Belmonte, Francisco</mods:namePart>
               </mods:name>
               <mods:name>
                  <mods:role>
                     <mods:roleTerm type="text">author</mods:roleTerm>
                  </mods:role>
                  <mods:namePart>Romero Sánchez, Juan Luis</mods:namePart>
               </mods:name>
               <mods:extension>
                  <mods:dateAccessioned encoding="iso8601">2023-06-17T15:02:14Z</mods:dateAccessioned>
               </mods:extension>
               <mods:extension>
                  <mods:dateAvailable encoding="iso8601">2023-06-17T15:02:14Z</mods:dateAvailable>
               </mods:extension>
               <mods:originInfo>
                  <mods:dateIssued encoding="iso8601">2019</mods:dateIssued>
               </mods:originInfo>
               <mods:identifier type="uri">https://hdl.handle.net/20.500.14352/15225</mods:identifier>
               <mods:identifier type="relatedurl">https://github.com/delcanovega/TFG-DRL</mods:identifier>
               <mods:abstract>En este proyecto estudiaremos el campo del aprendizaje por refuerzo profundo, con el objetivo de lograr una aplicación estable en problemas clásicos de control. Para lograrlo investigaremos sus bases: el aprendizaje por refuerzo y las redes neuronales, comprobando cuáles son sus puntos fuertes y débiles. Después combinaremos lo aprendido para, progresivamente, mejorar el rendimiento y la estabilidad de nuestros agentes.
En busca de una mayor comprensión de su funcionamiento, todas las implementaciones de los agentes y algoritmos serán hechas por nosotros mismos. Todo ello será puesto a prueba a través del conocido sistema OpenAI Gym.
Todo el código fuente referente a este proyecto puede encontrarse en: https://github.com/delcanovega/TFG-DRLIn this project we will study the Deep Reinforcement Learning field in order to achieve an stable application for classic control problems. To do this we will investigate its fundamentals: Reinforcement Learning and Neural Networks, learning which are their strengths and weaknesses. Finally, we will merge both to progressivly improve our agent’s performance and stability.
In order to gain a better insight we will personally implement the agents and algorithms. All of this will be tested through the popular framework OpenAI Gym.
This project’s source code can be found in the repository: https://github.com/delcanovega/TFG-DRL</mods:abstract>
               <mods:language>
                  <mods:languageTerm authority="rfc3066">spa</mods:languageTerm>
               </mods:language>
               <mods:accessCondition type="useAndReproduction">Atribución-NoComercial 3.0 España</mods:accessCondition>
               <mods:titleInfo>
                  <mods:title>Aprendizaje por refuerzo profundo aplicado a juegos sencillos</mods:title>
               </mods:titleInfo>
               <mods:genre>bachelor thesis</mods:genre>
            </mods:mods>
         </xmlData>
      </mdWrap>
   </dmdSec>
   <amdSec ID="FO_20.500.14352_15225_1">
      <techMD ID="TECH_O_20.500.14352_15225_1">
         <mdWrap MDTYPE="PREMIS">
            <xmlData xmlns:premis="http://www.loc.gov/standards/premis" xsi:schemaLocation="http://www.loc.gov/standards/premis http://www.loc.gov/standards/premis/PREMIS-v1-0.xsd">
               <premis:premis>
                  <premis:object>
                     <premis:objectIdentifier>
                        <premis:objectIdentifierType>URL</premis:objectIdentifierType>
                        <premis:objectIdentifierValue>https://docta.ucm.es/bitstreams/caa804ba-a240-4e45-aafc-182c05f80d71/download</premis:objectIdentifierValue>
                     </premis:objectIdentifier>
                     <premis:objectCategory>File</premis:objectCategory>
                     <premis:objectCharacteristics>
                        <premis:fixity>
                           <premis:messageDigestAlgorithm>MD5</premis:messageDigestAlgorithm>
                           <premis:messageDigest>2d6fde35b406acb32e7be4f88c1a1005</premis:messageDigest>
                        </premis:fixity>
                        <premis:size>3818844</premis:size>
                        <premis:format>
                           <premis:formatDesignation>
                              <premis:formatName>application/pdf</premis:formatName>
                           </premis:formatDesignation>
                        </premis:format>
                     </premis:objectCharacteristics>
                     <premis:originalName>1138035127-327684_JUAN_RAMÓN_DEL_CAÑO_VEGA_Aprendizaje_por_refuerzo_profundo_aplicado_a_juegos_sencillos_3940146_998640412.pdf</premis:originalName>
                  </premis:object>
               </premis:premis>
            </xmlData>
         </mdWrap>
      </techMD>
   </amdSec>
   <amdSec ID="FT_20.500.14352_15225_3">
      <techMD ID="TECH_T_20.500.14352_15225_3">
         <mdWrap MDTYPE="PREMIS">
            <xmlData xmlns:premis="http://www.loc.gov/standards/premis" xsi:schemaLocation="http://www.loc.gov/standards/premis http://www.loc.gov/standards/premis/PREMIS-v1-0.xsd">
               <premis:premis>
                  <premis:object>
                     <premis:objectIdentifier>
                        <premis:objectIdentifierType>URL</premis:objectIdentifierType>
                        <premis:objectIdentifierValue>https://docta.ucm.es/bitstreams/0f75e46f-4126-490f-af7c-cf93dae3cfb2/download</premis:objectIdentifierValue>
                     </premis:objectIdentifier>
                     <premis:objectCategory>File</premis:objectCategory>
                     <premis:objectCharacteristics>
                        <premis:fixity>
                           <premis:messageDigestAlgorithm>MD5</premis:messageDigestAlgorithm>
                           <premis:messageDigest>3f550898602cf48544ca6bdf49ba052a</premis:messageDigest>
                        </premis:fixity>
                        <premis:size>162855</premis:size>
                        <premis:format>
                           <premis:formatDesignation>
                              <premis:formatName>text/plain</premis:formatName>
                           </premis:formatDesignation>
                        </premis:format>
                     </premis:objectCharacteristics>
                     <premis:originalName>1138035127-327684_JUAN_RAMÓN_DEL_CAÑO_VEGA_Aprendizaje_por_refuerzo_profundo_aplicado_a_juegos_sencillos_3940146_998640412.pdf.txt</premis:originalName>
                  </premis:object>
               </premis:premis>
            </xmlData>
         </mdWrap>
      </techMD>
   </amdSec>
   <fileSec>
      <fileGrp USE="ORIGINAL">
         <file ID="BITSTREAM_ORIGINAL_20.500.14352_15225_1" MIMETYPE="application/pdf" SEQ="1" SIZE="3818844" CHECKSUM="2d6fde35b406acb32e7be4f88c1a1005" CHECKSUMTYPE="MD5" ADMID="FO_20.500.14352_15225_1" GROUPID="GROUP_BITSTREAM_20.500.14352_15225_1">
            <FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="https://docta.ucm.es/bitstreams/caa804ba-a240-4e45-aafc-182c05f80d71/download"/>
         </file>
      </fileGrp>
      <fileGrp USE="TEXT">
         <file ID="BITSTREAM_TEXT_20.500.14352_15225_3" MIMETYPE="text/plain" SEQ="3" SIZE="162855" CHECKSUM="3f550898602cf48544ca6bdf49ba052a" CHECKSUMTYPE="MD5" ADMID="FT_20.500.14352_15225_3" GROUPID="GROUP_BITSTREAM_20.500.14352_15225_3">
            <FLocat LOCTYPE="URL" xlink:type="simple" xlink:href="https://docta.ucm.es/bitstreams/0f75e46f-4126-490f-af7c-cf93dae3cfb2/download"/>
         </file>
      </fileGrp>
   </fileSec>
   <structMap LABEL="DSpace Object" TYPE="LOGICAL">
      <div TYPE="DSpace Object Contents" ADMID="DMD_20.500.14352_15225">
         <div TYPE="DSpace BITSTREAM">
            <fptr FILEID="BITSTREAM_ORIGINAL_20.500.14352_15225_1"/>
         </div>
      </div>
   </structMap>
</mets></metadata></record></GetRecord></OAI-PMH>