Person:
Jorge Botana, Guillermo de

Loading...
Profile Picture
First Name
Guillermo de
Last Name
Jorge Botana
Affiliation
Universidad Complutense de Madrid
Faculty / Institute
Psicología
Department
Psicobiología y Metodología en Ciencias del Comportamiento
Area
Metodología de las Ciencias del Comportamiento
Identifiers
UCM identifierORCIDScopus Author IDWeb of Science ResearcherIDDialnet IDGoogle Scholar ID

Search Results

Now showing 1 - 7 of 7
  • Item
    Análisis de Componentes Principales (ACP / PCA)
    (2021) Jorge Botana, Guillermo de
    Se suele definir conceptualmente a la técnica de Análisis de Componentes Principales (ACP) como una forma de reducción de ruido. En un conjunto de datos podemos tener ejemplares que puntúen en un conjunto de variables observables. No obstante, el objetivo es conseguir unas super-variables que nos resuman todas las relaciones ocultas de las variables observables de una manera simple pero sin pérdida de información. Por ejemplo, si tenemos 60 variables observables (número de amigos, valoración de los días soleados, puntualidad, etc.) en las que las personas puntúan, lo que querríamos es tener unas pocas super-variables, muchas menos, que nos resumiesen todas las posibles constelaciones significativas que se forman con ellas. Es decir, unos constructos de mayor abstracción y que resuman a las variables observables. De esto va la técnica de Componentes Principales: de resumir e identificar posibles constructos en un conjunto de datos.
  • Item
    K-vecinos más próximos (K-NN)
    (2023) Jorge Botana, Guillermo de
    La técnica de K-vecinos más próximos (K-NN) es una de las más sencilla en el arsenal de los métodos supervisados. De hecho, se suele emplear como técnica auxiliar en procedimientos de mayor alcance. Se podría resumir el procedimiento diciendo que un nuevo ejemplar sin categoría asignada es comparado con un conjunto de ejemplares que sí tienen categoría. El nuevo ejemplar se asignará a la categoría más repetida entre los ejemplares que más se parecen a él. En este texto se estudiará la medida de similitud en base a la distancia espacial, cuestión clave para la técnica.
  • Item
    Sistemas expertos artificiales
    (2021) Jorge Botana, Guillermo de
    Todos intuimos lo que significa razonamiento deductivo en base a nuestra experiencia. Quien más, quien menos ha aplicado una regla general a un conjunto de hechos. Muchos hemos tenido una planta aquejada de alguna enfermedad y hemos chequeado algunos asertos para comprobar el posible problema e incluso la posible solución. Puntitos blancos, deformación en los tallos, hojas retorcidas, entonces la planta tiene "araña blanca”. Un sistema experto basado en reglas es un tipo de sistema que hace un tratamiento de los hechos con reglas formalizadas de manera lógica. Cuando se dice de manera lógica se está aludiendo a que están expresadas en lógica deductiva. Como lógica deductiva cuenta a priori con un conjunto de reglas y hechos con los que el sistema hará inferencias, es decir, generará otros hechos o consecuencias. En este texto se hace una leve introducción a los sistemas expertos.
  • Item
    Bosques aleatorios
    (2021) Jorge Botana, Guillermo de
    Anteriormente hemos visto los árboles de decisión (en caso contrario, acudir al texto base sobre árboles de decisión). Se explicaba entonces que dicha técnica trataba de encontrar una secuencia de particiones en las variables independientes que fuese reduciendo el ruido en la variable dependiente. El ruido era la entropía. Pues bien, puede decirse que los Bosques Aleatorios son una expansión de lo ya visto con los Árboles de Decisión, pero esta vez tomando de la muestra total de datos diferentes submuestras de menor tamaño (muestras con reemplazo). Esto se hace en aras a conseguir una mejor generalización del modelo. Haciendo diversos árboles sobre esas submuestras conseguimos mayor estabilidad y generalización del modelo. En este breve texto se explican los aspectos importantes de la técnica.
  • Item
    K-medias
    (2021) Jorge Botana, Guillermo de
    Una de las técnicas más empleadas para la exploración de los datos es la técnica de K-medias. Todos hemos visto alguna vez en forma de gráficos su producto final. Los ejemplares quedan colocados en un espacio, ya sea bidimensional o tridimensional, de manera que las propias distancias nos indican su parecido. Pero más importante, los ejemplares se agrupan en grupos, también llamados conglomerados (también llamados clústeres). Cada ejemplar es asignado a un conglomerado. Estos conglomerados se forman en la medida en que algunos ejemplares tienen propiedades comunes y difieren de otros. En este texto hablaremos de cómo funciona el algoritmo K-Medias.
  • Item
    Máquinas de Vector Soporte
    (2023) Jorge Botana, Guillermo de
    Las Máquinas de Vector Soporte son una de las técnicas clásicas dentro del aprendizaje automático supervisado. Surgió alrededor de los años noventa y desde entonces ha sido usada prolijamente. Como veremos a lo largo del texto, su metodología de clasificación está basada encontrar el mayor margen de separación entre dos subconjuntos de datos de diferente clase. El hecho de que se quiera encontrar este mayor margen hace que sea eminentemente un problema de optmización. Cuando hablamos de margen estamos hablando también de distancia entre algunos ejemplares, de encontrar una mayor distancia, pero respetando la constricción de que ese margen permita discriminar entre clases. De ahí que emplee procedimientos de optimización, como los multiplicadores de Lagrange. Todo esto se introduce en este texto.
  • Item
    Árboles de Decisión: el modelo C4.5
    (2021) Jorge Botana, Guillermo de; Jorge Botana, Guillermo de
    Intuimos fácilmente lo que es un Árbol de Decisión. Nos imaginamos un conjunto de nodos y ramas por las que vamos decidiendo en base a preguntas o acciones que se nos plantean. Si tenemos que clasificar un evento, un conjunto de preguntas nos saldrán al paso según discurrimos por las ramas y las respuestas a ellas nos harán decantarnos por unas nuevas ramas y desdeñar otras. Existen formas automáticas de generar el mejor árbol de decisión dadas las características de un conjunto de datos y la variable a predecir. La idea es generar el árbol de decisión con alta capacidad predictiva pero lo menos profundo posible, con el menor número de preguntas, y lo más generalizable a eventos o ejemplares que no han participado en su generación. Es de esto de lo que se ocupará este texto. De estudiar una de esas formas: el algoritmo C4.5.