Filtrar por:
Tipo de publicación
- Artículo (44)
- Documento de trabajo (12)
- Capítulo de libro (8)
- Tesis de maestría (8)
- Libro (4)
Autores
- MARICELA MARTINEZ JIMENEZ (6)
- Alison Bentley (2)
- Alison Laing (2)
- Berhanu Tadesse Ertiro (2)
- CARLOS ABRAHAM GUERRERO RUIZ (2)
Años de Publicación
Editores
- Instituto Mexicano de Tecnología del Agua (7)
- Universidad Autónoma Metropolitana (México). (4)
- Universidad Autónoma Metropolitana (México). Unidad Azcapotzalco. Coordinación de Servicios de Información. (4)
- IMTA. Coordinación de Tratamiento y Calidad del Agua (3)
- Universidad Autónoma de Ciudad Juárez (3)
Repositorios Orígen
- Repositorio institucional del IMTA (24)
- Repositorio Institucional de Publicaciones Multimedia del CIMMYT (17)
- Repositorio Institucional CICESE (13)
- Repositorio Institucional Zaloamati (10)
- CIATEQ Digital (3)
Tipos de Acceso
- oa:openAccess (84)
Idiomas
Materias
- CIENCIAS AGROPECUARIAS Y BIOTECNOLOGÍA (25)
- INGENIERÍA Y TECNOLOGÍA (22)
- HUMANIDADES Y CIENCIAS DE LA CONDUCTA (14)
- BIOLOGÍA Y QUÍMICA (13)
- CIENCIAS TECNOLÓGICAS (13)
Selecciona los temas de tu interés y recibe en tu correo las publicaciones más actuales
Síncrono / asíncrono. Convergencia y alternancia en la enseñanza futura del diseño
Francisco Gerardo Toledo Ramirez (2023, [Capítulo de libro])
La cuarentena sanitaria de los últimos dos años (COVID-19) obligó a “rediseñar”, “digitalizar” o “virtualizar” nuestros cursos y estilos de enseñanza en tiempo récord para “adaptarlas” al “formato virtual a distancia” (online). La profusión de comillas en las líneas anteriores tiene la intención de señalar el carácter incierto o erróneo que ciertos términos-fetiche adquirieron en el proceso. Es importante desmitificar esas figuras de la expresión que se elevaron casi al nivel de pseudo-epistemes (presuntamente novedosas) para la enseñanza del Diseño. Ese tema lo abordo con mayor amplitud en una nueva investigación, recientemente registrada en la UAM. En este texto esbozo (en forma algo lúdica) pero seria y breve a la vez, la conveniencia de tal desmitificación y avanzo en el delineamiento de un modelo de la alternancia y convergencia de recursos pedagógico-didácticos síncronos y asíncronos, mediante la tecnología-red digital, como un elemento estratégico para la educación futura en Diseño.
The health quarantine of the last 2 years (COVID-19) forced us to “redesign”, “digitize” or “virtualize” our courses and teaching styles in record time to “adapt” them to the “virtual format” “at a distance” (online). The profusion of quotation marks in the previous lines is intended to indicate the uncertain or erroneous character that certain fetish-terms acquired in the process. It is important to demystify those figures of expression that have risen almost to the level of pseudo-epistemes (presumably novel) for teaching design. I address this topic more fully in a new investigation, recently registered at the UAM. In this text I outline (in a somewhat playful way) but serious and brief at the same time, the convenience of such “demystification” and I advance in the outline of a model of alternation and convergence of synchronous and asynchronous pedagogical-didactic resources, through technology. -digital network, as a strategic element for future design education.
Síncrono, asíncrono, virtualidad, presencialidad, diseño, remoto. Synchronous, asynchronous, virtuality, face-to-face, design, remote. Design--Study and teaching, Higher. Distance education. Blended learning. Universidad Autónoma Metropolitana. Unidad Azcapotzalco. División de Ciencias y Artes para el Diseño. Artes gráficas. Educación a Distancia. Aprendizaje combinado. NK1170 HUMANIDADES Y CIENCIAS DE LA CONDUCTA CIENCIAS DE LAS ARTES Y LAS LETRAS
Ecofisiología de Ocimum basilicum con termoacondicionamiento y su efecto sobre Peronospora belbahrii
MIRELLA ROMERO BASTIDAS Bernardo Murillo Amador Luis Guillermo Hernández Montiel ENRIQUE TROYO DIEGUEZ Alejandra Nieto Garibay (2022, [Artículo])
"El mildiu velloso (Peronospora belbahrii) afecta el desarrollo de la albahaca (Ocimum basilicum) y su control es complicado, debido al uso restringido de fungicidas. El objetivo de este estudio fue someter semillas de albahaca variedad Nufar a tratamientos de termoacondicionamiento de 40, 50 y 60°C expuestas a diferentes intervalos de tiempo (30, 60 y 90 min) para evaluar la relación existente entre la aparición de los síntomas de la enfermedad con la humedad relativa y temperatura
ambiente, así como el efecto de los tratamientos de preacondicionamiento de la semilla en la severidad e incidencia de la enfermedad en la planta, y su respuesta fisiológica. Las semillas se sembraron en macetas bajo malla sombra y
cuando las plantas alcanzaron 15 cm de crecimiento, se infectaron con P. belbahrii. La incidencia de la enfermedad se determinó semanalmente y 60 días después de la siembra se determinaron las variables morfométricas y fisiológicas mostrando diferencias significativas entre temperatura, tiempo de exposición e interacción en la mayoría de las variables evaluadas. Se observó una disminución en la incidencia de la enfermedad en plantas de semillas sometidas a condicionamiento térmico tratadas a 60°C por 60 min de exposición. Este mismo tratamiento mostró menor apertura estomática y transpiración y mayor concentración subestomatal de
CO2, lo que sugiere una probable relación con la entrada de P. belbahrii a la hoja disminuyendo su incidencia."
Control, crecimiento, mildiu, temperatura, vigor BIOLOGÍA Y QUÍMICA CIENCIAS DE LA VIDA BIOLOGÍA VEGETAL (BOTÁNICA) BIOLOGÍA VEGETAL (BOTÁNICA)
Monitoreo de playas prioritarias
NORMA RAMIREZ SALINAS JUAN LEODEGARIO GARCIA ROJAS (2012, [Documento de trabajo])
Se presentan los resultados obtenidos en la prueba, para Enterococos en agua de mar, llevada a cabo en 37 playas de Campeche, Chiapas, Guerrero, Jalisco, Nayarit y Veracruz.
Control de calidad del agua Análisis bacteriológico Agua de mar Campeche Chiapas Guerrero Jalisco Nayarit Veracruz INGENIERÍA Y TECNOLOGÍA
NORMA RAMIREZ SALINAS Camilo Vázquez Bustos (2012, [Documento de trabajo])
Este estudio busca un seguimiento al trabajo hasta hoy realizado en el Instituto Mexicano de Tecnología del Agua con respecto a la relación cambio climático y calidad del agua, con el fin de presentar propuestas de políticas públicas a las autoridades competentes con base a los estudios efectuados en el IMTA en los últimos cinco años.
Control de calidad del agua Cambio climático Impacto ambiental Política ambiental Política pública INGENIERÍA Y TECNOLOGÍA
Realidad virtual en fenómenos del espacio interestelar
Antonio Luciano Hernández Padilla (2024, [Tesis de maestría])
153 páginas. Maestría en Diseño y Visualización de la Información.
El proyecto es un prototipo que se distribuye en varias etapas y sigue un enfoque de diseño de videojuegos para crear una experiencia de realidad virtual (también conocida como VR Virtual Reality) organizada y coherente. Requiere una fusión de conceptos multidisciplinarios, incluyendo ingeniería, diseño tridimensional y programación, lo que demanda a los profesionales involucrados tener sólidos conocimientos y habilidades creativas. El diseño de videojuegos se valora como un proceso que exige dedicación y pasión, aunque también se destaca la importancia de establecer reglas y géneros para orientar el desarrollo del juego. En este proyecto, el juego se clasifica como una aventura en primera persona centrada en la exploración del espacio interestelar, donde el jugador debe seguir reglas preestablecidas para alcanzar objetivos. La ludología, como estudio académico de los juegos, resalta la constante esencia de jugar, aprender y socializar en los juegos. La construcción del mundo del juego se basa en un Game Design Document que describe la visión, género y objetivos del juego. "Space Travel" se centra en la exploración espacial y cuenta con una nave espacial minimalista y un exoplaneta rocoso y gélido. Las mecánicas del juego se centran en la recolección de objetos y su activación, con reglas que guían la interacción del jugador con el entorno. Este proyecto busca ofrecer una experiencia de VR inmersiva y atractiva, centrada en el usuario. El enfoque en los principios de diseño de videojuegos y la planificación a través del Game Design Document demuestran un compromiso con la creación de una experiencia gratificante y significativa. La atención a la inmersión y las mecánicas de juego respaldan la afirmación de que es un desarrollo centrado en la experiencia del usuario.
The ongoing project is a prototype in various stages, following a game design approach to create an organized and coherent virtual reality experience. It requires a fusion of multidisciplinary concepts, including engineering, three-dimensional design, and programming, demanding that involved professionals possess strong knowledge and creative skills. Game design is valued as a process that demands dedication and passion, while also emphasizing the importance of establishing rules and genres to guide game development. In this project, the game is classified as a first-person adventure focused on interstellar space exploration, where the player must adhere to preset rules to achieve objectives. Ludology, as an academic study of games, highlights the constant essence of playing, learning, and socializing within games. The construction of the game world is based on a Game Design Document describing the vision, genre, and objectives of the game. "Space Travel" focuses on space exploration, featuring a minimalist spaceship and an icy, rocky exoplanet. Game mechanics revolve around object collection and activation, with rules guiding the player's interaction with the environment. This project aims to deliver an immersive and engaging virtual reality experience centered on the user. The focus on game design principles and planning through the Game Design Document demonstrates a commitment to creating a rewarding and meaningful experience. Attention to immersion and game mechanics supports the assertion that it's a user experience focused development.
Espacio, realidad, virtual, interactividad, diseño, experiencia, usuario. Space, Virtual, Reality, interactivity, design, user, experience. Video games--Design. Outer space--Exploration. Video games--Programming. VRML (Computer program language) Three-dimensional display systems. Videojuegos -- Diseño. Espacio exterior -- Exploración. Diseño de sistemas centrado en el usuario. QA76.76.C672 INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES DISEÑO CON AYUDA DE ORDENADOR
Ana Laura Salinas Torres (2022, [Tesis de maestría])
El agua subterránea contaminada con As es un problema de interés global debido a que
es la principal fuente de consumo humano en zonas áridas y semi-áridas del planeta y puede
provocar importantes efectos secundarios en la salud humana. El desarrollo de tecnologías
fisicoquímicas y biológicas se ha implementado para la eliminación del As, sin embargo, la
presencia de algunos iones disueltos en las aguas naturales, puede afectar la eficiencia de
remoción como se ha observado en distintos estudios de adsorción, intercambio catiónico,
electrocoagulación, etc. El objetivo del presente estudio fue evaluar el efecto individual y
combinado de iones como el Na+, Ca2+, Mg2+, NO3
- y F-
, en procesos de remoción de arsénico
en condiciones sulfato reductoras, empleando hierro elemental como único donador de
electrones.
Para ello, se obtuvo un lodo anaerobio procedente de la planta tratadora de aguas
residuales de la localidad de Chihuahua, el cual fue acondicionado y activado durante 141 días,
previos al montaje del experimento. La evaluación del efecto individual y combinado se realizó
en ensayos en lote con agua subterránea sintética, donde se adicionaron 0.2 mg/L As5+, la
cantidad necesaria de soluciones patrón para obtener concentraciones similares a las reportadas
en estudios de caracterización de agua en la región de Chihuahua, ZVI como donador de
electrones y 10% v/v de lodo anaerobio. Durante los ensayos, se determinó el consumo de
sulfato por precipitación con BaCl2, así como la concentración de arsénico total por ICP
acoplado a un nebulizador ultrasónico para conocer la eficiencia de remoción. En los
tratamientos con el ión F-
, también se determinó ese ion utilizando un potenciómetro acoplado
a un electrodo de ion selectivo.
Agua subterránea contaminada As INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS INGENIERÍA Y TECNOLOGÍA DEL MEDIO AMBIENTE CONTROL DE LA CONTAMINACIÓN DEL AGUA CONTROL DE LA CONTAMINACIÓN DEL AGUA
EFECTO DE Trichoderma SPP. SOBRE LA ROYA BLANCA DEL CRISANTEMO INDUCIDA POR Puccinia horiana
ROMULO GARCIA VELASCO (2022, [Artículo])
En México, el Estado de México constituye el principal productor de crisantemo. La roya blanca causada por el hongo Puccinia horiana Henn se considera como una de las enfermedades más devastadoras en el cultivo. El objetivo del presente estudio fue determinar el efecto de Trichoderma barbatum Samuels y Trichoderma asperellum Samuels, Lieckfeldt & Nirenberg en el control de la roya blanca en crisantemo. Se demostró de forma exitosa el efecto biocontrolador de las cepas nativas, así como su efecto benéfico en el crecimiento de las plantas de crisantemo. Ambas cepas resultaron promisorias para el control de la roya blanca en el cultivo de crisantemo.
The State of Mexico is the main producer of chrysanthemums in Mexico. White rust caused by
the fungus Puccinia horiana Henn is considered one of the most devastating diseases in crops. The objective of this work was to determine the effect of Trichoderma barbatum Samuels and
Trichoderma asperellum Samuels, Lieckfeldt & Nirenberg in the control of white rust in chrysanthemum. The biocontrol effect of native strains was successfully demonstrated, as well as its beneficial effect in the growth of chrysanthemum plants. Both strains proved promising for the control of white rust in chrysanthemum crops.
CIENCIAS AGROPECUARIAS Y BIOTECNOLOGÍA CIENCIAS AGRARIAS control biológico, enfermedades, patógeno, plantas ornamentales
Detección de comportamiento no verbal en interacción humano-robot
Detection of non-verbal behavior in human-robot interaction
Ernesto Adrián Lozano De la Parra (2023, [Tesis de maestría])
La comunicación no verbal desempeña un papel vital en la interacción humana. En el contexto de la interacción humano-robot (IHR), los robots sociales están diseñados principalmente para la comunicación verbal con los humanos, dejando a la comunicación no verbal como un área de investigación abierta. En este trabajo, se presenta una arquitectura flexible y abierta llamada Software Arquitechture for Nonverbal Interaction in Human-Robot Interaction (SANI-HRI) diseñada para facilitar las interacciones no verbales en IHR. Entre sus componentes se encuentra un Cuaderno Computacional P2P basado en navegador web, aprovechado para codificar, ejecutar y compartir programas reactivos. Pueden incluirse modelos de aprendizaje automático para el reconocimiento en tiempo real de gestos, poses y estados de ´animo, empleando protocolos como MQTT. Otro componente clave es un Broker para distribuir datos entre distintos dispositivos físicos, como robots, dispositivos vestibles y sensores ambientales, así como modelos de aprendizaje automático que comprendan diferentes tipos de datos. Se demuestra la utilidad de esta arquitectura mediante tres escenarios de interacción: (i) el primero que emplea la proxémica y la dirección de la mirada para iniciar un encuentro improvisado, (ii) un segundo que utiliza técnicas de visión por computadora para detectar y analizar expresiones faciales y corporales, así como el uso sensores biométricos para obtener datos de ritmo cardiaco durante una rutina de ejercicio, y (iii) un tercero que incorpora el reconocimiento de objetos y Modelos de Lenguaje Grandes para sugerir comidas a cocinar en función de los ingredientes disponibles. Estos escenarios ilustran cómo los componentes de la arquitectura pueden integrarse para abordar nuevos escenarios, en los que los robots necesitan inferir señales no verbales de los usuarios.
Nonverbal communication plays a vital role in human interaction. In the context of Human-Robot Interaction (HRI), social robots are designed primarily for verbal-based communication with humans, making nonverbal communication an open research area. We present a flexible, open framework called Software Architecture for Nonverbal Interaction in Human-Robot Interaction (SANI-HRI) designed to facilitate nonverbal interactions in HRI. Among its components it has a P2P Browser-Based Computational Notebook, leveraged to code, run, and share reactive programs. Machine-learning models can be included for real-time recognition of gestures, poses, and moods, employing protocols such as MQTT. Another key component is a broker for distributing data among different physical devices like the robot, wearables, and environmental sensors and also machine learning models. We demonstrate this framework’s utility through three interaction scenarios: (i) the first one employing proxemics and gaze direction to initiate an impromptu encounter, (ii) a second that uses computer vision techniques to detect and analyze facial and body expressions, as well as the use of biometric sensors to obtain heart rate data during a workout routine, and (iii) a third one incorporating object recognition and a Large-Language Model to suggest meals to be cooked based on available ingredients. These scenarios illustrate how the framework’s components can be seamlessly integrated to address new scenarios, where robots need to infer nonverbal cues from users.
Interacción humano-robot, Comunicación no verbal, Broker MQTT, Notebook computacional, Modelos linguísticos grandes, SANI-HRI Human-robot interaction, Nonverbal communication, Broker MQTT, Computational notebook, Large language models, SANI-HRI INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES SISTEMAS DE RECONOCIMIENTO DE CARACTERES SISTEMAS DE RECONOCIMIENTO DE CARACTERES
JAZMIN DELGADO AVILEZ (2023, [Tesis de maestría])
El bisfenol A (BPA), es un contaminante de origen industrial presente en efluentes y
aguas naturales, que representa un alto riesgo para el entorno ambiental y para la salud humana debido a su inherente toxicidad y su limitada capacidad de degradación. En este contexto, los sensores electroquímicos, generalmente basados en electrodos de carbono, son herramientas fundamentales con el propósito de detectar y cuantificar esta molécula. Sin embargo, estos dispositivos enfrentan desafíos sustanciales derivados de la inactivación electroquímica, un fenómeno atribuido a la formación de una capa aislante o polimerización durante el proceso de detección. La descripción de los mecanismos de reacción BPA/superficie del electrodo puede ser útil para identificar los sitios activos y contribuir a la elucidación del proceso de polimerización.
En esta investigación, se implementó un estudio teórico mediante Teoría de Funcionales de la Densidad (DFT) con el propósito de analizar con profundidad las interacciones entre el BPA en sus diversos estados de oxidación: oxidada (O), reducida (R) y monoprotonada (r*) y materiales de carbono. A tal efecto, se empleó el grafeno funcionalizado (plano basal, borde tipo silla y zigzag) como modelo representativo de la superficie del electrodo. Finalmente se evalúan las posibilidades de la dimerización del BPA o polimerización sobre varios grupos funcionales. El objetivo principal radica en la detección de grupos funcionales específicos que puedan inducir procesos secundarios, los cuales actúan como obstáculos para la eficaz detección electroquímica del BPA. La información resultante se instituye como un recurso valioso con miras al diseño y la optimización de sensores electroquímicos con un desempeño más robusto y sofisticado.
A continuación, se detalla la sinopsis general de este trabajo describiendo cada capítulo y las etapas involucradas en el estudio del modelo teórico de DFT para el sistema de reacción BPA/superficie del electrodo.
Capítulo 1. Estado del arte tanto de los usos industriales como las implicaciones
ambientales asociadas al Bisfenol A. Una de las problemáticas que se destacan es la necesidad de una detección precisa de esta molécula mediante sensores electroquímicos cuya limitación es la inactivación que presentan. También se describe la justificación del trabajo, así como el uso del modelo computacional, además de los objetivos y la hipótesis del mismo.
Capítulo 2. Descripción de los fundamentos teóricos basados en primeros principios, de la Teoría de Funcionales de la Densidad (DFT), con un enfoque especial en las aproximaciones para desarrollar modelos representativos que optimicen el tiempo de cálculo. Además, se detallan las características de la estructura y la superficie de los materiales de carbono considerados en el proceso de modelado.
Capítulo 3. Detalle del proceso de construcción del modelo de superficie para el estudio de las interacciones BPA/superficie del electrodo, donde se empleó el modelo del plano basal,así como los bordes tipo silla y zigzag del grafeno, con funcionalizaciones que incluyen COOH, OH, éter, epóxido, cetona y terminaciones de hidrógeno.
Bisphenol A (BPA) is a contaminant of industrial origin present in effluents and natural waters. It represents a high environmental and human health risk due to its inherent toxicity and limited degradation capacity. In this context, electrochemical sensors, generally based on carbon electrodes, are fundamental to detecting and quantifying this molecule. However, these devices face substantial challenges from electrochemical inactivation, a phenomenon attributed to forming an insulating layer or polymerization during the sensing process. The description of the BPA/electrode surface reaction mechanisms can be helpful to identify the active sites and contribute to the elucidation of the polymerization process.
In this research, a theoretical study was implemented using Density Functional Theory (DFT) to analyze in depth the interactions between BPA in its various oxidation states: oxidized (O), reduced (R), and monoprotonated (r*) and carbon materials. For this purpose, functionalized graphene (basal plane, saddle edge, and zigzag) was used as a representative model of the electrode surface. Finally, the possibilities of BPA dimerization or polymerization on various functional groups are evaluated. The main objective is detecting specific functional groups that can induce secondary processes, which act as obstacles to the effective electrochemical detection of BPA. The resulting information is a valuable resource for designing and optimizing electrochemical sensors with more robust and sophisticated performance.
The general synopsis of this work is detailed below, describing each chapter and the
stages involved in the study of the theoretical DFT model for the BPA/electrode surface reaction system.
Chapter 1. State of the art of industrial uses and the environmental implications associated with Bisphenol A. One of the problems that stands out is the need for precise detection of this molecule using electrochemical sensors, whose limitation is the inactivation they present. The justification of the work is also described, as well as the use of the computational model, in addition to its objectives and hypothesis.
Chapter 2. Description of the theoretical foundations based on first principles of Density Functional Theory (DFT), focusing on approaches to develop representative models that optimize calculation time. Additionally, the structure and surface characteristics of the carbon materials considered in the modeling process are detailed.
Chapter 3. Detail of the construction process of the surface model for the study of BPA/electrode surface interactions, where the basal plane model was used, as well as the chair- type and zigzag edges of graphene, with functionalizations that include COOH, OH, ether, epoxide, ketone, and hydrogen endings.
INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS Oxidación de fenoles, Teoría de funcionales de la densidad (DFT), electrodos de carbono, desactivación electroquímica, Bisfenol A (BPA). Phenol oxidation, Density Functional Theory (DFT), carbon electrodes, electrochemical deactivation, Bisphenol A (BPA).
Control de sistemas usando aprendizaje de máquina
Systems control using machine learning
Jesús Martín Miguel Martínez (2023, [Tesis de maestría])
El aprendizaje por refuerzo es un paradigma del aprendizaje de máquina con un amplio desarrollo y una creciente demanda en aplicaciones que involucran toma de decisiones y control. Es un paradigma que permite el diseño de controladores que no dependen directamente del modelo que describe la dinámica del sistema. Esto es importante ya que en aplicaciones reales es frecuente que no se disponga de dichos modelos de manera precisa. Esta tesis tiene como objetivo implementar un controlador óptimo en tiempo discreto libre de modelo. La metodología elegida se basa en algoritmos de aprendizaje por refuerzo, enfocados en sistemas con espacios de estado y acción continuos a través de modelos discretos. Se utiliza el concepto de función de valor (Q-función y función V ) y la ecuación de Bellman para resolver el problema del regulador cuadrático lineal para un sistema mecánico masa-resorte-amortiguador, en casos donde se tiene conocimiento parcial y desconocimiento total del modelo. Para ambos casos las funciones de valor son definidas explícitamente por la estructura de un aproximador paramétrico, donde el vector de pesos del aproximador es sintonizado a través de un proceso iterativo de estimación de parámetros. Cuando se tiene conocimiento parcial de la dinámica se usa el método de aprendizaje por diferencias temporales en un entrenamiento episódico, que utiliza el esquema de mínimos cuadrados con mínimos cuadrados recursivos en la sintonización del crítico y descenso del gradiente en la sintonización del actor, el mejor resultado para este esquema es usando el algoritmo de iteración de valor para la solución de la ecuación de Bellman, con un resultado significativo en términos de precisión en comparación a los valores óptimos (función DLQR). Cuando se tiene desconocimiento de la dinámica se usa el algoritmo Q-learning en entrenamiento continuo, con el esquema de mínimos cuadrados con mínimos cuadrados recursivos y el esquema de mínimos cuadrados con descenso del gradiente. Ambos esquemas usan el algoritmo de iteración de política para la solución de la ecuación de Bellman, y se obtienen resultados de aproximadamente 0.001 en la medición del error cuadrático medio. Se realiza una prueba de adaptabilidad considerando variaciones que puedan suceder en los parámetros de la planta, siendo el esquema de mínimos cuadrados con mínimos cuadrados recursivos el que tiene los mejores resultados, reduciendo significativamente ...
Reinforcement learning is a machine learning paradigm with extensive development and growing demand in decision-making and control applications. This technique allows the design of controllers that do not directly depend on the model describing the system dynamics. It is useful in real-world applications, where accurate models are often unavailable. The objective of this work is to implement a modelfree discrete-time optimal controller. Through discrete models, we implemented reinforcement learning algorithms focused on systems with continuous state and action spaces. The concepts of value-function, Q-function, V -function, and the Bellman equation are employed to solve the linear quadratic regulator problem for a mass-spring-damper system in a partially known and utterly unknown model. For both cases, the value functions are explicitly defined by a parametric approximator’s structure, where the weight vector is tuned through an iterative parameter estimation process. When partial knowledge of the dynamics is available, the temporal difference learning method is used under episodic training, utilizing the least squares with a recursive least squares scheme for tuning the critic and gradient descent for the actor´s tuning. The best result for this scheme is achieved using the value iteration algorithm for solving the Bellman equation, yielding significant improvements in approximating the optimal values (DLQR function). When the dynamics are entirely unknown, the Q-learning algorithm is employed in continuous training, employing the least squares with recursive least squares and the gradient descent schemes. Both schemes use the policy iteration algorithm to solve the Bellman equation, and the system’s response using the obtained values was compared to the one using the theoretical optimal values, yielding approximately zero mean squared error between them. An adaptability test is conducted considering variations that may occur in plant parameters, with the least squares with recursive least squares scheme yielding the best results, significantly reducing the number of iterations required for convergence to optimal values.
aprendizaje por refuerzo, control óptimo, control adaptativo, sistemas mecánicos, libre de modelo, dinámica totalmente desconocida, aproximación paramétrica, Q-learning, iteración de política reinforcement learning, optimal control, adaptive control, mechanical systems, modelfree, utterly unknown dynamics, parametric approximation, Q-learning, policy iteration INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES INTELIGENCIA ARTIFICIAL INTELIGENCIA ARTIFICIAL