Búsqueda avanzada


Área de conocimiento




81 resultados, página 8 de 9

Closing the yield gap of soybean (Glycine max (L.) Merril) in Southern Africa: a case of Malawi, Zambia, and Mozambique

Siyabusa Mkuhlani Isaiah Nyagumbo (2023, [Artículo])

Introduction: Smallholder farmers in Sub-Saharan Africa (SSA) are increasingly producing soybean for food, feed, cash, and soil fertility improvement. Yet, the difference between the smallholder farmers’ yield and either the attainable in research fields or the potential from crop models is wide. Reasons for the yield gap include low to nonapplication of appropriate fertilizers and inoculants, late planting, low plant populations, recycling seeds, etc. Methods: Here, we reviewed the literature on the yield gap and the technologies for narrowing it and modelled yields through the right sowing dates and suitable high-yielding varieties in APSIM. Results and Discussion: Results highlighted that between 2010 and 2020 in SSA, soybean production increased; however, it was through an expansion in the cropped area rather than a yield increase per hectare. Also, the actual smallholder farmers’ yield was 3.8, 2.2, and 2.3 times lower than the attainable yield in Malawi, Zambia, and Mozambique, respectively. Through inoculants, soybean yield increased by 23.8%. Coupling this with either 40 kg ha−1 of P or 60 kg ha−1 of K boosted the yields by 89.1% and 26.0%, respectively. Overall, application of 21–30 kg ha-1 of P to soybean in SSA could increase yields by about 48.2%. Furthermore, sowing at the right time increased soybean yield by 300%. Although these technologies enhance soybean yields, they are not fully embraced by smallholder farmers. Hence, refining and bundling them in a digital advisory tool will enhance the availability of the correct information to smallholder farmers at the right time and improve soybean yields per unit area.

Decision Support Tools Digital Tools Site-Specific Recommendations CIENCIAS AGROPECUARIAS Y BIOTECNOLOGÍA DECISION SUPPORT SYSTEMS LEGUMES YIELDS SOYBEANS

Efecto del polvo de romero (Rosmarinus officinalis) en el crecimiento, actividad enzimática y composición proximal de juveniles de lobina rayada (Morone saxatilis)

Effect of rosemary powder (Rosmarinus officinalis) on growth, enzyme activity, and proximal composition of juvenile stripped bass (Morone saxatilis)

Erick Adolfo Barrios García (2023, [Tesis de maestría])

La acuicultura intensiva ha experimentado un rápido crecimiento en las últimas décadas. Sin embargo, la intensificación de los cultivos acuícolas ha ocasionado problemas como el estrés en los organismos, desarrollo de enfermedades y un menor crecimiento. Se ha explorado el uso de plantas aromáticas como el romero (Rosmarinus officinalis) por su efecto como antibiótico, antiestresante y estimulante de la secreción de enzimas digestivas y el crecimiento. El objetivo de este estudio fue evaluar la adición de polvo de romero en la dieta de la lobina rayada (Morone saxatilis) y determinar su efecto en la supervivencia, crecimiento, actividad enzimática (tripsina, quimiotripsina, lipasa, amilasa y proteasas alcalinas totales -PAT-) y composición proximal. Se realizó un bioensayo durante 70 días en un sistema de recirculación de agua de mar donde se probaron cuatro dietas experimentales con diferentes cantidades de polvo de romero: control (TC), 2.5 (T2.5), 5 (T5) y 10 (T10) g kg-1 de dieta. Cada tratamiento se realizó por triplicado con 20 peces por réplica con un peso inicial de 19.59 ± 2.43 g. Las lobinas se alimentaron tres veces al día al 4% de su biomasa. Al final del bioensayo, el peso final de los peces en T5 y T10 fue significativamente menor en comparación con el TC. No se observaron diferencias significativas en parámetros de crecimiento y eficiencia alimenticia. El índice hepatosomático en el T10 fue significativamente mayor en relación con TC. En el intestino, la actividad de la tripsina fue significativamente menor en el T10 y las PAT en T2.5 y T10. En ciegos pilóricos, la actividad de la tripsina fue significativamente menor en el T10, la lipasa en T2.5, T5 y T10 y las PAT en T2.5 y T10. La inclusión de polvo de romero en la dieta de lobina en concentraciones de 5 y 10 g kg-1 disminuye el crecimiento y la actividad de tripsina, PAT y lipasa en intestino y ciegos pilóricos. Se requiere investigar la composición química del romero y su efecto como inhibidor de enzimas digestivas y modulador de la microbiota intestinal, además de incluir otros indicadores para conocer de forma integrada el desempeño fisiológico de la especie.

Intensive aquaculture has experienced a very rapid growth in recent years. However, the intensification of aquaculture has led to issues such as stress in organisms, the development of diseases, and reduced growth. The use of aromatic plants, such as rosemary (Rosmarinus officinalis), has been explored due to its antibiotic, anti-stress, and digestive enzyme secretion-stimulating effects, as well as its growth-promoting properties. The objective of this study was to evaluate the addition of rosemary powder to the diet of striped bass (Morone saxatilis) and determine its effect on survival, growth, enzyme activity (trypsin, chymotrypsin, lipase, amylase, and total alkaline proteases -PAT-), and proximate composition. A 70-day bioassay was conducted in a recirculating seawater system, testing four experimental diets with varying amounts of rosemary powder: control (TC), 2.5 (T2.5), 5 (T5), and 10 (T10) g kg-1 of diet. Each treatment was performed in triplicate with 20 fish per replicate, with an initial weight of 19.59 ± 2.43 g. The striped bass were fed three times a day at 4% of their biomass. At the end of the bioassay, the final weight of fish in T5 and T10 was significantly lower compared to TC. There were no significant differences in growth parameters and feed efficiency. The hepatosomatic index in T10 was significantly higher compared to TC. In the intestine, trypsin activity was significantly lower in T10, and PAT in T2.5 and T10. In the pyloric caeca, trypsin activity was significantly lower in T10, lipase in T2.5, T5, and T10, and PAT in T2.5 and T10. The inclusion of rosemary powder in striped bass diets at concentrations of 5 and 10 g kg-1 reduces growth and the activity of trypsin, PAT, and lipase in the intestine and pyloric caeca. Further research is imperative to delve into the intricate chemical composition of rosemary, explore its role as a potent digestive enzyme inhibitor, and its potential as a modulator of the intestinal microbiota. This endeavor should also encompass the incorporation of various additional indicators, aiming for a holistic grasp of the species' physiological performance.

lobina rayada, romero, crecimiento, enzimas digestivas, composición proximal striped bass, rosemary, growth, digestive enzymes, proximal composition CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA CIENCIAS DE LA TIERRA Y DEL ESPACIO OCEANOGRAFÍA OCEANOGRAFÍA ACUICULTURA MARINA OCEANOGRAFÍA ACUICULTURA MARINA

How a holobiome perspective could promote intensification, biosecurity and eco-efficiency in the shrimp aquaculture industry

Eric Daniel Gutiérrez Pérez RICARDO VAZQUEZ JUAREZ FRANCISCO JAVIER MAGALLON BARAJAS MIGUEL ANGEL MARTINEZ MERCADO GRISEL ALEJANDRA ESCOBAR ZEPEDA Paola Magallón Servín (2022, [Artículo])

"The aquaculture industry faces many challenges regarding the intensification of shrimp rearing systems. One of these challenges is the release of excessive amounts of nitrogen and phosphorus into coastal areas, causing disruption in nutrient cycling and microbial equilibrium, which are important for coastal productivity. Biosecurity within the shrimp rearing systems can also be compromised by disruption to the nutrient fluxes, and as consequence the microbiome of the system. In certain conditions, these changes could lead to the blooming of potentially pathogenic bacteria. These changes in the external microbiome of the system and the constant fluctuations of nutrients can affect the intestinal microbiome of shrimp, which is involved in the growth and development of the host, affecting nutrient absorption, regulating metabolic processes, synthesising vitamins, modulating the immune response and preventing growth of pathogenic bacteria. It has been suggested that specific changes in the intestinal microbiome of Litopenaeus vannamei may be an avenue through which to overcome some of the problems that this industry faces, in terms of health, growth and waste. Recent research, however, has focussed mainly on changes in the intestinal microbiome. Researchers have overlooked the relevance of other aspects of the system, such as the microbiome from the benthic biofilms; zooplankton, plankton and bacterioplankton; and other sources of microorganisms that can directly affect the microbial status of the intestinal and epiphytic communities, especially in rearing systems that are based on intensification and microbial maturation processes, such as a biofloc system. It is therefore necessary to place holobiome studies into context, including the ‘holobiome of the aquaculture system’ (microbiomes that make up the culture system and their interactions) and not only the intestinal microbiome. Thus, we describe factors that affect the shrimp microbiome, the methodology of study, from sampling to bioinformatic workflows, and introduce the concept of the ‘holobiome of the aquaculture system’ and how this enables us to promote the intensification, biosafety and eco-efficiency of shrimp farming. The holobiome perspective implies a greater investment of resources and time for research, but it will accelerate the development of technology that will benefit the development and sustainability of the aquaculture industry."

litopenaeus vannamei, microbiome, intensification, biofloc, holobiome of aquaculture systems CIENCIAS AGROPECUARIAS Y BIOTECNOLOGÍA CIENCIAS AGRARIAS PRODUCCIÓN ANIMAL NUTRICIÓN NUTRICIÓN

OPTIMIZING THE TRANSFER OF ENERGY IN A HEAT EXCHANGER MINIMIZING THE CORROSION PROBLEMS IN PIPES IN A HYDROELECTRIC POWER STATION USING DATA MINING AND SUPPORT VECTOR MACHINE

VICTOR MANUEL ZEZATTI FLORES GUSTAVO URQUIZA BELTRAN MIGUEL ANGEL BASURTO PENSADO LAURA LILIA CASTRO GOMEZ (2019, [Artículo])

This research is based on the operation tube heat exchangers, their use and problematic on hydroelectric power plants. It is based on the design heat exchanger tubes for industrial use, which took the parameters of operation, design, working fluids (air and water) and conditions to assemble a monitoring equipment at appropriate scale for the laboratory, with the necessary measurement instruments to analyze the behavior of heat energy transfer by means of thermocouples, the velocity of the air with a hot wire anemometer and the flow of water with a turbine flow meter, in pipes of different materials: copper, steel 1018 and stainless steel 316L, all in ideal conditions, and with this to found a comparative parameter with pipes of the same materials but under conditions of deterioration with the presence of forced oxidation and with the data mining and support vector machine can be minimized the corrosion problems in pipes.

INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS Data Mining, Support Vector Machine, Pattern Recognition and Decision Support System, heat exchangers.

Evaluación de la cinética de liberación de compuestos hidrofílicos y lipofílicos a partir de nanopartículas híbridas polímero-lípido

Evaluation of the release kinetics of hydrophilic and lipophilic compounds from polymer-lipid hybrid nanoparticles

Juan Pablo Carmona Almazán (2023, [Tesis de maestría])

En el tratamiento de enfermedades, la administración de dosis múltiples es una estrategia común para mantener la concentración de los fármacos dentro de un margen terapéutico. Sin embargo, la adherencia de los pacientes a este tipo de tratamiento puede ser un desafío, llevando a una administración irregular de dosis. Una alternativa utilizada para abordar este reto son las nanopartículas híbridas polímero/lípido(NPPLs), las cuales, con menos administraciones, tienen el potencial de alcanzar la dosis necesaria en el tratamiento, posibilitando entonces el incremento del apego al tratamiento. En nuestro proyecto, se llevó a cabo la síntesis de nanopartículas de ácido poli láctico-co-glicólico (PLGA) recubiertas de lecitina de soya, por medio de técnicas de nanoprecipitación y autoensamblaje. Además, integramos estas nanopartículas en una matriz polimérica a base de aerogeles de gelatina de manera que estuvieran distribuidas de manera homogénea y concentrada. Nuestro enfoque central radica en entender la cinética de liberación de un compuesto hidrofílico (ácido gálico) y uno lipofílico (quercetina) a partir de este sistema. Logramos sintetizar nanopartículas con un diámetro hidrodinámico de 100 ± 15 nm, 153 ± 33 y149±21 nm, en el caso de las nanopartículas vacías y cargadas con ácido gálico y cargadas con quercetina, respectivamente. La eficiencia de encapsulación del ácido gálico fue del 90 ± 5 % y de la quercetina fue del 70 ± 10 %. Los resultados que obtuvimos muestran que el ácido gálico sigue una cinética del modelo de Korsmeyer-Peppas, con un valor de n = 1.01 y la quercetina una cinética de primer orden. Dado que los compuestos encapsulados tuvieron una liberación más lenta con respecto a los compuestos libres en los aerogeles de gelatina, nuestro trabajo indica que el encapsulamiento en NPPLs de un compuesto bioactivo, independientemente de su naturaleza química, puede ayudar a retrasar su liberación y reducir el número de dosis administradas, en consecuencia, esto pudiera contribuir a incrementar el apego de un paciente al tratamiento.

In the treatment of diseases, the administration of multiple doses is a common strategy to maintain drug concentrations within a therapeutic range. However, patient adherence to this type of treatment can be challenging, resulting in irregular dosing. An alternative approach used to address this challenge involves polymer/lipid hybrid nanoparticles (NPPLs), which have the potential to achieve the necessary drug dose with fewer administrations, thereby increasing treatment adherence. In our project, we synthesized poly(lactic-co-glycolic acid) (PLGA) nanoparticles coated with soy lecithin using nanoprecipitation and self-assembly techniques. These nanoparticles were then integrated into a polymer matrix based on gelatin aerogels to ensure homogeneous and concentrated distribution. Our main focus was to understand the release kinetics of a hydrophilic compound (gallic acid) and a lipophilic one (quercetin) from this system. We successfully synthesized nanoparticles with a hydrodynamic diameter of 100 ± 15 nm, 153 ± 33 nm, and 149 ± 21 nm for empty nanoparticles, gallic acid-loaded, and quercetin-loaded nanoparticles, respectively. The encapsulation efficiency was 90 ± 5 % for gallic acid and 70 ± 10 % for quercetin. The results we obtained indicate that gallic acid follows Korsmeyer-Peppas kinetics with a value of n = 1.01, while quercetin exhibits first-order kinetics. Since the encapsulated compounds showed slower release compared to free compounds in gelatin aerogels, our work suggests that encapsulation in NPPLs with a bioactive compound, regardless of its chemical nature, can help delay its release and reduce the number of doses administered. Consequently, this could contribute to improve patient treatment adherence.

nanopartículas híbridas, cinética de liberación, sistemas poliméricos, PLGA/lecitina, compuestos hidrofílicos y lipofílicos hybrid nanoparticles, release kinetics, polymeric systems, PLGA/lecithin, hydrophilic and lipophilic compounds INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS INGENIERÍA Y TECNOLOGÍA QUÍMICAS ANÁLISIS DE POLÍMEROS ANÁLISIS DE POLÍMEROS

Usando la descomposición de un grafo Halin para el diseño de algoritmos autoestabilizantes

Using Halin graph decomposition for the design of self-stabilizing algorithm

Daniel Uriel Orozco Lomelí (2023, [Tesis de maestría])

Sea G = (V, E) un grafo no dirigido. El problema de encontrar un conjunto independiente fuerte en G, es identificar un conjunto S ⊆ V , tal que dados dos vértices arbitrarios de S, éstos estén separados entre sí por el menos tres aristas. Encontrar un conjunto S de tamaño máximo pertenece a la clase NP-Difícil. Por otro lado, el problema de encontrar un conjunto dominante total en G es identificar un conjunto D ⊆ V , tal que cualquier vértice en V tenga al menos un vecino que pertenezca a D. Encontrar un conjunto D de tamaño mínimo también pertenece a la clase NP-Difícil. En este trabajo de tesis se diseñaron dos algoritmos, uno que resuelve el problema de encontrar un conjunto independiente fuerte maximal y otro que resuelve el problema de encontrar un conjunto dominante total minimal. Estos dos problemas son menos restrictivos que las versiones de optimización descritas al principio de este texto y se sabe que pertenecen a la clase P. Los algoritmos diseñados corren en un sistema distribuido, son autoestabilizantes, son tolerantes a fallas transitorias y funcionan para grafos Halin. Los grafos Halin pertenecen a la clase de grafos 2-outerplanares y tienen la propiedad de que se pueden partir en dos subgrafos muy conocidos, un árbol y un ciclo. Los algoritmos propuestos aprovechan la propiedad anterior para disminuir la complejidad de los mismos. Hasta donde tenemos conocimiento, los algoritmos propuestos, que corren en tiempo lineal en el número de vértices, son los algoritmos más rápidos existentes para los problemas del conjunto independiente fuerte maximal y el conjunto dominante total minimal.

Let G = (V, E) be an undirected graph. The problem of finding a strong stable set in G, is to identify a set S ⊆ V , such that given two arbitrary vertices of S, they are separated from each other by at least three edges. Finding a set S of maximum size belongs to the class NP-Hard. On the other hand, the problem of finding a total dominanting set in G is to identify a set D ⊆ V , such that any vertex in V has at least one neighbor belonging to D. Finding a set D of minimum size also belongs to the class NP-Hard. In this thesis work, two algorithms were designed, one that solves the problem of finding a maximal strong stable set and one that solves the problem of finding a minimal total dominanting set. These two problems are less restrictive than the optimization versions described at the beginning of this text and are known to belong to the P class. The designed algorithms run on a distributed system, are self-stabilizing, are transient fault tolerant, and work for Halin graphs. Halin graphs belong to the 2-outerplanar class of graphs and have the property that they can be split into two well-known subgraphs, a tree and a cycle. The proposed algorithms take advantage of the above property to decrease the complexity of the algorithms. To the best of our knowledge, the proposed algorithms, which run in linear time in the number of vertices, are the fastest existing algorithms for the maximal strong stable set and minimal total dominating set problems.

Grafo Halin, Sistemas Distribuidos, Autoestabilización, Conjunto Independiente Fuerte, Conjunto Dominante Total Halin Graph, Distributed Systems, Self-stabilizing, Strong Stable Set, Total Dominating Set INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES LENGUAJES ALGORÍTMICOS LENGUAJES ALGORÍTMICOS

Implementation of a Nickel-Electroless Coating in Heat Exchanger Pipes Considering the Problem of the Environmental Conditions ofthe Cooling Water Without Recirculation to Increase the Effectiveness Under Uncertainty

VICTOR MANUEL ZEZATTI FLORES GUSTAVO URQUIZA BELTRAN MIGUEL ANGEL BASURTO PENSADO LAURA LILIA CASTRO GOMEZ JUAN CARLOS GARCIA CASTREJON (2022, [Artículo])

This research is based on the operation tube heat exchangers, their use and problematic on hydroelectric power plants. It is based on the design heat exchanger tubes for industrial use, which took the parameters of operation, design, working fluids (air and water) and conditions to assemble a monitoring equipment at appropriate scale for the laboratory, with the necessary measurement instruments to analyze the behavior of heat energy transfer by means of thermocouples, the velocity of the air with a hot wire anemometer and the flow of water with a turbine flow meter, in pipes of different materials: copper, steel 1018 and stainless steel 316L, all in ideal conditions, and with this to found a comparative parameter with pipes of the same materials but under conditions of deterioration with the presence of forced oxidation and with the data mining and support vector machine can be minimized the corrosion problems in pipes.

INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS Data mining, Support Vector Machine, Pattern Recognition and Decision Support System, Heat exchangers

Evaluación del aporte hidrológico superficial en el sistema de bloque de montaña de la subcuenca Ojos Negros

Surface hydrological contribution evaluation in the mountain block system of the Ojos Negros subbasin

Ricardo Adolfo Hidalgo Rodríguez (2023, [Tesis de maestría])

Este trabajo se realizó en la sección de la subcuenca Ojos Negros, sobre el bloque de montaña de la Sierra de Juárez (denominado Sistema de Bloque de Montaña de la Subcuenca Ojos Negros, SBMON), en el estado de Baja California, México. Se llevó a cabo un modelado hidrológico del escurrimiento en el periodo 1981-2020 para cuantificar el aporte hidrológico de salida hacia el Valle de Ojos Negros. En cumplimiento del objetivo, se diseñó una base de datos meteorológicos compuesta por los registros diarios de las estaciones meteorológicas en la región y del modelo de forzamiento de superficie NLDAS2. Se recopiló un conjunto de información edafológica, forestal, geológica, satelital y topográfica dentro del área de estudio. Con la información recolectada, se elaboraron dos modelos de escurrimiento empleando el método de las curvas numeradas (CN) del Departamento de Agricultura de los Estados Unidos (USDA). Los modelos fueron ajustados con los valores de sustracción inicial, Ia, de 0.2 (modelo A) y 0.05 (modelo B). Las series generadas se compararon con los resultados del modelo GCN250, basado en los datos edafológicos y forestales de la Agencia Espacial Europea (ESA). A nivel regional, se observó un aporte de escurrimiento anual de 9.2 Mm3 (GCN250), 10.9 Mm3 (modelo A) y 4.7 Mm3 (modelo B). La sección oriental del SBMON mostró el mayor potencial de infiltración, pero también fue la zona con mayor producción de escurrimiento en todos los modelos. Desde la perspectiva estacional, se identificaron periodos donde los escurrimientos formados a partir de las lluvias en verano superaron a los generados en la temporada invernal. Con base a los resultados obtenidos, el aporte de escurrimiento dentro del SBMON es significativa, no obstante, los procesos de escurrimiento subsuperficial y subterráneo pueden tener un papel todavía más importante en la recarga hacia el Valle de Ojos Negros. Se recomienda dar seguimiento a la variación del contenido de humedad en los suelos del SBMON, a los patrones anuales y estacionales de precipitación, así como la contribución hídrica del derretimiento de la nieve en la Sierra de Juárez.

This work was realized in the section of the Ojos Negros sub-basin, on the Sierra de Juárez mountain block (denominated Mountain Block System of the Ojos Negros Sub-Basin, SBMON), in the state of Baja California, Mexico. A hydrological runoff modeling was carried out for the period 1981-2020 to quantify the output hydrological contribution toward the Ojos Negros Valley. In compliance with the objective, a meteorological database consisting of the daily records of the meteorological stations and the NLDAS-2 surface forcing model was designed. A set of edaphological, forestry, geological, satellite, and topographical information was collected within the study area. Based on the collected information, two runoff models were developed using the Curve Number (CN) method from the United States Department of Agriculture (USDA). The models were adjusted with the initial subtraction values, Ia, of 0.2 (model A) and 0.05 (model B). The generated series were compared with the results of the GCN250 model, based on soil and forestry data from the European Space Agency (ESA). Regionally, an annual runoff contribution of 9.2 Mm3 (GCN250), 10.9 Mm3 (model A), and 4.7 Mm3 (model B) was observed. The eastern section of the SBMON showed the highest infiltration potential, but it was also the area with the highest runoff production in all models. From the seasonal perspective, periods were identified where the runoff formed from summer rains exceeded that generated in the winter season. Based on the results obtained, the runoff contribution within the SBMON is significant, however, the subsurface and underground runoff processes may have an even more key role in the recharge toward the Ojos Negros Valley. It is recommended to monitor the variation of the moisture content in the SBMON soils, the annual and seasonal patterns of precipitation, as well as the water contribution from the snow melting in the Sierra de Juárez.

Sistema de bloque de montaña de la subcuenca Ojos Negros, escurrimiento, infiltración, método de las Curvas Numeradas, GCN250 Mountain Block System of the Ojos Negros Sub-Basin, runoff, infiltration, Curve Number method, GCN250 CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA CIENCIAS DE LA TIERRA Y DEL ESPACIO OTRAS ESPECIALIDADES DE LA TIERRA, ESPACIO O ENTORNO OTRAS OTRAS

Control de sistemas usando aprendizaje de máquina

Systems control using machine learning

Jesús Martín Miguel Martínez (2023, [Tesis de maestría])

El aprendizaje por refuerzo es un paradigma del aprendizaje de máquina con un amplio desarrollo y una creciente demanda en aplicaciones que involucran toma de decisiones y control. Es un paradigma que permite el diseño de controladores que no dependen directamente del modelo que describe la dinámica del sistema. Esto es importante ya que en aplicaciones reales es frecuente que no se disponga de dichos modelos de manera precisa. Esta tesis tiene como objetivo implementar un controlador óptimo en tiempo discreto libre de modelo. La metodología elegida se basa en algoritmos de aprendizaje por refuerzo, enfocados en sistemas con espacios de estado y acción continuos a través de modelos discretos. Se utiliza el concepto de función de valor (Q-función y función V ) y la ecuación de Bellman para resolver el problema del regulador cuadrático lineal para un sistema mecánico masa-resorte-amortiguador, en casos donde se tiene conocimiento parcial y desconocimiento total del modelo. Para ambos casos las funciones de valor son definidas explícitamente por la estructura de un aproximador paramétrico, donde el vector de pesos del aproximador es sintonizado a través de un proceso iterativo de estimación de parámetros. Cuando se tiene conocimiento parcial de la dinámica se usa el método de aprendizaje por diferencias temporales en un entrenamiento episódico, que utiliza el esquema de mínimos cuadrados con mínimos cuadrados recursivos en la sintonización del crítico y descenso del gradiente en la sintonización del actor, el mejor resultado para este esquema es usando el algoritmo de iteración de valor para la solución de la ecuación de Bellman, con un resultado significativo en términos de precisión en comparación a los valores óptimos (función DLQR). Cuando se tiene desconocimiento de la dinámica se usa el algoritmo Q-learning en entrenamiento continuo, con el esquema de mínimos cuadrados con mínimos cuadrados recursivos y el esquema de mínimos cuadrados con descenso del gradiente. Ambos esquemas usan el algoritmo de iteración de política para la solución de la ecuación de Bellman, y se obtienen resultados de aproximadamente 0.001 en la medición del error cuadrático medio. Se realiza una prueba de adaptabilidad considerando variaciones que puedan suceder en los parámetros de la planta, siendo el esquema de mínimos cuadrados con mínimos cuadrados recursivos el que tiene los mejores resultados, reduciendo significativamente ...

Reinforcement learning is a machine learning paradigm with extensive development and growing demand in decision-making and control applications. This technique allows the design of controllers that do not directly depend on the model describing the system dynamics. It is useful in real-world applications, where accurate models are often unavailable. The objective of this work is to implement a modelfree discrete-time optimal controller. Through discrete models, we implemented reinforcement learning algorithms focused on systems with continuous state and action spaces. The concepts of value-function, Q-function, V -function, and the Bellman equation are employed to solve the linear quadratic regulator problem for a mass-spring-damper system in a partially known and utterly unknown model. For both cases, the value functions are explicitly defined by a parametric approximator’s structure, where the weight vector is tuned through an iterative parameter estimation process. When partial knowledge of the dynamics is available, the temporal difference learning method is used under episodic training, utilizing the least squares with a recursive least squares scheme for tuning the critic and gradient descent for the actor´s tuning. The best result for this scheme is achieved using the value iteration algorithm for solving the Bellman equation, yielding significant improvements in approximating the optimal values (DLQR function). When the dynamics are entirely unknown, the Q-learning algorithm is employed in continuous training, employing the least squares with recursive least squares and the gradient descent schemes. Both schemes use the policy iteration algorithm to solve the Bellman equation, and the system’s response using the obtained values was compared to the one using the theoretical optimal values, yielding approximately zero mean squared error between them. An adaptability test is conducted considering variations that may occur in plant parameters, with the least squares with recursive least squares scheme yielding the best results, significantly reducing the number of iterations required for convergence to optimal values.

aprendizaje por refuerzo, control óptimo, control adaptativo, sistemas mecánicos, libre de modelo, dinámica totalmente desconocida, aproximación paramétrica, Q-learning, iteración de política reinforcement learning, optimal control, adaptive control, mechanical systems, modelfree, utterly unknown dynamics, parametric approximation, Q-learning, policy iteration INGENIERÍA Y TECNOLOGÍA CIENCIAS TECNOLÓGICAS TECNOLOGÍA DE LOS ORDENADORES INTELIGENCIA ARTIFICIAL INTELIGENCIA ARTIFICIAL