Universidad Central “Marta Abreu” de Las Villas Facultad de Ingenieŕıa Eléctrica Departamento de Automática y Sistemas Computacionales TRABAJO DE DIPLOMA Control en Modo Deslizante basado en Lógica Borrosa para una plataforma neumática de 2 Grados de Libertad (2-GDL) Autor: Dianelis Garćıa Llerena Tutor: Msc. Pablo J. Prieto Entenza Santa Clara 2013 “Año 55 de la Revolución” Universidad Central “Marta Abreu” de Las Villas Facultad de Ingenieŕıa Eléctrica Departamento de Automática y Sistemas Computacionales TRABAJO DE DIPLOMA Control en Modo Deslizante basado en Lógica Borrosa para una plataforma neumática de 2 Grados de Libertad (2-GDL) Autor: Dianelis Garćıa Llerena email: dianelis@uclv.edu.cu Tutor: Msc. Pablo J. Prieto Entenza Prof. Asistente Dpto. de Automática, Facultad de Ing. Eléctrica, UCLV email: pablop@uclv.edu.cu Santa Clara 2013 “Año 55 de la Revolución” Hago constar que el presente TRABAJO DE DIPLOMA fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingenieŕıa en Automática, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad. Dianelis Garćıa Llerena Fecha Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada. Dianelis Garćıa Llerena Fecha Autor Boris Luis Mart́ınez Jiménez, Dr.C Fecha Jefe del Departamento Responsable ICT o J’ de Carrera, (Dr.C., M.Sc. o Ing.) Fecha Responsable de Información Cient́ıfico - Técnica PENSAMIENTO “El futuro tiene muchos nombres. Para los débiles es lo inalcanzable. Para los temerosos, lo desconocido. Para los valientes es la oportunidad.” Victor Hugo i DEDICATORIA Especialmente a mi mamá y a mi abuela, que siempre me han apoyado y guiado. A mi papá, que siempre ha estado cerca. Y a mi hermano, para marcarle el dif́ıcil camino que conduce a la superación. ii AGRADECIMIENTOS Por encima de todo me gustaŕıa expresar mi sincero aprecio a mi tutor que me ha guiado a lo largo del desarrollo de este Trabajo de Diploma con su dedicación y conocimiento, si bien permitiéndome trabajar a mi propia manera. Su consagración y voluntad fue fundamental al éxito de este trabajo, que sin dudas es tan de él como mı́o. Fue un honor para mı́ trabajar con él durante todo este tiempo. Durante mis años de estudio en la Universidad, tuve la gran suerte de conocer a muchas personas maravillosas que hicieron de esta un lugar especial para mı́. Muchas gracias a todos por su amistad y por los grandiosos momentos compartidos. Me gustaŕıa agradecer a todos mis profesores por su gúıa académica y a aquellos, cuyas contribuciones, sugerencias, discusiones técnicas y consideraciones han ayudado a mejorar la calidad de esta tesis. Finalmente, no hay palabra para describir mi gratitud hacia mi familia por su infinito apoyo y amor incondicional. Gracias por estar siempre ah́ı para mı́. iii RESUMEN Los simuladores de conducción, además de ser usados para la capacitación y entre- namiento de potenciales conductores de veh́ıculos, tienen una aplicación muy cercana y creciente en juegos y entretenimientos. Dichas plataformas permiten el entrenamiento del personal y se minimiza aśı el uso de veh́ıculos reales, con el consiguiente ahorro de recursos. Además evitan posibles accidentes de los principiantes en condiciones de peligrosidad, ya que el ordenador permite reproducir condiciones extremas de conducción en un ambiente virtual, seguro y totalmente controlado. El Grupo de Automática Robótica y Percepción (GARP) tiene la tarea de desarrollar estrategias de control para sistemas no lineales aplicados en robots paralelos, esta vez, controles no lineales debido a las ventajas de los mismos. En este trabajo son expuestos criterios seguidos para el uso de estrategias de control en modo deslizante (SMC ) por la efectividad del mismo ante elementos altamente no lineales. Se hace énfasis en las limitaciones del control deslizante y por ende en la necesidad de buscar variantes del mismo para resolver su principal problema, el chattering que deteriora su desempeño en la práctica. Son descritas, a lo largo de la tesis, las diferentes variantes para resolver y eliminar este fenómeno, haciendo énfasis en una variante llamada Control por modo deslizante basado en lógica borrosa (FSMC ) que combina las ventajas de Control en Modo Deslizante y Control Borroso. Los resultados obtenidos mediante simulación y pruebas experimentales demuestran las ventajas de dicho algoritmo de control. iv TABLA DE CONTENIDO Página PENSAMIENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i DEDICATORIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii AGRADECIMIENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii RESUMEN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv Índice de tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii Índice de figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1. Robótica Paralela y Algoritmos de control. . . . . . . . . . . . . . . 6 1.1. Caracteŕısticas de los robots paralelos . . . . . . . . . . . . . . . . . . 9 1.1.1. Campo de aplicación . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2. Tipos de actuadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.1. Actuadores neumáticos de desplazamiento lineal . . . . . . . . . 14 1.3. Control desacoplado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.4. Algoritmos de control en sistemas neumáticos . . . . . . . . . . . . . . 17 1.4.1. Estrategias de control convencional . . . . . . . . . . . . . . . . 18 1.4.2. Control adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4.3. Sistemas basados en redes neuronales . . . . . . . . . . . . . . . 22 1.4.4. Control basado en lógica borrosa . . . . . . . . . . . . . . . . . 25 1.4.5. Control basado en modo deslizante . . . . . . . . . . . . . . . . 26 1.5. Consideraciones finales del caṕıtulo . . . . . . . . . . . . . . . . . . . . 27 2. Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad . . . . . . . . . . . . . . . . . . . . 29 v 2.1. Plataforma de 2 grados de libertad(2-GDL) . . . . . . . . . . . . . . . . 29 2.1.1. Modelo dinámico del actuador neumático . . . . . . . . . . . . . 30 2.2. Control en Modo Deslizante . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2.1. Diseño del controlador . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.2. Robustez del control en modo deslizante . . . . . . . . . . . . . . 40 2.2.3. Chattering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.3. Lógica Difusa: Conceptos básicos de conjuntos difusos . . . . . . . . . . 43 2.3.1. Controladores borrosos . . . . . . . . . . . . . . . . . . . . . . . 44 2.4. Control Deslizante basado en Lógica Borrosa . . . . . . . . . . . . . . . 46 2.5. Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3. Esquema de control FSMC para plataforma de 2 GDL. Simu- lación y resultados experimentales . . . . . . . . . . . . . . . . . . . . 51 3.1. Diseño del control en modo deslizante para el sistema neumático . . . . 51 3.1.1. Simulación con ADAMS . . . . . . . . . . . . . . . . . . . . . . 53 3.2. Diseño del control deslizante basado en fuzzy para el sistema neumático 54 3.2.1. Análisis por simulación mediante Simulink-Adams . . . . . . . . 56 3.2.2. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . 58 3.3. Análisis económico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.4. Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 CONCLUSIONES Y RECOMENDACIONES . . . . . . . . . . . . . . . . . . . . . 63 REFERENCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . 72 ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 A. Funciones de Membreśıa más comunes . . . . . . . . . . . . . . . . . 74 B. Valores de error obtenidos durante las pruebas experimentales en la plataforma de 2-GDL. . . . . . . . . . . . . . . . . . . . . . . . . 76 vi Índice de tablas Tabla Página 1–1. Diferencias principales entre los robots series y paralelos . . . . . . . . . . . 10 2–1. Datos mecánicos del simulador de conducción SIMPRO . . . . . . . . . . . 30 3–1. Reglas borrosas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 vii Índice de figuras Figura Página 1–1. Plataformas de Gough . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1–2. Varios tipos de Mesas multiejes para la simulación de veh́ıculos . . . . . . . 7 1–3. Configuración del robot Delta presentado por Clavel. . . . . . . . . . . . . 9 1–4. Robot serie y paralelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1–5. Varias configuraciones de robots planares. . . . . . . . . . . . . . . . . . . . 10 1–6. Robot espacial con rotaciones alrededor de un centro. . . . . . . . . . . . . 11 1–7. Robots paralelos en aplicaciones médicas . . . . . . . . . . . . . . . . . . . 12 1–8. Algoritmo PID convencional. . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1–9. Algoritmo genérico de control adaptativo. . . . . . . . . . . . . . . . . . . . 20 1–10.Control Adaptativo por Modelo de Referencia(MRAC). . . . . . . . . . . . 22 1–11.Control Adaptativo de auto-sintońıa. . . . . . . . . . . . . . . . . . . . . . 22 1–12.Esquema de una red neuronal. . . . . . . . . . . . . . . . . . . . . . . . . . 23 1–13.Identificación por el método back-propagation. . . . . . . . . . . . . . . . . 24 2–1. Plataforma de 2 GDL y su arquitectura geométrica . . . . . . . . . . . . . 30 2–2. Esquema de un sistema neumático. . . . . . . . . . . . . . . . . . . . . . . 31 2–3. Diagrama de bloques para la identificación dinámica del sistema neumático 32 2–4. Efecto del control en modo deslizante sobre la trayectoria de un sistema de segundo orden representado en el plano-fase. . . . . . . . . . . . . . . . . 37 2–5. Diagrama a bloques de un lazo de control ideal en modos deslizantes. Un controlador discontinuo obliga a la señal de salida x(t) de la planta que siga a la trayectoria de referencia xd(t). . . . . . . . . . . . . . . . . . . . 40 viii 2–6. Representación del efecto de chattering, resultado de la acción del control deslizante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2–7. Forma t́ıpica de funciones de pertenencia: 1-triangular, 2-trapezoidal, 3- gaussiana, 4-campana generalizada, 5-singleton. . . . . . . . . . . . . . . 44 2–8. Esquema de control borroso. . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2–9. Esquema de control FSMC con la sustitución del elemento discontinuo. . . 47 2–10.Esquema de control FSMC teniendo en cuenta la derivada de la superficie deslizante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2–11.Esquema de control FSMC teniendo en cuenta la sintonización de λ. . . . . 49 2–12.Esquema de control FSMC propuesto para la plataforma de 2 GDL. . . . . 49 3–1. Diagrama de bloques en Simulink de la ley de control SMC. . . . . . . . . 52 3–2. Modelo en ADAMS de la plataforma de 2 GDL y Esquema en ADAMS- Simulink del control SMC. . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3–3. Respuesta de tiempo ante referencia escalón del control SMC. . . . . . . . . . . 53 3–4. Diagrama de bloques en Simulink de la ley de control FSMC. . . . . . . . . 54 3–5. Funciones de pertenencia para las variables de entrada y salida. . . . . . . 55 3–6. Simulación en ADAMS ante entrada escalón como referencia con FSMC. . . . . 56 3–7. Simulación en ADAMS ante entrada sinusoidal como referencia con FSMC.(Fase de adelanto igual a 3 rad) . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3–8. Simulación en ADAMS ante entrada sinusoidal como referencia con FSMC.(Fase de adelanto igual a 5 rad) . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3–9. Respuesta real del sistema ante entrada escalón como referencia con FSMC. . . 58 3–10.Respuesta real del sistema ante un tren de pulsos como referencia con FSMC. . 59 3–11.Respuesta del sistema ante entrada sinusoidal como referencia con FSMC (Fase de adelanto igual a 3 rad). . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3–12.Respuesta del sistema ante entrada sinusoidal como referencia con FSMC (Fase de adelanto igual a 5 rad). . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 ix A–1. Función de pertenencia tipo triangular. . . . . . . . . . . . . . . . . . . . . 74 A–2. Función de pertenencia tipo trapezoidal. . . . . . . . . . . . . . . . . . . . 74 A–3. Función de pertenencia tipo gaussiana. . . . . . . . . . . . . . . . . . . . . 75 B–1. Errores de posición. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 B–2. Errores de trayectoria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 x INTRODUCCIÓN El continuo y acelerado avance de la ciencia y la tecnoloǵıa en los últimos años, ha permitido el perfeccionamiento de ciencias aplicadas, como la robótica, de una manera rápida e intensa. Los aportes de una informática en inagotable desarrollo, las bases teóri- cas brindadas por la Teoŕıa de Control Moderna, junto a los novedosos impulsos de la inteligencia artificial, permiten prever la disponibilidad, en pocos años, de robots dotados de una gran flexibilidad y capacidad de adaptación al entorno, que invadirán una gran cantidad de sectores productivos de forma imparable. De acuerdo a la estructura cinemática del mecanismo los robots se dividen en tres grandes categoŕıas: robots seriales, paralelos e h́ıbridos. Se dice que un robot es serie si su cadena cinemática es abierta; es decir, sus elementos se encuentran conectados uno a uno. Un robot paralelo, por su parte, posee una estructura mecánica formada por un mecanismo de cadena cinemática cerrada, en el que el efector final se une a la base por al menos dos cadenas cinemáticas independientes. Si aparecen ambos tipos de cadenas cinemáticas en un mismo robot se dice que éste es de estructura h́ıbrida (Merlet, 2006). El interés hacia la investigación y desarrollo de robots paralelos ha crecido vertigi- nosamente dentro de la comunidad cient́ıfica internacional. Entre las principales ventajas de estos robots se tiene, la alta exactitud de posicionamiento, debido a que el error de las articulaciones no es acumulativo, mayor rigidez en su estructura mecánica, aśı como alta relación peso-carga y gran velocidad de movimiento (Sebastian, 2007; Ramdani, 2008; Pierrot, 2009). 1 Introducción 2 Sin embargo, su estudio implica diversos desaf́ıos, como limitaciones en el espacio de trabajo, la existencia de varios tipos de singularidades, mayor complejidad en los procedi- mientos de modelado y simulación, aśı como aspectos relativos al sistema sensorial (Staicu, 2009; Narayanan, 2010). En los robots paralelos la utilización de cilindros neumáticos de desplazamiento lineal como elemento actuador se ha hecho frecuente. En los últimos años estos elementos se han aplicado satisfactoriamente en el posicionamiento continuo de robots paralelos, platafor- mas de simulación, sistemas de carga/descarga y otros. De esta manera han demostrado ser la solución más económica para plataformas de simuladores y juegos (Aracil, 2006); debido a que estos sistemas tienen grandes ventajas como la limpieza, altas razones de carga contra peso y carga contra volumen, desarrollan altas velocidades y grandes fuerzas, permitiendo el desarrollo de manipuladores compactos, ligeros y rentables que podŕıan ser utilizados en una gran variedad de aplicaciones (Pearce and Michael, 2005; Hahn, 2005). Sin embargo, el control preciso y rápido de sistemas neumáticos se dificulta debido al alto orden del actuador y su dinámica variante en el tiempo, producto de la compresibilidad del aire, disturbios externos tales como fricciones estáticas y de Coulomb, variaciones de la carga útil y variaciones de la fuente de presión (Aracil, 2006; Rubio, 2009a). La presencia de estas no linealidades confiere al problema del control de movimiento de los simuladores vital importancia por la complejidad que implican los algoritmos (Brun, 2000; Krejnin, 2006) necesitando soluciones particulares de implementación. El tema del control de posicionamiento de los actuadores neumáticos utilizados en las plataformas es objeto de estudio de numerosos cient́ıficos e investigadores donde son varias las propuestas de algoritmos aśı como los resultados obtenidos. Puesto que la dinámica de estos actuadores es altamente no lineal y variante en el tiempo el uso de los controles lineales clásicos como el PID, de fácil implementación y conocida simplicidad no es re- comendable, debiendo aplicarse algún método de control robusto (Krejnin, 2006). Introducción 3 Uno de los algoritmos de control, caracterizado por su robustez independientemente del modelo matemático de la planta, es el Control por Modo Deslizante (SMC), el cual además ha sido muy estudiado en los últimos tiempos. Los sistemas con modo deslizante tienen la capacidad de ser una herramienta eficiente para el control complejo de alto orden de plantas dinámicas no lineales que operan bajo condiciones inciertas (Bartoszewicz, 2009; Krejnin, 2006). La estrategia sin embargo, presenta un problema fundamental que puede conllevar al deterioro de los sistemas electro-mecánicos, este es el fenómeno del chattering, que ha impedido a lo largo de tiempo implementar estrategias deslizantes en sistemas f́ısicos reales. Muchos autores han propuesto alternativas de solución al problema, entre ellas la combinación con técnicas inteligentes que permitan atenuar dicho fenómeno. En la literatura es reportado el uso de técnicas borrosas en los algoritmos de control en modo deslizante mostrando alentadores resultados (Bartoszewicz, 2009). El campo de la robótica paralela es casi exclusivo de páıses desarrollados, no obstante, en Cuba se cuenta con el Centro de Investigación y Desarrollo de Simuladores (SIMPRO) que diseña y fabrica simuladores industriales de movimiento. Dicha institución en colabo- ración con el Grupo de Automática, Robótica y Percepción (GARP) de la Universidad Central “Marta Abreu”de Las Villas, ha venido desarrollando en los últimos años investi- gaciones conjuntas en robots paralelos accionados por cilindros neumáticos, para su empleo como simuladores industriales de movimiento, con resultados investigativos y de aplicación industrial (Izaguirre, 2011; Rubio, 2007a). Este trabajo toma como base, un simulador de movimiento de dos grados de liber- tad (2-GDL) desarrollado por la empresa SIMPRO, el cual es accionado por cilindros neumáticos de doble efecto. La posición del elemento terminal es la salida más importante del sistema. A pesar de contar con estrategias de control articular probadas y validadas experimentalmente, estas requieren como base la existencia de un modelo preciso que tenga en cuenta las complejidades dinámicas del sistema. Introducción 4 El uso de técnicas más robustas, que puedan resultar poco exigentes ante incertidum- bres en los parámetros del modelo o prescindir totalmente de este, puede mejorar esta problemática. En el departamento de Automática y Sistemas Computacionales de la Uni- versidad Central “Marta Abreu”de Las Villas se han realizado trabajos que involucran el control en modo deslizante (Prieto, 2013), pero la aplicación de técnicas de control borroso ha sido poco abordada. El problema cient́ıfico se enfoca entonces en la necesidad de ampliar y desarrollar algoritmos de control en modo deslizante basado en lógica borrosa robustos ante incer- tidumbres en el modelo y que permitan además atenuar el fenómeno de chattering y eliminar el efecto de las no linealidades inherentes a los sistemas neumáticos. Dentro de este contexto, se pretende con el trabajo de investigación, cumplir los siguientes objetivos: Objetivo general: Implementar un sistema de control de posición en modo deslizante para actuadores neumáticos incorporando lógica borrosa con propósito de atenuar el chat- tering y las no linealidades de la planta. Objetivos espećıficos: Analizar las estrategias, caracteŕısticas generales y resultados obtenidos en relación al proceso de control de actuadores neumáticos en la bibliograf́ıa especializada. Establecer los fundamentos teóricos y pasos a seguir para el diseño de estrategias de control en modo deslizante, lógica borrosa y la combinación de ambos métodos. Plantear el esquema de control en modo deslizante basado en lógica borrosa aplicado al posicionamiento continuo de los actuadores neumáticos del robot paralelo de dos grados de libertad, capaz de cumplir con las especificaciones de diseño establecidas. Evaluar mediante simulación y experimentos reales el desempeño del algoritmo de control. Organización del Informe: La investigación incluye tres caṕıtulos, además de la introducción, conclusiones, recomendaciones, referencias bibliográficas y anexos correspon- dientes. Los temas que se abordan en cada caṕıtulo se encuentran estructurados de la forma siguiente: Introducción 5 CAPÍTULO I: En el primer caṕıtulo se realiza el análisis cŕıtico de la literatura especializada consultada. Se ofrece una panorámica sobre las principales caracteŕısticas de los robots paralelos, aplicaciones, aśı como los elementos actuadores empleados en su construcción. Se presenta un estudio comparativo sobre las principales metodoloǵıas aplicadas al control de sistemas neumáticos. CAPÍTULO II: El segundo caṕıtulo describe las caracteŕısticas principales de la plataforma de 2-GDL. Se establecen los pasos para el diseño e implementación del algo- ritmo de control en modo deslizante y se presentan además las limitaciones que impiden su aplicación en sistemas f́ısicos reales. Se detallan además los pasos metodológicos para el diseño del controlador de lógica borrosa. Finalmente se aborda el control en modo deslizante basado en lógica borrosa (FSMC) hasta llegar al diagrama de bloques propues- to. CAPÍTULO III: Este caṕıtulo está dedicado a sintetizar el control FSMC plantea- do. Se evalúan y analizan los resultados obtenidos mediante simulación y posteriormente se validan experimentalmente. Finalmente se presenta el análisis económico de la investi- gación. CAPÍTULO 1 ROBÓTICA PARALELA Y ALGORITMOS DE CONTROL. Los robots paralelos, también denominados máquinas cinemáticas paralelas o mani- puladores paralelos (Merlet, 2006) , se definen como aquellos cuya estructura mecánica que une la base fija con el elemento terminal está compuesta por múltiples e independientes cadenas cinemáticas cerradas donde al menos una es actuada. Poseen mayor fortaleza estructural gracias a que el elemento terminal es soportado en varios puntos, además las propias extremidades del robot permiten desempeñar simultáneamente la función de sostén estructural y de actuadores. Eventualmente, el área de los simuladores de movimiento se consagró cuna para la investigación y desarrollo de los robots paralelos. Se registra que en el año 1931 J. E. Gwinnett patenta una de las primeras invenciones reconocidas de arquitecturas de esta ı́ndole. Se describe como una plataforma, denominada Amusement Device, sobre la cual estaban colocados los asientos de un teatro con el propósito de introducir un movimiento que ofreciese una apariencia más real del espectáculo. Según la información existente, la plataforma nunca llegó a construirse (Zabalza, 2007). En 1947 Eric Gough, aplicando los principios básicos de los mecanismos de cadena cinemática cerrada, diseñó un robot paralelo con seis actuadores lineales formando una estructura de octaedro hexápodo con lados de longitud variable (Merlet, 2006; Aracil, 2006). Esta plataforma móvil de seis grados de libertad fue adoptada para la revisión del comportamiento de neumáticos de aviación de la casa Dunlop bajo cargas aplicadas a diferentes ejes, intentando simular el aterrizaje de un avión, (Máquina Universal de Prueba 6 Robótica Paralela y Algoritmos de control. 7 de Neumáticos). Se presentó en el Congreso de la Federación Internacional de Sociedades de Ingenieros y Técnicos del Automóvil (FISITA) en 1962 (Gough, 1962). La configuración mecánica de la plataforma de Gough permite la construcción de arquitecturas más ŕıgidas utilizando cadenas cinemáticas idénticas. Lo cual implica poder manejar grandes cargas con elevada precisión además de reducciones en el costo y fácil mantenimiento. La figura 1–1 muestra diferentes modelos de esta construcción. (a) Plataforma de Gough presentado en 1947 (b) Plataforma de Gough moderna Figura 1–1: Plataformas de Gough Actualmente, este ingenioso diseño establece el punto de partida para la construcción de múltiples prototipos de plataformas, entre ellas las populares Mesas de Simulación Multiejes (MAST: Multi-Axis Simulation Table) muy explotadas para la simulación de conducción de todo tipo de veh́ıculos, mostrados en la figura 1–2. Figura 1–2: Varios tipos de Mesas multiejes para la simulación de veh́ıculos Robótica Paralela y Algoritmos de control. 8 Posteriormente, D. Stewart presentó un art́ıculo en el que describ́ıa una plataforma de movimiento de 6 grados de libertad destinada a operar como simulador de vuelo. Esta reprodućıa el patrón de extremidades ortogonales de la plataforma de Gough, en la cual la base y el elemento terminal estaban unidos por cadenas cinemáticas cerradas. El art́ıculo de Stewart alcanzó gran influencia en el mundo académico, calificándose como uno de los primeros trabajos de análisis académico de plataformas paralelas (Aracil, 2006; Merlet, 2006). Aśı, en 1967 Klaus L. Cappel desarrolla un simulador de movimiento según la con- figuración Gough-Stewart, que fue empleado como simulador de helicópteros (Cappel, 1967). Desde entonces, los simuladores de movimiento constituyen el campo donde mayores créditos ha ganado la aplicación de robots paralelos (Ahmad, 2006; Lombaerts, 2011; Changfeng, 2007). En este sentido se destacan además novedosos simuladores de vuelo para el entrenamiento de pilotos, entre ellos, los simuladores de vuelo de la NASA (Slob, 2008), el simulador NADS de la Universidad de Iowa (Ahmad, 2006), y el TACOM con capacidad de carga de hasta 27 toneladas y alcanza aceleraciones verticales de magnitudes entre cuatro y seis veces la aceleración de la gravedad (Reid, 1992). Por otra parte, en 1979 McCallion y Pham fueron los primeros que propusieron usar la plataforma de Stewart como un mecanismo paralelo para una célula de ensamblaje robotizada, básicamente porque la posición del efector final es mucho menos sensible a los errores que los sensores articulares que caracterizan a los robots serie (Yañez, 2007). En la década del ’80 Raymond Clavel (Clavel, 1988) presenta sus estudios sobre el robot paralelo Delta, mostrado en la figura 1–3. La idea básica detrás del diseño del robot Delta es el uso de paralelogramos. Estos robots se usan en operaciones rápidas como recoger y poner objetos ligeros (desde 10 g hasta 1 kg) a lo largo de trayectorias de alrededor de 200mm de longitud. Actualmente, se construyen algunos prototipos de robots Delta capaces de mover objetos pesados. Robótica Paralela y Algoritmos de control. 9 Figura 1–3: Configuración del robot Delta presentado por Clavel. 1.1. Caracteŕısticas de los robots paralelos La expresión robot paralelo identifica y diferencia a los robots de cadena cinemática cerrada de los robots de cadena cinemática abierta (robots serie), representado en la figura 1–4. Ambas arquitecturas difieren en numerosos aspectos los cuales, en esencia, definen sus principales caracteŕısticas, tabla 1–1. El término paralelo se introduce en el sentido topológico más que por carácter puramente geométrico, ya que los actuadores accionan en conjunto o de manera paralela, sin embargo nada tiene que ver con la existencia de elementos alineados paralelamente (Wobbe, 2008). Figura 1–4: Robot serie y paralelo. La topoloǵıa o arquitectura de un mecanismo paralelo define las articulaciones, cone- xiones, acoplamientos y actuadores que están dispuestos para lograr un determinado mo- vimiento. En la literatura constan múltiples configuraciones estructurales para los robots Robótica Paralela y Algoritmos de control. 10 Tabla 1–1: Diferencias principales entre los robots series y paralelos Descripción Robot Serie Robot Paralelo Modelado Dinámico Laborioso, complejo Muy laborioso y complejo Cadenas Cinemáticas Abiertas Cerradas Espacio de Trabajo Amplio Reducido Error Articular Acumulativo Promedio Relación Peso-Carga Buena Excelente Estructura Mecánica Simple Compleja Cinemática Directa Fácil, solución única Dif́ıcil, múltiples soluciones Cinemática Inversa Dif́ıcil, múltiples soluciones Fácil, solución única Singularidades Pierde movilidad Pierde/gana movilidad Inercia Alta Baja paralelos. Las combinaciones de número de cadenas cinemáticas, tipo de las mismas, res- tricciones en el movimiento de las articulaciones, etc., hacen prácticamente irrealizable un análisis generalizado de las estructuras de los robots paralelos. El investigador francés Jean Pierre Merlet ha sido el autor que más ha profundizado sobre dichas configuraciones. En principio, y según el tipo de movimientos que son capaces de realizar se pueden distinguir dos grupos: los robots planares y los espaciales (Merlet, 2006). Figura 1–5: Varias configuraciones de robots planares. Los mecanismos planares se identifican por un movimiento restringido al plano, por lo que pueden tener de 2 a 3 grados de libertad, correspondientes a dos traslaciones en el plano y una rotación sobre un eje perpendicular al mismo. Por su parte, los robots espaciales se distinguen por su facultad para moverse en todo el espacio tridimensional y no en un plano. Es decir, se pueden trasladar (posición en el espacio) y girar (orientación en el espacio) sobre los tres ejes de coordenadas. Se componen de un efector final conectado con la base por un número de cadenas cinemáticas. El número de cadenas cinemáticas generalmente estipula los grados de libertad del manipulante, usualmente tres grados de libertad son suficientes para muchos usos. Particularmente, Robótica Paralela y Algoritmos de control. 11 los mecanismos esféricos de tres grados de libertad se pueden utilizar para los robots humanoides. Sin embargo, para analizar la adaptación de estos mecanismos a los elementos de un robot humanoide se debe considerar el estudio del espacio de trabajo y la destreza de estas plataformas (Merlet, 2006). Los manipuladores que realizan rotaciones alrededor de un centro, son otra de sus variantes comúnmente explotadas. En la figura 1–6 se ilustra un mecanismo con un mástil central, que es acoplado a una plataforma móvil por mediación de una articulación esférica. Esta arquitectura habitualmente se aprovecha en simuladores de vuelo y de conducción. Figura 1–6: Robot espacial con rotaciones alrededor de un centro. 1.1.1. Campo de aplicación Los simuladores de movimiento por ejemplo, encuentran una aplicación creciente para el entrenamiento y capacitación de personal en la conducción de automóviles, aviones, trenes e incluso naves espaciales (Sabrie, 2004; Chiew, 2008). La intención inicial de estas estructuras fue para la simulación de dispositivos aéreos, sin embargo numerosas compañ́ıas han diversificado su construcción y finalidades. Los simuladores de conducción han incrementado su aceptación a nivel mundial en la medida que han aumentado sus potencialidades para recrear con mayor precisión, exactitud y realismo las condiciones de un mundo virtual. En el campo de la medicina, particularmente en la ciruǵıa (oftalmoloǵıa, neurociruǵıa, etc), mostrado en la figura 1–7, el alto nivel de exactitud conquistado con los robots paralelos en el posicionamiento del elemento final es utilizado para lograr suturas precisas. Robótica Paralela y Algoritmos de control. 12 De manera creciente en el campo de la rehabilitación médica (Tsoi, 2008), se distingue la plataforma de movimiento CAREN, fabricada por la compañ́ıa holandesa Motek Medical BV (Lees, 2007), aśı como en el entrenamiento de deportistas figura el simulador de ciclismo KAIST (Kwon, 2001). (a) Robot Delta (b) Robot Stewart Figura 1–7: Robots paralelos en aplicaciones médicas En la industria de componentes electrónicos también se ha potenciado su aplicación debido a la necesidad de una alta precisión en la soldadura por puntos. En el campo de las comunicaciones la ventaja de estas estructuras es patente donde se demande el manejo de pesos que genéricamente comprende desde decenas de kilogramos hasta toneladas, como es el caso de la orientación de radares y grandes antenas. El sector industrial por su parte utiliza estas estructuras, en máquinas de herramien- tas, taladros, fresadoras, etc. El robot industrial Hermes desarrollado por Fatronik es un ejemplo de robot paralelo para este propósito (Aracil, 2006). Otras de las principales apli- caciones son el desarrollo de herramientas de perforación, rebajado de piezas, soldadura, ensamblaje en la industria de automóviles, etc. Por otra parte, la implementación de robots trepadores evidencia la versatilidad que pueden alcanzar las arquitecturas paralelas. La esfera del entretenimiento y ocio, deriva otra de las destacadas y recientes aplica- ciones de los simuladores de movimiento, que junto al empleo de las técnicas de realidad Robótica Paralela y Algoritmos de control. 13 virtual, permiten recrear gran variedad de entornos dif́ıciles de lograr en la vida real (Sabrie, 2004; Izaguirre, 2011). 1.2. Tipos de actuadores Como resultado del incremento en las aplicaciones de robots paralelos, numerosas variantes de dispositivos actuadores han sido desarrolladas con el propósito de adecuarse a los requerimientos técnicos de los diferentes sistemas. De esta manera, los actuadores se encargan de producir las fuerzas y/o torques para mover las estructuras mecánicas del robot según las órdenes dadas por la unidad de control. En la robótica, los más usados son clasificados de acuerdo a los siguientes criterios (Yañez, 2007): Según el tipo de movimiento generado se distinguen: los actuadores lineales, que desa- rrollan fuerza y movimiento de traslación en una misma dirección, y los actuadores de rotación, que desarrollan un par y generan un movimiento de rotación respecto al eje de torque. Según la naturaleza de la fuente primaria de enerǵıa se dispone de: actuadores neumáticos, que desarrollan su potencia a partir del fluido del aire comprimido; actuadores hidráuli- cos, cuya potencia se basa en el fluido hidráulico presurizado y, los más modernos, ac- tuadores eléctricos. Existen dos paradigmas de actuadores neumáticos, los cilindros neumáticos y los motores neumáticos. Los cilindros neumáticos pueden ser de simple efecto o doble efecto, en el primero el émbolo se desplaza en un sentido a causa del empuje de la presión de aire y en el otro sentido mediante la acción de un muelle que lo recupera a su posición de reposo. Para el segundo caso el aire mueve el émbolo en los dos sentidos. Los actuadores neumáticos de desplazamiento lineal constituyen una tecnoloǵıa que se ha venido acoplando en los robots paralelos que precisan de un posicionamiento continuo, probando ser una tecnoloǵıa barata, de respuesta rápida, elevada relación potencia-peso y fácil mantenimiento (Rubio, 2009b). El control de los actuadores neumáticos es un proceso sobradamente complejo en si mismo originado por efectos no lineales tales como la fricción Robótica Paralela y Algoritmos de control. 14 a bajas velocidades y la compresibilidad del aire. Sin embargo, por las ventajas antes mencionadas, esta tecnoloǵıa resulta una alternativa favorable, en tal caso se profundiza en el siguiente eṕıgrafe. Los actuadores hidráulicos de forma análoga a los neumáticos, se manifiestan del tipo cilindro y del tipo motores de aletas y pistones. Permiten el manejo de una fuerza conside- rable, sus aplicaciones se centran en el manejo de cientos de Newton-metros y la potencia de salida es de algunos Kilowatt (Krejnin, 2006). Puesto que utilizan fluidos poco com- presibles ofrecen una alta frecuencia natural y respuesta rápida, por ende resultan idóneos para aplicaciones que demanden grandes fuerzas y movimientos rápidos. Adicionalmente disponen de buena fiabilidad con bajos niveles de ruido, caracteŕısticas mecánicas simples y relativamente seguras durante la operación. Con todo, es de tener en cuenta para estos sistemas la contaminación que ocurre por el paso del fluido dentro de las superficies del actuador y que el goteo de sustancias como el aceite puede dañar estas superficies. Además es frecuente la aparición de retardos aśı como cambios en la viscosidad del aceite debido a variaciones en la temperatura. Estas afectaciones en la temperatura favorecen además la formación de burbujas que al combinarse con cambios en la presión del fluido permiten la aparición de la cavitación. 1.2.1. Actuadores neumáticos de desplazamiento lineal Muchos robots paralelos emplean actuadores neumáticos para generar el movimiento de los elementos de la estructura. La enerǵıa neumática que emplea aire comprimido como fuente de potencia posee cualidades excelentes, propias del elemento de base (Krejnin, 2006; Brun, 2000), entre estas cabe subrayar: El aire es abundante y barato Se transporta y almacena sin dificultad. Es limpio (no provoca contaminación) y carece del peligro de combustión o alteración con la temperatura. Robótica Paralela y Algoritmos de control. 15 A pesar de estas ventajas, es conveniente señalar que siendo el aire un fluido com- presible revela algunas desventajas, como pueden ser los movimientos no uniformes de los pistones cuando se realizan avances lentos con carga aplicada. El aire es una combinación de varios elementos; esta mezcla gaseosa antes de ser distribuida a los actuadores requiere de determinados procedimientos que se realizan por mediación de compresores y de estaciones de regulación y tratamiento del aire comprimido. Desde la automatización de bajo costo hasta aplicaciones de alta tecnoloǵıa, la neu- mática es siempre adaptable e innovadora y se ha ganado un papel mayor en los sistemas modernos de automatización. El control cinemático de un sistema neumático es una solu- ción alternativa para aplicaciones de posicionamiento industrial, que elimina la compleji- dad, costo y mantenimiento de motores y grandes suministros de enerǵıa asociados con los sistemas de control de movimiento convencionales, especialmente cuando se requiere largo trayecto y alta velocidad (Izaguirre, 2011). Como importante elemento motriz, el cilindro neumático es ampliamente utilizado en aplicaciones industriales para muchos propósitos de automatización gracias a su variedad de ventajas, como: simplicidad, limpieza, bajo costo, alta velocidad, alta razón potencia- peso y fácil mantenimiento. Tradicionalmente son usados para el movimiento entre dos puntos de parada. Sin embargo, nuevos requisitos en la habilidad y capacidad de los sistemas neumáticos están generándose con el advenimiento y expansión de la fabricación automatizada. Una de las tendencias notables es la necesidad del sistema neumático de lograr el seguimiento preciso del control de la posición. Persiguiendo este requisito, muchas investigaciones sobre sistemas neumáticos se han llevado a cabo (Krejnin, 2006). El posicionamiento continuo de las cargas, con actuadores lineales electro-neumáticos, ha resultado ser un complejo inconveniente para el control. Esto corresponde esencialmente a que la dinámica de los actuadores lineales electro-neumáticos es altamente no lineal debido a la compresibilidad del aire, el comportamiento no lineal del flujo de aire a través Robótica Paralela y Algoritmos de control. 16 de las válvulas y la existencia de elevadas fuerzas de fricción estáticas y dinámicas entre el cilindro y el pistón (Rubio, 2009b). Dado que el aire es compresible, el posicionamiento depende de la carga de trabajo. Por cuanto la precisión en trayectoria continua que podrá lograrse con este tipo de elementos será menor a la ganada por otros tipos de actuadores, salvo que se utilicen sensores de posicionamiento (Rubio, 2007b). Los cilindros neumáticos de simple efecto tienen una sola conexión de aire comprimido. Solo pueden realizar trabajos en un sentido; el vástago retrocede por el efecto de un muelle incorporado o de una fuerza externa. El resorte incorporado se calcula de manera que haga retornar el émbolo a su posición inicial a una velocidad suficientemente grande. En los cilindros de simple efecto con muelle insertado, la longitud de éste último limita la carrera. Por lo general, con estos cilindros se procura un posicionamiento en los extremos del mismo y no un posicionamiento continuo (Beater, 2007). En el caso de los cilindros de doble efecto la fuerza ejercida por el aire comprimido en ambas cámaras fuerza al émbolo a realizar un movimiento de traslación en los dos sentidos; se dispone de una fuerza útil en uno u otro sentido. Estos cilindros se aprovechan especialmente en los casos en que el émbolo tiene que ejecutar además alguna función en su movimiento de retorno a la posición inicial. En principio, la carrera de los cilindros no está limitada, pero hay que tener en cuenta el pandeo o deformación que puede experimen- tar el vástago cuando sale del cuerpo del cilindro. De igual forma, en esta circunstancia se prestan de empaquetadura los labios y émbolos de las membranas (Krejnin, 2006; Beater, 2007). 1.3. Control desacoplado Pese a que el control de robots paralelos ha sido abordado en numerosas investiga- ciones, aún persisten considerables dificultades. Estas se originan como resultado de que el mecanismo sea un sistema multi-cuerpo, no lineal, acoplado y con parámetros inerciales variables en el tiempo, esto principalmente debido a variaciones de la carga soportada. Robótica Paralela y Algoritmos de control. 17 En numerosas aplicaciones no siempre es admisible la suposición de asumir la arqui- tectura del robot como una serie de eslabones dinámicamente desacoplados. Considerando la presencia de interacciones dinámicas entre los actuadores, se recurre a estrategias para controlar el sistema pese a los efectos indeseables sobre el lazo de tales perturbaciones. El control desacoplado articular es utilizado con eficacia en robots paralelos fuerte- mente acoplados de hasta seis grados de libertad, reportándose en la literatura progresos en el desempeño del robot para aplicaciones de control de trayectoria, considerando el modelo dinámico de los actuadores del robot (Ogbobe, 2010; Yang, 2008). Los procedimientos de desacople dinámico imponen restricciones a la geometŕıa y limitaciones en la capacidad de carga del robot (Chen, 2004). De este modo, como v́ıa para eliminar o reducir los efectos indeseables del acople dinámico, se torna preferente contemplar la existencia real de las interacciones dinámicas y aśı diseñar un controlador asistido por un proceso de análisis de robustez para la aplicación en cuestión. Para el caso de aplicaciones con actuadores neumáticos, corresponde afrontar las im- plicaciones de la no linealidad, causante de movimientos no uniformes de los pistones cuando se realizan avances lentos con carga aplicada, y de los efectos indeseables en las cámaras del pistón provocados por la compresibilidad del aire. En este terreno se han desarrollado trabajos anteriores relacionados con identificación, modelado y control de- sacoplado de actuadores electro-neumáticos, alcanzándose resultados satisfactorios para la plataforma neumática de dos grados de libertad de aplicación industrial (Rubio, 2009a, 2007b). 1.4. Algoritmos de control en sistemas neumáticos El diseño de un controlador de posición estable y robusto para un sistema neumático es dif́ıcil dado que es una planta con desempeño no lineal debido a los factores antes mencionados. En tal sentido el control de actuadores neumáticos ha despertado un gran interés y motivación por parte de los investigadores, por lo que en los últimos años, diferen- tes tipos de estrategias y esquemas de control han sido estudiados e implementados para Robótica Paralela y Algoritmos de control. 18 gobernar estructuras robóticas paralelas. En la literatura cient́ıfica se reportan numerosos antecedentes de la investigación objetiva de sistemas neumáticos (Krejnin, 2006). 1.4.1. Estrategias de control convencional El controlador PID (Proporcional-Integral-Derivativo) ha sido usado en aplicaciones industriales por más de 70 años, por consiguiente es usualmente la primera opción. Por esta razón, numerosas estrategias de control intentan perfeccionar el desempeño del PID ajustando sus parámetros de sintońıa. Las primeras aplicaciones en tecnoloǵıa neumática pueden ser atribuidas a las investigaciones de Shearer en 1956, y continuadas por Vaughan, Burrows y Webb. Estos trabajos iniciales fueron desarrollados con controladores lineales de ganancia fija, los cuales se diseñaron en base a un modelo de función transferencial obtenida mediante la linealización del sistema alrededor de condiciones espećıficas de operación. Estos art́ıculos proporcionaron las bases para muchas de las investigaciones y desarrollo posteriores, y establecieron los principios fundamentales para la comprensión y control de sistemas neumáticos (Burrows, 1972). Figura 1–8: Algoritmo PID convencional. El algoritmo de control PID es el más popular de los controladores feedback usa- dos en la industria. Es un algoritmo de fácil implementación que puede proporcionar un excelente desempeño de control a pesar de las caracteŕısticas dinámicas variadas de la planta en cuestión. Es importante notar que el controlador PID de ganancia fija es un método muy efectivo en casos donde el modelo lineal presenta parámetros que no vaŕıan durante la operación. Por otro lado, la simplicidad del controlador pone limitaciones sobre Robótica Paralela y Algoritmos de control. 19 sus capacidades para proceder con problemas de control complejos, como los casos antes mencionados. Es dif́ıcil alcanzar el control de posición, velocidad y fuerza satisfactorio de un sistema neumático v́ıa control PID de ganancia fija a causa de las no linealidades in- herentes del actuador, tales como stick slip, zonas muertas y fricciones viscosas, estáticas y dinámicas (Krejnin, 2006). La literatura aborda que la respuesta de los sistemas neumáticos con algoritmos PID suele ser rápida por lo que resultan ser oscilatorias amortiguadas. Con el objetivo de resolver dicho problema se plantea el uso de un prefiltro a la entrada del sistema, con ello se garantiza una referencia suave. De esta forma, son evitadas oscilaciones en la salida y excesiva amplitud en la señal de mando que pudiera dañar la estructura mecánica del robot. Otros autores hacen uso del mismo brindando buenos resultados experimentales (Karpenko, 2006; Rubio, 2007a). El método de control lineal de ganancia fija cuenta con la asunción clave de un rango de operación pequeño para que el modelo lineal sea válido. Estos rangos de operación pueden involucrar la posición del cilindro, la presión del aire y la posición de la válvula. Cuando el rango de operación requerido es grande, el controlador lineal puede presentar un desempeño muy pobre o ser inestable, a causa de la limitación de la tolerancia del controlador lineal para los efectos adversos de las no linealidades. Consecuentemente, el desempeño de un controlador convencional depende totalmente del conocimiento de los parámetros del sistema. El complejo proceso de posicionamiento neumático tiene comportamientos no lineales y variantes en el tiempo, en consecuencia es dif́ıcil deducir e identificar un modelo dinámico apropiado para los controladores tradi- cionales. Recientemente, un número de investigaciones han sido dedicadas a modificar los algoritmos PID y que puedan ser utilizados en actuadores neumáticos en lazo cerrado (Kikuuwe, 2006; Van˜Damme, 2009). Finalmente se ha generalizado la ĺınea de tomar las estrategias convencionales basadas en PID como base para la comparación contra algún otro esquema del control. Robótica Paralela y Algoritmos de control. 20 1.4.2. Control adaptativo Si se puede identificar continuamente la función de transferencia de la planta, se pueden compensar las variaciones de la misma, simplemente variando los parámetros ajustables del control y por tanto, obtener un funcionamiento satisfactorio del sistema en forma continua bajo las diversas condiciones externas. Un método adaptativo es muy útil para enfrentar un problema en que la planta está normalmente expuesta a variaciones de sus parámetros de tiempo en tiempo. En lugar de diseñar el mecanismo de sintońıa o programación de ganancia del controlador anaĺıticamente y/o experimentalmente fuera de servicio, muchos trabajos se han enfocado en buscar un mecanismo de ajuste del contro- lador en estado activo, referido como control adaptativo. Figura 1–9: Algoritmo genérico de control adaptativo. Un sistema de control adaptativo es un sistema que continua y automáticamente mide las caracteŕısticas dinámicas de la planta (como la función de transferencia), las com- para con las caracteŕısticas dinámicas deseadas y usa la diferencia para variar parámetros ajustables del sistema (generalmente caracteŕısticas del controlador)(Slotine, 1991). Los sistemas de control adaptativos con ajuste de parámetros del controlador son usualmente empleados para mejorar el desempeño de control del sistema en el caso donde la dinámica cambia durante el funcionamiento. El control adaptativo es entonces la capacidad del sistema de modificar su propio funcionamiento para lograr el mejor modo posible de operación. Una definición general de control adaptativo implica que el sistema debe ser capaz de desempeñar las funciones siguientes: Robótica Paralela y Algoritmos de control. 21 Proporcionar información continua sobre el estado presente del sistema o identificar el proceso. (Identificación de las caracteŕısticas dinámicas de la planta) Comparar el desempeño del sistema presente con el deseado u óptimo y elaborar una decisión correctiva. (Toma de decisión basada en la identificación) Iniciar una modificación apropiada para conducir el sistema de control al estado óptimo. (Modificación o acción basada en la decisión tomada) Estos tres principios (identificación, decisión, y modificación) son inherentes a cualquier sistema adaptativo. En la práctica los métodos más representativos usados para el diseño del control adaptativo son: el control adaptativo por modelo de referencia y el regulador de auto-sintońıa. El control adaptativo por modelo de referencia, mostrado en la figura 1–11 fue origi- nalmente propuesto para resolver un problema en que las especificaciones de desempeño son dadas en términos de un modelo de referencia. Este modelo especifica como la salida del proceso debe responder idealmente a la señal de comando. El controlador adaptativo es entonces diseñado para forzar al sistema o planta a comportarse como un modelo de referencia propuesto. La salida del modelo es comparada con la salida del proceso, y la diferencia es usada para ajustar los parámetros del controlador de lazo cerrado. Una de las grandes ventajas de este método es que provee adaptaciones rápidas para entradas definidas. El principal problema es determinar el mecanismo de ajuste para obtener un sistema estable cuyo error sea cero. Otra desventaja es que presenta problemas para adap- tarse a procesos desconocidos o disturbios arbitrarios (Slotine, 1991; Krejnin, 2006). El esquema adaptativo discutido anteriormente es uno de los denominados métodos directos, en que las reglas de ajuste indican directamente como los parámetros del con- trolador deben ser actualizados. Un regulador de auto-sintońıa asume un modelo lineal para el proceso que esté siendo controlado (usualmente no lineal). Se emplea una ley de control feedback que contiene los coeficientes ajustables y los algoritmos de auto-sintońıa que cambian los coeficientes. T́ıpicamente contienen un lazo interno y otro externo. El interno consiste en un lazo ordinario y la planta, actuando sobre la salida de la planta por Robótica Paralela y Algoritmos de control. 22 Figura 1–10: Control Adaptativo por Modelo de Referencia(MRAC). la v́ıa convencional. El lazo externo ajusta los parámetros del controlador del lazo interno, consta de un estimador de parámetros recursivo combinado con un algoritmo de diseño de control. El estimador recursivo monitorea la salida de la planta y estima su dinámica por los valores de los parámetros en el modelo de la misma. Estos parámetros estiman el algoritmo de diseño de la ley de control que env́ıa nuevos coeficientes al controlador convencional en el lazo interno (Slotine, 1991; Krejnin, 2006). Figura 1–11: Control Adaptativo de auto-sintońıa. En muchos casos la literatura no ofrece una distinción clara entre estos controladores; esto es particularmente apreciable cuando estas técnicas se combinan con los métodos de Inteligencia Artificial. 1.4.3. Sistemas basados en redes neuronales Las redes neuronales artificiales (RNA) constituyen un área importante de la inteligen- cia artificial que ha despertado interés en los últimos años. Esto es debido a su capacidad Robótica Paralela y Algoritmos de control. 23 de resolver problemas cuya solución por otros métodos convencionales resulta dif́ıcil. Las redes neuronales son muy usadas en el control de posición para sistemas neumáticos (Kre- jnin, 2006). La cualidad más sobresaliente de las redes neuronales es que se basan en el sistema de aprendizaje del cerebro humano. En lugar de programar una red, se le presenta una serie de ejemplos, a partir de los cuales esa red aprende las relaciones fundamentales que están impĺıcitas en las bases de datos de entrenamiento. Puesto que estas relaciones pueden ser fuertemente no lineales las redes pueden constituir una herramienta general y potente para modelar la dinámica de plantas complejas. Por ello constituyen un excelente sistema para identificación de modelos entrada-salida y en la compensación de sistemas no lineales. La ciencia de redes neuronales artificiales está relacionada con la neurona. El modelo mostrado en la figura 1–12 representa un esquema de red neuronal basada en el fun- cionamiento del cerebro humano. Las entradas X0 − X3 representan las dendritas. Cada entrada es multiplicada por los pesos W0 −W3. La salida del modelo de la neurona, Y , se encuentra en función de F que es la sumatoria de las señales de entrada. Figura 1–12: Esquema de una red neuronal. Existen varios tipos de estructuras de RNA, entre las que se destacan las redes sim- ples y las multicapas. El esquema para el modelo de simple capa es el perceptrón. Las entradas al perceptrón son individualmente multiplicadas por los pesos y luego sumadas. Los perceptrones calculan la salida a través de la función de activación F , que introduce una no linealidad en la red. Esto las convierte en un algoritmo muy usado para representar dinámicas altamente no lineales. Robótica Paralela y Algoritmos de control. 24 En las redes multicapas la dirección de la señal va desde la entrada a la salida. Adicionando capas a la red neuronal este puede lidiar con procesos cuya dinámica es compleja y ser capaz de reproducir de manera fiable cualquier sistema. Pero ello implica que la implementación a nivel computacional del mismo sea extremadamente cara por tanto en ello se trata de llegar a un compromiso. El método más común para la identificación de sistemas a través de RNA es el lla- mado back-propagation, figura 1–13. Durante el entrenamiento son tomados los datos de entrada del proceso y aplicados sobre la red neuronal. Ambas salidas (proceso y red) son comparadas y el error es enviado a la red actualizando los pesos de la misma. Sin embar- go, a veces, con dicho método no se garantiza la convergencia de la solución y a veces se recurre a otros algoritmos más rápidos y fiables (Norgaard, 2000). Figura 1–13: Identificación por el método back-propagation. Muchas aplicaciones de redes neuronales pueden encontrarse en la literatura. Un es- quema de control basado en redes neuronales multicapas entrenadas mediante el algoritmo extendido múltiple de Kalman se propuso para el sistema de posicionamiento de un cilin- dro neumático. Los resultados experimentales mostraron que el método propuesto teńıa menos sensibilidad que la red neuronal entrenada por los sencillos algoritmos de descenso de pendiente (Song, 1997). Uno de los fenómenos que más afecta el desempeño de los sistemas neumáticos es el fenómeno de backlash en las servo-válvulas o zona muerta. Como solución a esta limitante se proponen estrategias que emplean la combinación de dos redes neuronales. La primera RNA es usada como estimador de zona muerta y la segunda como compensador. La primera Robótica Paralela y Algoritmos de control. 25 red evalúa el desempeño y permite lograr un ajuste sobre la segunda RNA. Esta última actúa sobre el control (Rastko, 2000). Intentando lograr un desempeño de control satisfactorio se presenta una técnica de control adaptativo por modelo de referencia con redes neuronales para un sistema electro- neumático (Tanaka, 1998). Poco después de este trabajo propuso un método de control adaptativo por modelo de referencia con redes neuronales tipo multi-rate para el control de posición de un cilindro neumático. El papel de la red neuronal es realizar la compensación de las no linealidades alcanzado buenos resultados (Tanaka, 1999). 1.4.4. Control basado en lógica borrosa En 1965 el Profesor Lotfi Zadeh introdujo la lógica borrosa proponiendo una v́ıa matemática de mirar la vaguedad intŕınseca del lenguaje humano, y desde ese momen- to varias aplicaciones exitosas, principalmente en control, han aparecido en la literatura (Reznik, 1997). Basado en que el razonamiento humano habitualmente recurre a variables que son vagas, Zadeh introdujo el concepto de variables lingǘısticas. Los valores de estas varia- bles son expresiones que describen una condición, como Alto, Pequeño, Grande, Cero, Pobre, Rico, Muy Largo. Estos valores lingǘısticos no son entidades independientes sino un conjunto de elementos que asumen diferentes grados de pertenencia en el conjunto, el cual es denominado conjunto borroso. En conjuntos convencionales un elemento pertenece al conjunto o no; en conjuntos borrosos, un elemento puede pertenecer completamente, parcialmente o no pertenecer al conjunto. Las técnicas borrosas han sido aplicadas al mundo industrializado (procesos y auto- matización) brindando un buen desempeño. Los resultados de este uso han demostrado que los sistemas borrosos presentan ventajas en comparación con algoritmos PID. Las ventajas principales de los borrosos son las siguientes (Sorli, 1999): No es necesario construir un modelo matemático detallado. Pueden funcionar con un gran número de entradas. Robótica Paralela y Algoritmos de control. 26 Pueden ser adaptados fácilmente en sistemas no lineales. El conocimiento humano puede ser aplicado fácilmente. La aplicación de control borroso a un sistema de posicionamiento neumático continuo fue desarrollada por Ferraresi en 1988, resultando particularmente ventajosa en términos de simplicidad de diseño e implementación (Moreno, 2000). La esencia del control fuzzy, o borroso, es que las reglas lingǘısticas apropiadas están elegidas, basados en usar un cierto procedimiento de toma de decisión, de una tabla de reglas construida basado en la experiencia y bases de datos del control humano. Las reglas borrosas son establecidas por ensayo y error con el concepto de simetŕıa. Estas caracteŕısticas hacen de la lógica borrosa una herramienta útil para enfrentar complejos problemas de control, donde las estrategias convencionales no trabajan muy bien, o simplemente fallan. 1.4.5. Control basado en modo deslizante Unas de las estrategias recomendadas para el control continuo de sistemas neumáticos es el control en modo deslizante por su robustez y el comportamiento ante fenómenos alta- mente no lineales. Consiste en forzar al estado del sistema a un comportamiento deseado, en este caso llevar la dinámica del sistema a una superficie deslizante. El Control en Modo Deslizante fue desarrollado originalmente por Utkin en 1977 para el control de manipu- ladores robóticos (Utkin, 1999; Krejnin, 2006). A principios de la década del ’80 los sistemas SMC fueron usados casi exclusivamente para controlar sistemas electro-mecánicos simples, como motores eléctricos . Estos trabajos fueron seguidos y usados exitosamente en un largo número de investigaciones en robótica (Sira-Ramirez, 1987) , en sistemas de control de vuelo y electrónica de potencia. Los SMC han mostrado robustez ante disturbios e incertidumbres en el modelo, aśı como simplicidad en el diseño (Van˜Damme, 2009). A pesar de las predicciones teóricas de extraordinario desempeño del sistema de lazo cerrado del modo deslizante, algunos trabajos experimentales indicaron limitaciones en la Robótica Paralela y Algoritmos de control. 27 práctica, debido a la aparición de conmutaciones a alta frecuencia en la acción de mando, referido como chattering (Kikuuwe, 2006; Fridman, 2002; Laghrouche, 2006). En la mayoŕıa de los trabajos experimentales que involucraron el modo deslizante, el esfuerzo consumido en comprender las bases teóricas de control fue generalmente minimiza- do, mientras un gran coste de enerǵıa fue destinada en técnicas emṕıricas para atenuar el chattering (Bartoszewicz, 2009). La implementación de lógica borrosa en modo deslizante a permitido atenuar la influencia del mismo (Abid, 2008; Babar, 2010). La combinación del control en modo deslizante y la lógica borrosa no es nueva, en la literatura existen muchas referencias de esta metodoloǵıa . Estas investigaciones se han enfocado en dos aspectos, unos han ensayado el uso de las reglas fuzzy para sintonizar SMC, otros el uso de reglas fuzzy para diseñar la superficie deslizante. En dichos trabajos, los resultados de simulación y la comparación de estos con los resultados de control en modo deslizante muestran las ventajas de aplicar la lógica borrosa en los métodos del control; entre ellas, el efecto del chattering fue minimizado a un grado insignificante (Abid, 2008, 2009; Dehghani, 2007). 1.5. Consideraciones finales del caṕıtulo Presentado el marco teórico y luego de un análisis cŕıtico de la bibliograf́ıa consultada, se arriban a las siguientes conclusiones: A pesar de las ventajas de los robots paralelos gobernados por cilindros neumáticos, las caracteŕısticas no lineales de dichos actuadores hacen necesario diseñar una estrategia de control robusta. Como resultado de la revisión bibliográfica realizada se pudo comprobar que las estrate- gias de control no convencionales más frecuentemente utilizadas en actuadores neumáticos son: Control Adaptativo, Control Inteligente (Redes Neuronales y Lógica Borrosa) y Con- trol Deslizante. Robótica Paralela y Algoritmos de control. 28 El control deslizante posibilita tratar de manera adecuada las no linealidades presentes en los actuadores. Sin embargo la presencia de conmutaciones de alta frecuencia en la señal de mando limitan su aplicación a sistemas neumáticos. Se han desarrollado numerosas alternativas que permitan la atenuación de este fenómeno a través de la combinación con otras técnicas. La estrategia de control en modo deslizante basada en lógica borrosa se presenta como una alternativa que ha sido exitosamente reportada en la literatura. Por todo lo anterior, en esta investigación se diseña un Controlador en Modo Deslizante basado en Lógica Borrosa para la plataforma SIMPRO. CAPÍTULO 2 CONTROL EN MODO DESLIZANTE Y LÓGICA BORROSA PARA PLATAFORMA NEUMÁTICA DE 2 GRADOS DE LIBERTAD En este caṕıtulo se establecen los parámetros técnicos que definen la plataforma SIM- PRO de 2 grados de libertad conformada por cilindros neumáticos. Se hace una descripción del sistema neumático permitiendo un acercamiento hacia los problemas a tratar. Se pre- senta la metodoloǵıa para el diseño de un controlador en modo deslizante. Las ecuaciones dinámicas que definen la estructura del control en modo deslizante que están determinadas por las no linealidades y las incertidumbres del sistema. Es descrita la metodoloǵıa de los sistemas borrosos y con ello las diferentes alternativas de implementación de control en modo deslizante basado en lógica borrosa. 2.1. Plataforma de 2 grados de libertad(2-GDL) El simulador de conducción de sello SIMPRO producido por CIDSIM es un robot paralelo de dos grados de libertad, ladeo y cabeceo, que permite por igual la simulación del comportamiento de veh́ıculos ligeros o pesados. La cabina de conducción cuenta con mandos reales que simulan el comportamiento del veh́ıculo al ser maniobrado por el con- ductor y un monitor que recrea el escenario virtual con que interacciona. Cada articulación está formada por un cilindro FESTO DNC B-100-320-PPV-A gobernado por una válvula proporcional de flujo FESTO MPYE-5-3/8-010-B. Esta plataforma presenta una estructura mecánica compuesta por cinco uniones esféri- cas y dos articulaciones prismáticas actuadas por pistones neumáticos de doble efecto. La 29 Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 30 cabina pivotea sobre una columna central mediante una articulación pasiva en cuyo ex- tremo superior se encuentra una unión universal. Los movimientos de la plataforma móvil se logran mediante la acción de los cilindros neumáticos, cuyos desplazamientos lineales le imprimen al efector final rotaciones sobre dos ejes perpendiculares entre śı. Estas rotaciones simulan las pendientes del mundo virtual las cuales son visualizadas en el monitor ubicado en la propia cabina. Figura 2–1: Plataforma de 2 GDL y su arquitectura geométrica En ambos extremos de las articulaciones prismáticas se encuentran uniones esféricas que le brindan la movilidad necesaria para lograr las orientaciones de la plataforma móvil superior, representado en la figura 2–1. La acción de cada uno de los actuadores tiene efecto sobre una sola articulación lo que permite que esta se comporte de forma desacoplada. Tabla 2–1: Datos mecánicos del simulador de conducción SIMPRO Descripción Parámetros Masa de la cabina 300 kg Ángulo de ladeo ±13o Ángulo de Cabeceo ±13o Elongación del pistón 320 mm Diámetro del cilindro 100 mm 2.1.1. Modelo dinámico del actuador neumático Se utilizan pistones neumáticos de doble efecto debido a que la fuerza ejercida por el aire comprimido empuja al vástago para realizar un movimiento de traslación en los dos sentidos, disponiéndose de una fuerza útil tanto en la ida como en el retorno del vástago; la elección se justifica debido a que los actuadores de la plataforma se mueven Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 31 de manera controlada en ambas direcciones. El modelo no lineal del actuador se divide en tres sub-sistemas para su análisis: 1. Modelo de la válvula: Contempla la dinámica del flujo de aire a través de la válvula en función de la acción de control y las presiones en sus extremos. 2. Modelo del actuador: Contempla la dinámica de las presiones en las cámaras del cilindro en función del flujo de aire y los volúmenes de las cámaras del cilindro, aśı como sus variaciones. Estos dos últimos parámetros quedan definidos por la posición y velocidad del émbolo (y, por tanto, de la carga) si se conoce el área de sus dos caras. 3. Modelo de la carga: Contempla la dinámica del movimiento de la carga en función de las presiones aplicadas a cada lado del émbolo y las fuerzas externas y de fricción que estén presentes en la estructura mecánica El aire es suministrado a una presión Ps que penetra a través de unos orificios de áreas Ae1 y Ae2 y sale a la atmósfera a través de una presión Pa. Además el aire penetra a las cámaras del cilindro a través de unos orificios que se consideran de salidas para la válvula. Estos son denominados As1 y As2. Las presiones con que los flujos de aire entran al cilindro P1 y P2 según la acción sobre el carrete actúan sobre las caras del émbolo perteneciente al cilindro y la fuerza resultante mueve al vástago del actuador a determinada posición. En la figura 2–2 se representa un gráfico donde están presentes las principales variables que definen al modelo matemático del actuador. Figura 2–2: Esquema de un sistema neumático. Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 32 Con el objetivo de implementar un control en modo deslizante para un sistema neumático se parte de una estimación lineal de la dinámica de la planta. En este ca- so, el modelo anaĺıtico del actuador lineal neumático, considera el dimensionamiento de la válvula y las constantes de tiempo del cilindro, de modo que describe con mayor exactitud la dinámica real del sistema (Burrows, 1972), definiéndose el modelo por la expresión: X(s) U(s) = A1 G1/C1 τ1 s+1 + A2 G2/C2 τ2 s+1 s ( M s + Fv + A1 K1x/C1 τ1 s+1 + A2 K2x/C2 τ2 s+1 ) (2.1) Donde las constantes de tiempo se calculan como: τ1 = K1p C1 ; τ2 = K2p C2 P1, P2: Presiones aplicadas en las cámaras de los cilindros (Pa) A1, A2: Área del pistón en cada cámara (m2) M : Masa (kg) Fv: Fricción viscosa (N s/m) X: Posición del vástago (m) Las constantes G1, G2 en (kg/sm2) y C1, C2 en (kg/sPa) se obtienen de las derivadas parciales de las ecuaciones que consideran el flujo másico de aire a través de la válvula proporcional de flujo: qm = f(x, Pent, Psal). Por su parte, las constantes K1p, K2p en (kg/Pa) y K1x, K2x en (kg/m) son obtenidas mediante diferenciación de la ecuación de estado de los gases ideales respecto a la presión y el volumen de aire, dependientes de la posición del pistón (Rubio, 2007b; Izaguirre, 2011). Es común en la literatura obtener una familia de modelos en función de la posición (Karpenko, 2006). En tal sentido, se identifica dinámicamente el sistema válvula-pistón de cada extremidad activa del robot, para lo cual se emplea el diagrama mostrado en la figura 2–3. Figura 2–3: Diagrama de bloques para la identificación dinámica del sistema neumático Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 33 El modelo obtenido de acuerdo al planteamiento anterior es de tercer orden tipo 1 (Valdivia, 2012) por lo que para los pistones la relación transferencial obtenida se muestra en la ecuación 2.2: X(s) U(s) = 4744 s (s2 + 1,66s + 55,38) (2.2) La función transferencial representado de un modo general es: X U = Kw2 n s(s2 + 2ϕwns + w2 n) (2.3) Se puede aplicar una transformación equivalente: X U = b0 s(s2 + a1s + a0) (2.4) Donde: b0 = Kw2 n = 4744 a0 = w2 n = 55,38 a1 = 2ϕwn = 1,66 La representación en el espacio-estado es:       ẋ1 ẋ2 ẋ3       =       0 1 0 0 0 1 0 −a0 −a1             x1 x2 x3       +       0 0 b0       u (2.5) Se asume que: f(x, t) = −a1x3 − a0x2 b(x, t) = b0 Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 34 2.2. Control en Modo Deslizante El comportamiento no lineal de los sistemas mecánicos puede introducir efectos ne- gativos en la operación de la planta. El Control en Modo Deslizante (SMC) se caracteriza por su robustez frente a tales efectos. Este apartado muestra los criterios y fundamentos más importantes de dicha estrategia. El control por modo deslizante se basa en la teoŕıa de los controladores de estructura variable, en la cual el controlador está compuesto por distintos subcontroladores y un esquema lógico de conmutación entre ellos (Rubio, 2007a). El propósito de la ley de control en modo deslizante radica en conducir un sistema no lineal a un estado deseado dentro de una superficie espećıfica representada en el plano-fase y mantener el estado de la planta en esa superficie por todo el tiempo subsiguiente, la cual es denominada superficie deslizante. De ah́ı se desprende el concepto de control de estructura variable (VSC), ya que el sistema es gobernado mediante la conmutación. En otras palabras, si el sistema se encuentra encima o debajo de la superficie deslizante el algoritmo de control conmuta con el objetivo de mantener a la dinámica del sistema en la vecindad de dicha superficie. Cuando el estado del sistema está sobre la superficie, el esquema de control tiene una ganancia determinada y en caso contrario la ganancia tendrá un valor diferente. Ideal- mente, una vez interceptada la superficie, el control en modo deslizante mantiene el esta- do de la planta sobre la misma para todo el tiempo subsiguiente. Por tanto los esfuerzos deben centrarse en diseñar un control en modo deslizante que conduzca a la planta a la superficie deslizante y la mantenga sobre la misma. El diseño de un Controlador Deslizante consta de tres etapas fundamentales. Primero se define la superficie deslizante, la segunda etapa consiste en el diseño de la ley de control para sostener la trayectoria del sistema en la superficie deslizante y el tercer paso y más importante es la implementación libre de chattering (Bartoszewicz, 2009). Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 35 En esta sección se desarrolla el control en modo deslizante para el sistema de tercer orden descrito por las ecuaciones siguientes: ẋ1 = x2 (2.6) ẋ2 = x3 (2.7) ẋ3 = f(x, t) + b(x, t)u(t) + d(t) (2.8) Donde x1, x2, x3 son variables de estado del sistema y x(t) = [x1(t) x2(t) x3(t)] T es el vector de estado, u(t) es la entrada de control. Por su parte f(x, t) y b(x, t) son generalmen- te funciones dependientes del estado y del tiempo. La función f(x, t) agrupa los términos no lineales y que son complejos de modelar y b(x, t) está integrada por parámetros del modelo del sistema que son poco conocidos. El término d(t) agrupa las perturbaciones que afectan al sistema (Babar, 2010). El problema de control consiste en que el estado del sistema (x) siga un estado es- pećıfico y variable en el tiempo (xd(t)) independientemente de las imprecisiones y no linealidades del modelo (b(x, t), f(x, t)). La ecuación 2.9 define matemáticamente la estructura de la superficie deslizante s(x, t). s(x, t) = ( d dt + λ)n−1e (2.9) Donde λ es una constante positiva que se selecciona a partir del desempeño del sis- tema en cuanto a velocidad de respuesta se refiere, n es el orden del sistema y e(t) = [e1(t) e2(t) e3(t)] T = xd(t) − x(t) es el vector de errores de la salida del sistema, siendo xd(t) = [xd1(t) xd2(t) xd3(t)] T el estado deseado. Para aquellos sistemas con representación dinámica de segundo orden, se obtiene la ecuación 2.10 que define la superficie como una función de primer orden, entonces s(x, t) Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 36 es simplemente la suma del error de posición y el error de velocidad. s(x, t) = e2 + λe1 (2.10) Cuando el sistema de 2.10 se encuentra sobre la superficie deslizante el error disminuye exponencialmente y el valor que toma la función e(x, t) = 0 de forma que la ecuación 2.11: e2 = −λe1 (2.11) Cuya solución es: e1 = e1,0e −λt (2.12) De esta manera, la superficie deslizante constituye una ĺınea recta de pendiente λ por lo que el comportamiento del sistema, una vez alcanzada la superficie deslizante, será similar al de un sistema de primer orden (Slotine, 1991; Van˜Damme, 2009). La variable e1,0 representa el error inicial, el tiempo en que el sistema alcance la superficie deslizante es equivalente a 1 λ de alĺı se deduce que la rapidez del sistema depende de la pendiente λ. Si el sistema es de tercer orden queda la expresión de la siguiente manera: s(x, t) = e3 + 2λe2 + λ2e1 (2.13) Donde: e1 Error de posición e2 Error de velocidad e3 Error de aceleración La ley de control a diseñar tiene como propósito lograr que el sistema sea estable lo que se consigue asegurando la convergencia de s(x, t) a cero. Para lograr este objetivo se aplica el criterio de estabilidad de Lyapunov. El método de estabilidad de Lyapunov es usualmente utilizado para determinar las propiedades de estabilidad de un punto de equilibrio sin solucionar la ecuación de estado. Se parte de considerar a V (x) como una Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 37 función escalar diferenciable definida en un dominio D que contiene el origen. El método de Lyapunov plantea que la función V (x) es definida positiva si V (0) = 0 y V (x) > 0 para todo valor de x. V (x) es definida negativa si V (0) = 0 y V (x) < 0 para todo valor de x (Slotine, 1991). En este caso se selecciona la función V = 1 2 s2 debido a que es definida positiva y su derivada es definida negativa(Utkin, 1999). Si se deriva la función candidata con respecto a la superficie deslizante s(x, t) definida en la ecuación 2.13 es posible obtener una expresión para la ley de control que se debe diseñar, asegurándose la estabilidad del sistema. sṡ ≤ −F |s| (2.14) Donde F representa una constante positiva. La expresión 2.14 puede ser planteada como: sgn(s)ṡ ≤ −F (2.15) De esta manera se asegura que las trayectorias en un plano fase apunten hacia la superficie s(x, t), y una vez dentro de la superficie, las trayectorias del sistema permanezcan sobre la misma, tal como se muestra en la figura 2–4. Adicionalmente, esto implica que Figura 2–4: Efecto del control en modo deslizante sobre la trayectoria de un sistema de segundo orden representado en el plano-fase. algunas perturbaciones o incertidumbres dinámicas puedan ser toleradas siempre y cuando la superficie no sufra variación. Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 38 En resumen, la idea es utilizar una función conocida para s(x, t) acorde a 2.10, y en- tonces seleccionar la ley de control U(t) en 2.8 de manera tal que el sistema en lazo cerrado mantenga el comportamiento definido por la superficie deslizante seleccionada, a pesar de la presencia de imprecisiones que contenga el modelo y el efecto de las perturbaciones. 2.2.1. Diseño del controlador La señal de mando u(t) del control en modo deslizante está integrada por dos partes: u(t) = ueq(t) + us(t) (2.16) ueq(t): Mando compensado, tiene como función cancelar las no linealidades y los parámetros con incertidumbres del modelo. us(t): Mando discontinuo, asegura la robustez del sistema. La ley de control ueq(t) se implementa para cumplir con la condición deslizante ex- presada por la ecuación 2.20. El término discontinuo us(t) se justifica debido a que la implementación de la conmutación de control es imperfecta, lo que conduce al chattering. El chattering es indeseable en la práctica puesto que provoca una alta acción de control que estará afectada por términos dinámicos de alta frecuencia que no se hayan tenido en cuenta en el modelado (Utkin, 1999). De acuerdo con la ecuación 2.8 el término f(x, t) es no lineal y variable en el tiempo y una vez estimado a partir del modelo se puede expresar como f̂(x, t). El error que se produce debido a la estimación de f(x, t) está dado por: ∣ ∣ ∣ f̂(x, t) − f(x, t) ∣ ∣ ∣ ≤ G(x, t) Siendo G(x, t) una función conocida. Por su parte el término b(x, t) puede variar dentro de un rango determinado por: 0 ≤ bmı́n(x, t) ≤ b(x, t) ≤ bmáx(x, t) Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 39 De ah́ı que b(x, t) puede ser estimado con un nivel de exactitud razonable utilizando solo los valores mı́nimos y máximos del mismo (Slotine, 1991). b̂(x, t) = √ bmı́n(x, t)bmáx(x, t) La derivada de la superficie deslizante definida por la ecuación 2.13 en función del error está dada por: ṡ(x, t) = ė3 + 2λė2 + λ2ė1 (2.17) Luego: ṡ(x, t) = ẋd3 − ẋ3 + 2λe3 + λ2e2 (2.18) Al sustituir la ecuación 2.18 en la ecuación 2.15 se llega a la siguiente expresión: sgn(s)(ẋd3 − ẋd3 + 2λe3 + λ2e2) ≤ −F (2.19) Teniendo en cuenta que la ecuación 2.8 define la dinámica de un sistema de tercer orden, es posible reescribir la expresión anterior a partir de los términos estimados que definen a ẋ3 como: sgn(s)(f(x, t) + b(x, t)u(t) − ẋd3 − 2λe3 − λ2e2) ≥ F (2.20) Esta expresión constituye la condición deslizante que debe cumplirse para asegurar el desempeño adecuado del sistema. La ecuación para el mando compensado de un control deslizante, encargado de cancelar las no linealidades e incertidumbres de un sistema de tercer orden, se obtiene a partir de la ecuación 2.20 y se define como: ueq(t) = 1 b̂(x, t) (−f̂(x, t) + ẋd3 + 2λe3 + λ2e2) (2.21) Para asegurar que la condición deslizante, expresada por la ecuación 2.20, se cumpla en todo momento es necesario implementar una ley de control que cumpla con la siguiente Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 40 estructura (Slotine, 1991): u(t) = ueq(t) + K(x, t)sgn(s) (2.22) Donde K(x, t) se selecciona tal que: K(x, t) = G(x, t) + F Por su parte el término discontinuo sgn(x) se define como: sgn(x)            1 para x > 0 ∈ [−1, 1] para x = 0 −1 para x < 0 La ley de control expresada por la ecuación 2.22 asegura que la trayectoria del sistema alcance en un tiempo finito la superficie deslizante s(x, t), asegurando que los errores tiendan exponencialmente a cero. Un esquema de control en modo deslizante puede ser aproximado al presentado en la figura 2–5 Figura 2–5: Diagrama a bloques de un lazo de control ideal en modos deslizantes. Un controlador discontinuo obliga a la señal de salida x(t) de la planta que siga a la trayectoria de referencia xd(t). 2.2.2. Robustez del control en modo deslizante La puesta a punto del control en modo deslizante se basa en la estimación de pa- rámetros pertenecientes al modelo matemático del sistema. Sin embargo los parámetros estimados nunca van a corresponder a los modelos propios de la planta real. Dado el sistema de tercer orden y basados en los eṕıgrafes 2.2 y 2.2.1 se tiene que la superficie deslizante s(x, t), su derivada ṡ(x, t) y la ley de control para un sistema de tercer orden son equivalentes a: s(x, t) = e3 + 2λe2 + λ2e1 (2.23) Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 41 ṡ(x, t) = ẋd3 − (f(x, t) + b(x, t)u(t)) + 2λe3 + λ2e2 (2.24) u(t) = 1 b̂(x) (−f̂ (x) + ẋd3(t) + 2λe3 + λ2e2 + Ksgn(s)) (2.25) Al sustituir 2.25 en 2.24 se tiene: ṡ(x) = ẋd3−(f(x)+b(x)( 1 b̂(x) (−f̂(x)+ẋd3+2λe3+λ2e2+Ksgn(s))))+2λe3+λ2e2 (2.26) ṡ(x) = ẋd3(1− b(x) b̂(x) )+( b(x) b̂(x) f̂(x)−f(x))+2λe3(1− b(x) b̂(x) )+λ2e2(1− b(x) b̂(x) )− b(x) b̂(x) Ksgn(s) (2.27) ṡ(x) = ∆ẋd3 + ∆f(x) + ∆e3 + ∆e2 − b(x) b̂(x) Ksgn(s) (2.28) Donde ∆ẋd3 = ẋd3(1 − b(x) b̂(x) ), ∆f(x) = b(x) b̂(x) f̂(x) − f(x), ∆e3 = 2λe3(1 − b(x) b̂(x) ), ∆e2 = λ2e2(1 − b(x) b̂(x) ). Asumiendo que b(x), ∆f(x), λ, y K son positivas. De forma tal que: b(x) b̂(x) Ksgn(s) > ∆ẋd3 + ∆f(x) + ∆e3 + ∆e2 (2.29) De esta forma ṡ(x, t) siempre presenta signo opuesto con respecto a s(x, t). Al obedecer el teorema de Liapunov la dinámica del sistema converge hacia la superficie deslizante. Si la ganancia de robustez del algoritmo de control es lo suficientemente alta las incertidum- bres de los parámetros se hacen despreciables y el sistema presenta un comportamiento deseable. De esta forma el SMC constituye una estrategia de control robusta ante incer- tidumbres en los parámetros del modelo, lo cual representa su principal ventaja (Slotine, 1991; Van˜Damme, 2009). 2.2.3. Chattering A diferencia de los sistemas de control continuo, un controlador discontinuo excita la dinámica no prevista en el modelo, obteniendo por resultado oscilaciones en el vector de estado. Este problema se conoce como chattering en la literatura de control. Estas oscila- ciones de frecuencia y amplitud finita dan por resultado una baja precisión en el control, alta disipación de potencia en los circuitos conmutadores y desgaste en los componentes Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 42 mecánicos (Utkin, 1999; Bartoszewicz, 2009). En la figura 2–6 se muestra la representación de la trayectoria de un sistema afectado por el fenómeno del chattering. Figura 2–6: Representación del efecto de chattering, resultado de la acción del control deslizante. Resolver el problema del chattering es importante cuando se busca explotar al máximo los beneficios de los modos deslizantes en el control de sistemas reales, dado que sin un manejo adecuado del mismo este puede transformarse en el mayor obstáculo para la implementación (Utkin, 1999). La eliminación de chattering puede lograrse introduciendo una capa ĺımite que con- tiene la superficie deslizante. La introducción de la capa ĺımite es equivalente al reemplazo de la ley de control por una función de saturación como: us(t)      s φ , para |s| ≤ 1 sgn(s) para |s| > 1 Donde φ representa una constante positiva. Sin embargo la ley del control expresada anteriormente no garantiza la convergencia del error a cero, ni el desempeño adecuado en su implementación real. Es por eso que tomando la idea anterior como base los sistemas deslizantes han combinado las técnicas borrosas con el objetivo de proveer estabilidad a los controladores en modo deslizante. Esta combinación de los dos principios es lo que es conocido como Control en Modo Deslizante basado en Lógica Borrosa(FSMC) representando este una alternativa para el diseño de algoritmos para sistemas no lineales con incertidumbres (Kim, 1995). Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 43 2.3. Lógica Difusa: Conceptos básicos de conjuntos difusos A diferencia del álgebra de Boole clásica, en la cual la propiedad de un ente de pertenecer a un conjunto espećıfico sólo puede tomar dos valores (falso, verdadero) a los que se les asigna por convenio los valores extremos 0 y 1, los conjuntos borrosos son aquellos en los que se permite el grado de pertenencia parcial de los elementos que los forman, aśı como la descripción de conceptos en los cuales los ĺımites entre poseer una propiedad y no poseerla no son claros. La lógica difusa es considerada un sistema lógico dirigido a proporcionar un modelo para los modos de razonamiento humano, los cuales son más aproximados que exactos. (La mayoŕıa del razonamiento humano, en particular el sentido común, es aśı.) En la teoŕıa de los conjuntos difusos todo es una cuestión de grados, o todo tiene elasticidad. Está dirigida a tratar con fenómenos complejos que no pueden ser analizados mediante métodos clásicos basados en la lógica bivalente o la teoŕıa de probabilidades. Para un conjunto clásico, cualquier elemento del universo, o bien pertenece al conjunto o no pertenece. Para el caso de conjuntos difusos, un elemento del universo puede pertenecer a uno o más conjuntos con distintos grados de pertenencia. Universo de discurso U: Determina la gama de valores que pueden tomar los elementos que poseen la propiedad expresada por la variable lingǘıstica. Etiquetas: Son las diferentes clasificaciones que se efectúan sobre la variable lingǘısti- ca. Cada etiqueta tendrá un conjunto difuso asociado. Función de pertenencia o membreśıa u(x): Es una relación que asocia cada elemento en un conjunto con su grado de pertenencia al mismo (un número real en el intervalo [0, 1]). Puede expresarse como un grupo de valores discretos o como una función continua. Soporte: Proporciona el rango de definición de la función de pertenencia. Es una manera de restringir el universo de discurso para cada etiqueta. Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 44 Figura 2–7: Forma t́ıpica de funciones de pertenencia: 1-triangular, 2-trapezoidal, 3- gaussiana, 4-campana generalizada, 5-singleton. Las expresiones matemáticas correspondientes a las funciones de membreśıa más co- munes pueden encontrarse en el Anexo A. Los conjuntos y operadores borrosos no son más que el sujeto y el verbo de esta lógica, empleados en las llamadas condiciones de tipo IF (expresión) THEN (relación, conclusión), como una manera de emular la toma de decisiones de un experto. Una forma de conformar estas reglas seŕıa: if x is A then y is B, donde A y B son valores lingǘısticos definidos por los conjuntos dentro del universo de entrada X y salida Y . La parte if x is A de la regla es llamada premisa o antecedente mientras que la parte then y is B es llamada consecuencia o conclusión (Reznik, 1997). 2.3.1. Controladores borrosos La teoŕıa de control convencional se basa en la utilización de modelos matemáticos (anaĺıticos) expĺıcitos del proceso que será controlado y las especificaciones del compor- tamiento deseado en lazo cerrado para diseñar el controlador. Este enfoque puede fallar si el modelo del proceso es: Dif́ıcil de obtener Parcialmente desconocido Altamente no lineal El sistema de inferencia es considerado como el corazón de cualquier controlador bo- rroso en cuestión. La inferencia borrosa no es más que el proceso de formular la asignación Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 45 de una entrada a una salida usando la lógica borrosa. Este proceso involucra a todas las piezas, conceptos a los que se hicieron alusión anteriormente: funciones de membreśıa, reglas (If − Then) y operadores lógicos. Se distinguen dos clases de sistemas basados en reglas borrosas, de acuerdo con la forma de las reglas y del tipo de entradas y salidas (Babuska, 2001): Controladores Mamdani, usualmente usado directamente como controlador en lazo-ce- rrado. Controladores Takagi-Sugeno, t́ıpicamente usados como un controlador supervisor. El controlador borroso se compone de tres etapas: 1. Borrosificación de las Variables de Entrada: a cada variable de entrada se le asigna su valor de pertenencia correspondiente con cada conjunto del universo de discurso. 2. Inferencia Basada en Reglas: el controlador aplica el mecanismo de inferencia a la in- formación de entrada y proporciona una conclusión difusa que determina los grados de pertenencia a los conjuntos difusos de salida. 3. Desborrosificación de la Variable de Salida: mediante métodos matemáticos se obtiene un valor concreto de la variable de salida, o sea, el resultado. Figura 2–8: Esquema de control borroso. Existen muchas estrategias que pueden ser usadas para convertir las conclusiones del mecanismo de inferencia a un valor comprensible para el proceso. El método de desbo- rrosificación de Centro de Gravedad (llamado también método de Centroide o Centro del Área) es el más recurrido; mostrado en la ecuación 2.30. Consiste en calcular el centro de área del conjunto difuso resultante; en su versión exacta puede resultar excesivamente Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 46 costoso desde el punto de vista de cómputo para su realización en tiempo real, ya que implica el cálculo de integrales de figuras eventualmente irregulares. COG : ycrisp q = ∑R i=1 ci q ∫ µAi q (yd)dyq ∑ ∫ µAi q (yd)dyq (2.30) Donde R es el número total de reglas de control, yq es el grado de pertenencia a la función µA para la entrada A y regla i, ci q señala el valor central de yq en la región de salida de la regla i. El método de Promedio de los Centros representa el promedio ponderado de los centros de las funciones de pertenencia implicadas para la salida. CA : ycrisp q = ∑R i=1 ci qsupyp µAi q (yd)dyq ∑ supyp µAi q (yd)dyq (2.31) Donde supyp representa la altura de la función de pertenencia en ese centro. Los pasos para el diseño de un sistema de control difuso simple son: 1. Identificar las variables (entradas, estados, y salidas) de la planta. 2. Particionar el universo de discurso para cada variable en conjuntos difusos, asignando a cada uno una etiqueta lingǘıstica. 3. Asignar o determinar una función de membreśıa para cada conjunto difuso. 4. Asignar la relación difusa entre los conjuntos difusos de las entradas o estados y los conjuntos difusos de salida, lo que constituye la base de reglas. 5. Fusificar las entradas al controlador. 6. Inferir la salida contribuida por cada regla. 7. Agregar la salida difusa recomendada por cada regla. 8. Aplicar la desfusificación para formar la salida precisa. 2.4. Control Deslizante basado en Lógica Borrosa La lógica borrosa se combina con el control en modo deslizante para reducir el efec- to de chattering y mejorar la precisión en el seguimiento de la trayectoria aśı como la robustez del controlador. Esto se justifica debido a que el Control de Lógica Borrosa es Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 47 una ley del control no convencional y robusta, conveniente para sistemas complejos o no lineales caracterizados por fluctuación en sus parámetros o incertidumbres. Cabe destacar entre las ventajas del FSMC, que no está directamente ligado al modelo matemático del sistema como el caso del SMC, asegura la estabilidad y reduce el número de reglas bo- rrosas (Abdelsalam, 2012). Entre los métodos más generalizados se propone la sustitución del término discontinuo por un bloque de lógica borrosa que toma como entrada el valor del componente s de la ley de control deslizante y como salida el componente discontinuo us. La estabilidad de este sistema es garantizado por la teoŕıa de Lyapunov. La figura 2–9 muestra que el Controlador Borroso es una extensión de un Control Deslizante con una capa ĺımite(Aissaoui, 2009). Figura 2–9: Esquema de control FSMC con la sustitución del elemento discontinuo. u(t) = ueq(t) + us(t) = ueq(t) + uf(t) (2.32) uf(t) = FSMC(s(t)) (2.33) Este sistema provee buen desempeño y rechazo a perturbaciones, logra el seguimiento de la trayectoria deseada con precisión y una respuesta dinámica rápida, sobreamortiguada y con cero error en estado estable (Aissaoui, 2009). Si el esquema adopta dos entradas, el valor de la función de superficie deslizante s(x, t) y su derivada, como se muestra en la ecuación 2.34, aumenta la precisión en el seguimiento de la trayectoria y se acelera la velocidad de respuesta. Mediante una amplia base de reglas heuŕısticas un controlador de lógica borrosa puede cubrir satisfactoriamente con incertidumbres severas, aunque el número elevado de reglas borrosas, dado por la Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 48 ecuación 2.35, hace complejo el análisis y surge una pesada carga computacional en algunas aplicaciones (Babar, 2010; Amer, 2012). El esquema se muestra en la figura 2–10. Figura 2–10: Esquema de control FSMC teniendo en cuenta la derivada de la superficie deslizante. uf(t) = FSMC(s(t), ṡ(t)) (2.34) Rt = lin1 ∗ lin2 ∗ (...)link (2.35) Donde Rt representa el total de reglas, y l es el número de etiquetas lingǘısticas de cada entrada. Otros autores prefieren tomar como entradas para el controlador borroso del esquema anterior el error de posición y su derivada, debido a que el rango de valores de estos es más pequeño y su variación más suave. Incluso se han desarrollado estrategias más complejas en aras de potenciar la robustez como el diseño de Controladores Borrosos Supervisores para sintonizar dinámicamente parámetros como la Ganancia del control y el valor de λ, pendiente de la superficie deslizante (Amer, 2012). El esquema se muestra en la figura 2–11. Los principales inconvenientes de este planteamiento son, por un lado la maldición de la dimensionalidad, el número de reglas crece geométricamente con el número de variables, Control en modo deslizante y lógica borrosa para plataforma neumática de 2 grados de libertad 49 Figura 2–11: Esquema de control FSMC teniendo en cuenta la sintonización de λ. y por otro lado aumenta el número de procesos de inferencia que deben ser calculados simultáneamente. Debido a las limitaciones de los esquemas antes planteados, en este trabajo se propone desarrollar un sistema de inferencia borroso que sustituya no solo a la función signo de la ley de control sino también al control equivalente. El esquema propuesto según la figura 2–12, no necesita el modelo matemático del sistema por lo que es relativamente fácil de diseñar. Esta decisión se fundamenta porque cuando el modelo matemático del proceso no existe, o existe pero con incertidumbres, la lógica borrosa es un modo alternativo eficaz para tratar con dinámicas desconocidas. De esta manera una vez definida