INTRODUCCIÓ A TÈCNIQUES DE CONTROL INTEL.LIGENT
Nota: Les tècniques de control intel·ligent que es descriuen a continuació son tècniques que encara no tenen les bases consolidades, ja que es troben en plena fase d’investigació. Per aquest motiu poden existir divergències de termes i conceptes entre textos de diferents autors. Jo he intentat extreure el que crec que és comú a varis autors.
1. Introducció a les Arquitectures Reactives
L’objectiu de les arquitectures reactives es descomposar problemes jeràrquics en nivells de competència horitzontals. Es van construint nivells del control per cada un dels nivells de competència, afegint noves capes a les existents.
Per exemple, podem fer que el nivell 0 únicament es dediqui a la supervivència del robot en l’entorn, de manera que quan els sensors detectin un obstacle a prop, el robot reaccioni evitant-lo.
El nivell 1 podria ser una capa de control amb l’objectiu de vagar lliurement per l’entorn sense destí definit. El nivell 2 podria dedicar-se a la tasca de dirigir-se a un objectiu pre-definit., etc.
La arquitectura reactiva permet anar afegint capes, de manera que vagin augmentant les prestacions del robot.
El control del robot esta estratificat, de manera que quan les circumstancies o events de l’entorn ho requereixin, un nivell inferior pot agafar el control.
Una característica important d’aquesta arquitectura es que podem tallar el sistema per qualsevol nivell i automàticament els nivells inferiors formen un sistema operatiu complert, que pot funcionar autònomament.
La finalitat de la arquitectura reactiva es tindre una ràpida resposta davant d’un event. Es pot fer una analogia amb els reflexes dels animals. A diferencia de la arquitectura planificadora tradicional que qualsevol operació consumeix una quantitat considerable de temps, la arquitectura reactiva disposa de connexions mes directes entre els sensors i els actuadors, fent mes ràpida la reacció.
2. Introducció a la Computació Evolutiva
Per no induir a errors, les definicions tècniques no les traduiré de l’anglès.
La Evolutionary Computing (EC) engloba una sèrie de tècniques:
A continuació s’en descriuen breument algunes d’aquestes tècniques,
2 .1 Classifier System (CS)
Els Classifier System son sistemes que contenen una base de regles dinàmica, de la forma:
{Pes Regla, Condició->Acció}
Quan el sistema detecta que es compleix la Condició o antecedent, reacciona i executa la Acció o conseqüent. Els Pes Regla indica la "veracitat" de la regla. Com ja s’ha dit, la base de regles és dinàmica, hi ha un sub-sistema dedicat a afegir regles, modificar el pes, etc. depenent de la evolució del sistema.
Els algorismes genètics estan inspirats en el principi Darwinia de reproducció i supervivència del millors individus d’una població, i operacions genètiques com la mutació.
Els GA son un algorismes robustos que permeten optimitzar una funció, obtenint resultats propers a la millor solució.
Imitant la natura, es parteix d’una població d’individus o cromosomes, on cada individu es una possible solució al problema. Successives generacions aniran produint noves solucions.
La fitness function o funció objectiu realitza el paper de l’entorn. Cada individu és avaluat d’acord amb aquesta funció. Cada nova generació es formada per la selecció dels millors individus de la població, als quals s’els aplicarà els operadors genètics de selecció, creuament i mutació. Això forçarà una diversitat d’individus que serà útil per trobar una bona solució amb els GA.
En un cromosoma es troben codificades les característiques de l’individu, el fenotip és el valor del paràmetre i el genotip és l’string de 1 i 0 del cromosoma.
Algunes consideracions generals sobre els GA comunament acceptades:
Operador Selecció
Hi ha diferents operadors de selecció. Alguns d’ells son:
Proporcional:
(Holland 75) Aquest operador tria els individus proporcionalment al valor de la funció fitness:

on p es la probabilitat de l’individu de la t generació de ser escollit.
Aquest sistema te un problema, ja que en poques generacions el promig del fitness convergeix cap el millor individu, estabilitzant-se en una zona-vall.
Per solucionar aquest problema es pot utilitzar alternatives com un escalat de valors de fitness, o be la selecció de la roda de ruleta (De Jong 75), i d’altres…
Ranking lineal (Barker 85) :
Esta basat en la noció de ranking, així, ordenant la població del millor al pitjor individu, la probabilitat de selecció son valors constants:
![]()
On l és el numero d’individus en una generació i h min=2-h max, (1<=h max<=2)
Barker suggereix un màxim de h max = 1.1
Estratègia elitista
Esta basada en copiar els millors individus de cada generació en la següent, sense creuar ni mutar.
Operador Creuament
Aleatòriament tria un parell d’indivus prèviament seleccionats i intercanvia material genètic o sub-cadenes de bits entre ells dos, per formar descendents. Hi ha diferents tipus d’operadors de creuament.
Operador Mutació
Aquest operador s’utilitza desprès de aplicar l’operador creuament per incrementar la diversitat. La mutació consisteix en canviar aleatòriament bits del cromosoma de 0 a 1 i de 1 a 0. La probabilitat de mutació ha d’estar d’acord amb el tipus de codificació (coma flotant, codi gray, logarítmic, etc.)
La Programació Genètica (GP) és un derivat dels Algorismes Genètics (GA). L’objectiu dels GP es obtenir una funció o algorisme que millor resolgui alguna tasca, en contrast, els GA amb prou feines obtenen alguna combinació òptima de variables.
Per utilitzar la GP per desenvolupar un programa (un individu), s’han de proporcionar dues coses: una "sopa" de blocs funcions amb la que es construiran els individus, i un procediment especial que avalua la aptitud de l’individu, típicament executant-lo per veure que fa.
Donades aquestes dues coses, un muntatge GP primer de tot construeix una població d’individus a l’atzar. Llavors els gradua amb la funció d’aptitud i forma una nova població reproduint, mutant i seleccionant els individus mes bons de la població. Desprès de repetir això durant un temps, els individus bons comencen a aparèixer.
Un equip punter en aquest camp és el de John Koza a Stanford.
Tornar a la pagina principal