AGENTE ADAPTABLE, APRENDIZAJE Y ESTRUCTURA DEL AMBIENTE: UN ENFOQUE ALTERNATIVO

ADAPTIVE AGENTS, LEARNING, AND ENVIRONMENTAL STRUCTURE: AN ALTERNATIVE APPROACH

Arturo Lara Rivero*

* Post-doctorado en Administración de la tecnología en la universidad de quebec. Profesor del departamento de producción Económica y coordinador del programa de Estudios sobre complejidad, cognición e Instituciones, universidad Autónoma metropolitana, Xochimilco, méxico, [alara@correo.xoc.uam.mx].

Esta investigación forma parte del proyecto de investigación no. 156204, "sistemas complejos Adaptables y cooperación tecnológica", patrocinado por el.

Fecha de recepción: 20 de enero de 2012, Fecha de modificación: 12 de abril de 2012, Fecha de aceptación: 13 de abril de 2012.


RESUMEN

En este trabajo se contrasta el concepto de agente programado con el de agente complejo adaptable, se presenta una nueva visión ligada al aprendizaje y la estructura del agente. La imagen del agente se analiza considerando los modelos internos, la práctica, el concepto de rutina y la influencia en su comportamiento, y la importancia del aprendizaje ex ante y ex post. Por último se muestra que la resolución de problemas está sujeta a restricciones del agente y se describen las formas de explorar el espacio de soluciones mediante tres tipos de exploración: exhaustiva, aleatoria y selectiva.

[Palabras clave: agente adaptable, aprendizaje, sistema complejo adaptable, modelos internos; JEL: D03, D83]


ABSTRACT

This paper contrasts the concept of a complex, adaptive agent with the idea of a programmed agent, and develops a new vision of agent learning and structure. The concept of the agent is analyzed through a consideration of internal models, practice, the concept of routine and its influence on the agent's behavior, and the importance of ex ante and ex post learning. Finally, it demonstrates how problem solving is subject to the restrictions of the agent, and describes the different ways to explore solutions space with three types of scanning: exhaustive, random and selective.

[Keywords: agent adaptive, learning, complex adaptive systems, internal models; JEL: D03, D83]


Uno de los fundamentos de la teoría económica evolutiva es el concepto de "rutina". ¿qué tan fecundo ha sido este concepto,acuñado por nelson y Winter en su famoso libro de 1982, Una teoría evolutiva del cambio económico? ¿tiene futuro el concepto de rutina? casi un cuarto de siglo después, ellos mismos, junto con otros autores, hacen esta pregunta e identifican dos problemas básicos: el conceptoes ambiguo y no ha estimulado un trabajo experimental riguroso que ayude a refinar la teoría (becker et al., 2005). otros autores afinesreconocen las dificultades para precisarlo (Cohen et al., 1996): la anarquía terminológica y la falta de coherencia (dosi et al., 2000; becker,2004, y felin y foss, 2004), los problemas teóricos del programa deinvestigación y el estatus empírico (Murmann et al., 2003; Winter, 2003, y Becker, 2004a y 2004b). ¿Es posible que estas dificultades esténasociadas a la visión del agente que dio lugar el concepto de "rutina"? ¿Hasta qué punto el comportamiento del agente económico está gobernado por rutinas? Existen varias respuestas a esta pregunta. La teoría neoclásica concibe al agente como un daimon con propiedades míticas, en particular, con una inmensa capacidad de cómputo y una extraordinaria habilidad matemática. En la teoría económica evolutiva domina la concepción del agente guiado por rutinas, más limitado y miope; torpe, en comparación con el agente neoclásico. y propone un modelo del agente atrapado en la vecindad de su conocimiento local, que aprende de la experiencia, por ensayo y error; en el que solo encaja incidentalmente la evidencia científica actual. ¿Es adecuada esta concepción? ¿Hay que concebir al agente como un sujeto más que como un autómata? El agente está programado y a la vez es capaz de enfrentar la incertidumbre formando modelos internos y expectativas acerca de la estructura y la dinámica del mundo1. Es preciso entonces atribuirle conciencia, imaginación y voluntad. Utilizando el marco evolutivo de darwin -lo que Hodgson (2001, 2004 y 2007) y Hodgson y Knudsen (2004) llaman "darwinismo universal"2 y el concepto de práctica3, este trabajo reconstruye los procesos de aprendizaje del agente adaptable (Simon, 1969; Holland, 2004 y Nooteboom, 2000).

Las preguntas básicas son las siguientes: ¿en la reconstrucción del comportamiento de los agentes adaptables se deben combinar la concepción de agente racional y la de agente programado?, ¿cuáles son los mecanismos de aprendizaje que debemos atribuirles, y esposible estudiarlos utilizando el marco teórico darwinista?, ¿por qué se debe considerar la estructura del mundo y cómo interactúa con las restricciones cognitivas del agente adaptable?, ¿es necesario un nuevo concepto que integre el aprendizaje ex ante y el aprendizaje ex post,lo cognitivo y lo emocional, los procesos automáticos y controlados?

La primera sección contrasta los conceptos de agente programado y de agente adaptable complejo, y la segunda presenta una nueva visión del aprendizaje y la estructura del agente. La sección siguiente amplía el análisis introduciendo la retroalimentación en los procesos de aprendizaje. La cuarta sección precisa la idea de agente incluyendo los conceptos de modelo interno y práctica, de aprendizaje ex ante yde aprendizaje ex post. En la quinta sección se muestra que la solución de problemas está sujeta a restricciones y, por ello, se considera el aprendizaje con arreglo a medios y fines. La última sección presenta las conclusiones.

AGENTE PROGRAMADO VS. AGENTE ADAPTABLE COMPLEJO

La teoría económica evolutiva propuesta por Nelson y Winter se basa en la "rutina", a la que cohen et al. Definen como "la capacidad para el desempeño repetido en un contexto, aprendida por una organización en respuesta a presiones selectivas" (1996, 683). Este concepto -la unidad de análisis de la economía evolutiva (becker,2004)- dio ímpetu a la literatura sobre administración estratégica y llevó a formular los conceptos de capacidades (Teece et al., 1997),de competencias (Henderson y Cockburn, 1994) y de capacidades dinámicas (Eisenhardt y Martin, 2000).

Nelson y Winter (1982, 72) consideran analíticamente equivalentes las habilidades individuales y las rutinas organizacionales. La habilidad es "la capacidad para una secuencia de comportamiento coordinado que suele ser efectiva con respecto a los objetivos, dado el contexto" (ibíd., 73). Esta equivalencia lleva a que los autores subrayen dimensiones del aprendizaje que implican especialización, pérdida de flexibilidad y replicación del conocimiento, las cuales generan a su vez comportamientos mecánicos y estereotipados. En su libro, el concepto de rutina es sobre cargado con otros significados: variedad de comportamientos (heurísticas y estrategias), dimensiones cognitivas (memoria organizacional), incentivos y motivaciones (tregua organizacional). ¿cuáles han sido las consecuencias? En primerlugar, la ambigüedad4. En segundo lugar, la supresión del agente y su sustitución por la organización. nelson y Winter dan primacía al colectivismo metodológico (Hodgson, 2007) y diluyen la necesidad de una teoría del agente y de la organización como realidades irreductibles5. En tercer lugar, la ausencia de una explicación darwiniana de las rutinas y las habilidades; nelson y Winter no hacen explícitos los mecanismos y las propiedades evolutivas de las rutinas ni de las habilidades del agente individual. Además, no abordan una pregunta clave que vincula la racionalidad limitada del agente con la estructura del ambiente: desde el punto de vista cognitivo, ¿cómo interactúan el agente y el ambiente? cuando estudiamos a los agentes adaptables, ¿tiene sentido tomar como unidad de análisis a la rutina? En esta sección y en la siguiente se propone una respuesta distinta que combina la biología evolutiva y la historia.

Durante miles de años nuestra especie ha construido programas que son escogidos por selección natural. ¿Es posible que la naturaleza haya programado el comportamiento en forma exhaustiva? ¿El agente es un simple autómata programado? no hay posibilidad alguna de que la evolución haya preprogramado el comportamiento requerido para conducir a alta velocidad, aprender un nuevo idioma o interactuar a través de Internet. Es imposible que la evolución construya un programa casi infinito y, sobre todo, que anticipe las contingencias o situaciones inéditas que surgen en la práctica del agente. Además, el programa consumiría demasiada memoria y la "pérdida de flexibilidad sería catastrófica" (Ehrlich, 2005, 235). La explicación reduccionista es contraintuitiva y antinatural:

En el genoma humano existen unos 100.000 genes, y entre 100 y 100.000 billones de conexiones (sinapsis) entre más de un billón de células nerviosas que hay en nuestro cerebro [...] Hay al menos 1.000 millones de sinapsispor gen [...] Es claro que las características de esta red nerviosa solo puedenser especificadas parcialmente por la información genética; el ambiente y laevolución cultural deben desempeñar un gran papel, con frecuencia dominante, en el establecimiento de las complejas redes nerviosas que modulan la conducta humana [...] podemos decir que tenemos una 'escasez de genes' (Ehrlich, 2005, 233).

Los genes no pueden programar una respuesta apropiada para cada evento posible. En el curso de la historia evolutiva, nuestra capacidad cognitiva solo ha registrado una pequeña parte de los estímulos potenciales que existen en el ambiente. Tenemos miles de miles de millones de posibilidades de conectarnos con el mundo y representarlo. Esta reflexión es útil en el análisis del comportamiento programado6 versus el comportamiento basado en el libre albedrío.

La enorme complejidad de nuestros cerebros puede también [...] explicar el 'libre albedrío'. ninguna computadora moderna, aun si hubiese empezado atrabajar cuando comenzó la vida en la tierra (hace quizá unos 4.000 millonesde años), podría calcular con la suficiente velocidad para especificar todas las posibles ramificaciones de las interacciones [...] En la práctica, el cerebro humano ha evolucionado de forma que puede escoger deliberadamente opciones reales. 'Cablear' el cerebro para que almacene instrucciones específicas seríaun grave 'error de diseño'. La información del ambiente humano es mucho más extensa que la del genoma humano, y buena parte de ella ha sido creadapor acciones humanas (ibíd., 234-235).

Este argumento se puede extender a todos los agentes adaptables complejos. Margulis y Sagan (2005, 178) sugieren: "quizás todos los seres vivos comparten nuestro sentido del libre albedrío". Desde el punto de vista evolutivo, no sería viable un agente sustancialmente programado y, por tanto, incapaz de abrir y elegir opciones.

La naturaleza ha creado organismos capaces de enfrentar situaciones complejas, variables e inciertas. La selección natural nos ha provisto de capacidad para construir, actualizar y refinar modelosinternos del mundo, en contextos de acción inéditos (selten, 2001). Los agentes con comportamientos estereotipados tienen menor probabilidad de sobrevivir que los agentes con comportamientos más flexibles. Tiene mayor probabilidad de sobrevivir el agente que posee un sistema cognitivo flexible -para no caer en una situación caótica- y suficientemente estable para retener estructuras de conocimiento exitosas -sin caer en la rigidez-, es decir, programas conductuales a la vez parcialmente cerrados y abiertos. Los programas cerrados determinanel comportamiento del agente -y explotan el conocimiento exitoso-, los abiertos dejan alternativas -explorar y adaptarse al ambiente. Desde esta perspectiva, el agente realiza dos tipos de actividades cognitivas: de explotación y de exploración (cuadro 1).

- Las actividades de explotación usan el conocimiento existente. Su principal objetivo es explotar el conocimiento local, dentro de los límites de lo conocido. Se orientan a la selección y la estandarización de las prácticas exitosas. Por ello no generan novedad sino estabilidad, y refuerzan las rutinas.

- Las actividades de exploración transforman y amplían el espacio de búsqueda de soluciones. Abren oportunidades de aprendizaje, eliminan rutinas y crean otras, generan nuevos problemas e incertidumbres.

En su historia, el agente crea valores y hechos que le permiten combinar las actividades de exploración y explotación, simplificar y focalizar el espacio de soluciones, representar la realidad en forma acotada y manejable, y dar significado a su práctica. La historia del agente contribuye a concentrar la atención y a crear recursos cognitivos, organizacionales y materiales que potencian su práctica. La historia restringe y abre posibilidades.

¿Qué recursos tiene el agente para explotar/explorar problemas complejos? En la práctica individual se puede identificar un conjunto de componentes -recursos- que permanecen relativamente "estables": el lenguaje que utiliza para resolver problemas, las preguntas que considera problemas importantes, los enunciados (imágenes, diagramas), los patrones (o esquemas) -buenos y defectuosos- que subyacen en sus explicaciones, los ejemplos estándar y los paradigmas de experimentación y observación, los instrumentos y herramientas7.

Estos componentes son fruto de la interacción social (entre agentes) y de las interacciones asociales (entre agentes y objetos). Como resultado de esas interacciones se crean tensiones y conflictos dentro de cada componente y entre componentes. La práctica es específica, diversa, dinámica y multidimensional.

Con este marco analítico, la sección siguiente describe en forma estilizada los procesos involucrados en la evolución del agente adaptable complejo.

MECANISMOS, PROPIEDADES Y ESTRUCTURA DEL AGENTE

De amplio uso en la ciencia de la inteligencia artificial, el conceptode agente adaptable complejo nos proporciona una nomenclatura con una representación más precisa. Este concepto designa los sistemas de la naturaleza que tienen capacidad de adaptación. Un agente puede ser una persona, una ameba, etc. Es complejo porque está integrado por un gran número de elementos que interactúanen forma no lineal. Su manera de responder al ambiente y perseguir sus objetivos puede ser deliberada o no deliberada. A estas características se debe sumar la dimensión física del agente. Para Simon,es necesario

Llamar la atención sobre la importancia crítica de la interfaz entre el medio yel sistema inteligente: los órganos sensoriales y motores que el último posee. Esta interfaz plantea algo que de diferentes maneras es el problema más delicado del diseño de un sistema adaptativo (Simon, 1987, 32)

Por ello es conveniente identificar los componentes que definen al agente adaptable. La arquitectura del agente está compuesta por los sensores físicos -que le permiten recoger información del mundo- y los actuadores físicos -que le permiten transformar el mundo material-. Ambos tipos funcionan como interfaces entre el medio interno y el ambiente. El programa es el conjunto de reglas que guían al agente, y cuyas funciones son interpretar el flujo de información que entra al sistema cognitivo, insertar esa información en la secuencia histórica del agente y orientar sus acciones. Por tanto:

AGENTE = ARQUITECTURA + PROGRAMAS

El agente adaptable complejo tiene capacidad para interactuar con su ambiente utilizando una arquitectura específica y programas omodelos internos específicos. Holland (2004) identifica un conjunto de mecanismos y propiedades, comunes a los sistemas adaptables complejos, que se sintetizan en el cuadro 2.

¿Cómo se forman estos mecanismos y propiedades? según laexplicación darwinista la capacidad cognitiva del agente es una red neuronal plástica y en blanco, que la historia evolutiva marcó y configuró (dennet, 1999;dawkins,1993).El agente ha evolucionado en un mundo que tiene estructura, por ello su aparato cognitivo representa la estructura del mundo (smith, 2003; Simon, 1956 y 1969). Su manera de organizar el mundo no es arbitraria.

En neurociencia y neuroeconomía, la teoría y los experimentos establecen que el ser humano combina procesos cognitivos y emocionales, distribuidos en diferentes subsistemas, organizados de manera jerárquica, y con propiedades y mecanismos no reductibles. Esta nueva representación se presenta en el cuadro 38.

El cuadro muestra dos dimensiones clave del funcionamiento neuronal. El proceso controlado procesa la información en forma serial, y cuando hay problemas tiende a ser evocado en forma deliberada, con un sentimiento de esfuerzo9. El proceso automático, el modo normal de funcionamiento del pensamiento, opera en forma paralela, sin esfuerzo, y no es accesible a la conciencia.

Debido a la arquitectura de 'red' masivamente interconectada de los sistemas neuronales, las computaciones que se hacen en una parte del cerebro pueden influir en cualquier otra computación, aunque no haya ninguna conexión lógica entre ellas (camerer et al., 2005, 21).

La posibilidad de procesar información en paralelo facilita la respuesta rápida, permite hacer multitareas en forma masiva y proporciona redundancia.El proceso automático se interrumpe cuando el agente enfrenta eventos inesperados o fuertes estados emocionales. Durante las crisis, en particular, debe modular la pugna entre sus propensiones automáticas y su necesidad de deliberación. ¿Qué papel juegan las emociones en este proceso? para Simon (1989),una teoría que busque explicar la racionalidad como adaptación evolutiva debe explicar el papel de las emociones:

Para contar con algo similar a una teoría completa de la racionalidad humana, [debemos] entender el papel de la emoción [...] una teoría conductual de la racionalidad, interesada en la atención como principal determinante de la elección, no disocia la emoción del pensamiento humano; tampoco, bajo ningún concepto, subestima los poderosos efectos de la emoción al establecerla agenda para resolver problemas humanos (Simon, 1989, 44-45).

Para la mayoría de los científicos que estudian las emociones, su aspecto esencial no son los estados afectivos asociados sino su papel en la motivación y en la formación de tendencias de acción, que son necesarios para sobrevivir (frijda, 1986; berkowitz, 1999).

Concentrar la atención -señala Herbert Simon- es una de las funciones principales de los procesos que llamamos emociones [...] nuestra habilidad para enfrentar esa limitación y sobrevivir a pesar de ir paso a paso depende de los mecanismos, en particular los emotivos, que dan prioridad suprema en la agenda a los nuevos problemas de gran urgencia (Simon, 1989, 33-34).

Las emociones tienen valencia: son de signo positivo o negativo. Los estados emocionales producen interrogantes del tipo "ir/no ir", que llevan a adoptar o a rechazar ciertos comportamientos (zajonc, 1998).En cambio, los procesos cognitivos dan respuestas del tipo verdadero o falso. El sistema cognitivo por sí mismo no produce acción; para influir en el comportamiento humano requiere del concurso del sistema afectivo, aunque no están perfectamente correlacionados (camerer,2005). Una gran parte del sistema cognitivo -percepción y lenguaje- y emocional -hambre, sed, dolor, pasión, deseo sexual- opera de manera automática (buck, 1999).

¿De qué manera la selección natural elige a los agentes? los agentes que no se conectan causal y emocionalmente con el mundo perecen; y los agentes que sí lo hacen se reproducen o se apropian de más recursos. Así la naturaleza se convierte en un mecanismo de "selección natural" del comportamiento10. Esta representación es coherente con los resultados de otras disciplinas y despierta el interés de la comunidad científica -en biología evolutiva, neurociencia, inteligencia artificial, psicología cognitiva, matemáticas y economía- por explicar las capacidades de los agentes adaptables.

APRENDIZAJE, RETROALIMENTACIÓN Y ESTRUCTURA DEL AMBIENTE

Cuando se requiere explorar el espacio de soluciones y no se tiene información alguna sobre las alternativas y consecuencias no queda otra opción que buscar de manera ciega11. En alguna medida todos los procesos de solución de problemas siguen la vía de ensayo y error.y "cuanto más difícil y novedoso sea el problema más probable será que se requieran más casos de ensayo y error para encontrar una solución" (Simon, 1969,95). Se puede estilizar la secuencia evolutiva de aprendizaje por ensayo y error, del siguiente modo. Sea p el problema, ts las soluciones tentativas y EE la eliminación de errores.

La gráfica 1 muestra que al inicio un problema (p1) dispara el proceso de generación de soluciones tentativas (tsn), al final del cual se eliminan los errores y se retienen los ensayos exitosos (EE)12, por selección natural. El mecanismo de selección elimina o fortalece,parcial o totalmente, las hipótesis o estrategias, o al agente (Axerold y cohen, 2000). Como resultado de la práctica, el agente extrae información acerca del mundo y de sus recompensas. La naturaleza refuerza ciertos comportamientos en la medida en que cumplen un conjunto de condiciones:

  1. Para que el agente retenga la relación entre una acción concreta y su resultado es necesario que la relación causal entre la acción y la consecuencia se "manifieste" claramente;
  2. Cuando el resultado es positivo, el agente debe tener la capacidadpara explotar las acciones concretas que tienen una relación causal aparente con el resultado13, y
  3. El agente evitará las acciones que tengan una relación causal aparente con el resultado indeseable.

El refuerzo enseña cuáles son las condiciones deseables y las indeseables; ello supone que las señales que envía el ambiente no son ambiguas y que ocurren inmediatamente después de la acción. ¿Es así como los agentes adaptables adquieren nuevos conocimientos fácticos del mundo, que el ambiente va seleccionando? la explicación anterior es incompleta, se requiere examinar atributos adicionales, de los problemas y del agente; es decir, la estructura del aprendizaje, que Hogarth (2002) sintetiza del modo siguiente.

La gráfica 2 presenta en forma estilizada dos dimensiones que definen la estructura del aprendizaje: la consecuencia de los errores (eje vertical) y la calidad de la retroalimentación (eje horizontal). La hipótesis central de esta taxonomía es que el aprendizaje depende de la retroalimentación del ambiente y del tipo de consecuencias. Si la retroalimentación es ambigua, se retrasa o es incierta, el agente no tiene indicaciones o pistas para reconocer las consecuencias de sus acciones. Una información deficiente puede disolver las conexiones y el refuerzo, y crear ruido en la estrategia de aprendizaje. Una retroalimentación clara, rápida y precisa permite corregir y mejorar rápidamente el aprendizaje.

En el eje vertical se representan dos tipos de ambiente,uno exigentey el otro benévolo. Un ambiente exigente demanda decisiones precisas. Por ejemplo, las valoraciones y procedimientos de un cirujano, o de un piloto de autos de carreras, se reflejan rápidamente en el curso de los acontecimientos, que en el caso del médico puede significar la vida o la muerte del paciente, y en el del piloto llegar a la meta o sufrir un accidente de consecuencias fatales. También existen ambientes benévolos, como cuando al conducir un vehículo tomamos la calle equivocada: podemos corregir el error a bajo costo.

La gráfica 2 combina esas dos variables en cuatro cuadrantes para identificar las tensiones o exigencias de aprendizaje en cada ambiente. El aprendizaje es más fácil cuando la retroalimentación es relevante, y mejora cuando se transita de un ambiente benévolo a uno exigente, el cual demanda precisión. Cuando la retroalimentación es deficiente, ambigua o con ruido y el ambiente es benévolo, el agente puede permanecer atrincherado en una concepción supersticiosa del mundo, sin consecuencia o costo alguno. y no puede seguir atrincherado cuando la retroalimentación es deficiente y los errores producen fuertes consecuencias.

Los problemas asociados a las diferentes estructuras del ambiente llevan a preguntar ¿qué estrategias siguen los agentes para identificar soluciones? En la siguiente sección se examinan distintas formas de aprendizaje que implican diferentes formas de exploración de posibles soluciones.

APRENDIZAJE BASADO EN MODELOS INTERNOS Y PROBLEMAS DÉBILMENTE DEFINIDOS

El agente ha evolucionado en un mundo donde enfrenta problemas débilmente definidos14, con señales contradictorias o de múltiples sentidos, con información incompleta, en circunstancias que favorecenla aparición de familias de problemas. En este contexto, no busca la "verdad" ni la consistencia lógica; se ocupa continuamente de resolver problemas con recursos cognitivos limitados. La exactitud y las reglasfijas son malas estrategias para sobrevivir. La lógica solo funciona si la información es completa15. Este ambiente exige rapidez y economíaen la construcción de hipótesis. Por ello, sobrevive quien aprovecha los indicios o pistas que aparecen en el ambiente y luego amplifica e integra esos fragmentos de información en su representación del mundo (Simon, 1956; selten, 2001).

¿Qué estrategia sigue el agente cuando no tiene experiencia ni conocimientos que le permitan identificar las pistas o claves para resolver problemas? supongamos que es un agente reactivo simple,es decir, que solo responde a sus percepciones actuales y no guarda memoria de sus éxitos o fracasos. ¿En qué condiciones objetivas puede tener éxito? primero, las alternativas y sus consecuencias deben ser totalmente observables para que pueda representar el problema. En segundo lugar, la retroalimentación del ambiente debe ser rápida y clara, de tal suerte que el agente pueda asociar la consecuencia con su acción en forma clara y temporalmente próxima. y, en tercer lugar, debe tener la capacidad para procesar esa información en poco tiempo y a bajo costo.

Los problemas no son totalmente observables y la respuesta del ambiente no siempre se desencadena después de la acción, puede retrasarse o no expresar claramente la consecuencia de la acción. y, aun contando con información clara y señales rápidas, los problemas de búsqueda -de complejidad exponencial- no se pueden resolver sin acumulación de información previa, salvo en casos limitados. La manera más efectiva para manejar la visibilidad parcial es almacenar información de las partes del mundo no observables. ¿cómo? con modelos internos. Podemos imaginar un proceso de selección natural en el que los agentes que construyen modelos internos congruentes con el mundo se desempeñan mejor y tienen mayores posibilidades de reproducirse y de subsistir. Los otros perecerán16.

¿Hasta que punto el método o heurística de ensayo-error "ciego" puede explicar el aprendizaje de los agentes adaptables? En opinión de johnson-laird:

El método puro de 'ensayo-error' se parece a la evolución de las especies, conforme a la teoría neodarwiniana. Solo funciona si hay una oportunidad razonable de converger al programa requerido mediante una serie de pasos graduales, en cada uno de los cuales exista una probabilidad razonable de quese produzca por azar, y en los que se mantenga con éxito a fin de conducira la siguiente mejora. Las oportunidades de adquirir una habilidad relevante usando un método neodarwiniano no restringido son prácticamente insignificantes, tal como descubrieron los expertos en inteligencia artificial enlos años sesenta cuando fracasaron los programas basados en dicho método ( johnson-laird, 2000, 127).

El método de ensayo y error "no opera mediante ensayos aleatorios [...] debe haber al menos una 'secuela'" (popper, 1992, 227). Debido a que el agente construye un modelo del mundo que le permite aprender desus errores. Para Simon "el ensayo y error no es completamente ciego o al azar; es altamente selectivo" (1969, 95). Si bien el aprendizaje por ensayo y error depende de la repetición de la misma tarea, también es cierto que "sin esperar pasivamente que las repeticiones nos impriman o impongan regularidades, tratamos activamente de imponerle regularidades al mundo" (popper, 1992, 46)17. Esto es posible porque representamos el mundo a través de modelos internos y nos servimos de esa representación para construir expectativas18. Como veremos a continuación.

Aprendizaje Basado En Modelos Internosy Aprendizaje Ex Ante

El agente aprende al revisar, organizar y mejorar sus modelos internos. Por ejemplo, el arquero que busca mejorar sus disparos al revisar sus conjeturas. Por esa vía mejora su desempeño, pues en este caso el ambiente no da señales precisas de la complejidad de la trayectoria decada disparo. Aquí el aprendizaje es fruto de un agente que procesa el mundo de manera activa (gigerenzer, 2001; todd, 2001).

El agente procesa la información proveniente de los órganos de los sentidos, reconoce y correlaciona el estímulo con experiencias anteriores y elabora una respuesta19. A través de la práctica, retiene redes de conexiones causales mediante la regla "si ⇒ entonces" (condición-acción) que, a la postre, se traducen en capacidad para reconocer patrones (newell y Simon, 1977; Holland, 2004)20.

Cada vez que el agente se expone a una situación similar, fortalece las viejas conexiones21. y cuanto más cercanas y semejantes sean sus experiencias mayor será la interacción entre las redes deconexiones, lo cual lleva a que un conjunto de esas conexiones setransforme de memoria de corto plazo en memoria de largo plazo ( Johnson-Laird, 2000). Lo que se convierte en memoria de largo plazo es el núcleo común de las redes super puestas. Este núcleo noconstituye una conexión singular sino un conjunto de propiedades compartidas por una extensa clase de circunstancias físicas, sociales o lingüísticas, anidadas jerárquicamente y útiles para sobrevivir. Lo relevante en este proceso no son las conexiones individuales aisladas sino el patrón de interacción y de agregación de los modelos internos (Holland, 2004). Desde esta perspectiva, un solo modelo interno ouna sola neurona no pueden hacer mucho por sí solos. La capacidad para resolver problemas es una propiedad emergente de los modelos internos que interactúan, unos de manera masiva y paralela, y otrosde manera secuencial.

Los modelos internos compiten y cooperan entre sí22, buscando influir en las decisiones y guiar las acciones23. La experiencia reconfigura continuamente la población de modelos internos, y dicha población modifica la forma en que el agente percibe su trato con el mundo,transformando la realidad y a la vez su naturaleza interna24.

Gell-Mann (1995) describe en forma estilizada el proceso cognitivo mediante el cual el agente procesa información (gráfica 3). El ciclose inicia cuando el agente, basado en datos anteriores -incluido elcomportamiento y sus efectos- percibe regularidades, condensándolas en un esquema o modelo interno. Los modelos internos le permiten anticipar consecuencias y elegir la mejor alternativa posible. Una característica fundamental es que la revisión se efectúa"internamente", simulando las posibilidades prácticas y eligiendo ex ante el curso a seguir. Así no pone en riesgo sus recursos, su tiempo,su estrategia o su propia existencia. Una vez que una secuencia de modelos internos toma el curso de acción, se ponen en tensión la descripción causal del evento, la predicción y el comportamiento en el mundo real. El proceso de retroalimentación ejerce una "presión selectiva" sobre la población de modelos internos en competencia, conservando los que mejor contribuyan a resolver problemas y eliminando los incorrectos.

¿La capacidad para predecir y elegir es exclusiva de los seres humanos o es una capacidad universal de los agentes adaptables, con distintos grados y niveles de profundidad? A este respecto la humanidad no pertenece a una clase especial, única y cualitativamente superior. Es una especie animal y no está por "encima" de la naturaleza.por ello es conveniente tener en cuenta la forma en que los biólogos representan a los agentes adaptables, bien sean amebas o seres humanos.

Los agentes adaptables no solo toman nutrientes del mundo que los rodea sino que procesan -en grado y profundidad diferentes- hechos,experiencias e impresiones sensoriales (Ehrlich, 2005). En opinión de Kauffman (2003), este problema se puede plantear desde el punto de vista semántico: un agente molecular que se introduce en un agente autónomo puede ser alimento, veneno, señal, neutro u otra cosa. El agente sobrevive, porque tiene una semántica interna -de naturaleza química- que le permite predecir, por ejemplo, que "hay más glucosa en esa dirección que en aquella".

En un agente autónomo la simple química puede alojar símbolos y signos enel pleno sentido de estas palabras [...] si el receptor es un agente autónomo,como una bacteria, y la molécula entrante es el signo-símbolo de "paramecioameba a la vista" y, gracias a ello, la bacteria evita convertirse en almuerzo nadando lejos; esa secuencia de eventos está cargada de semántica [...] unagente autónomo es una cierta conjunción de materia, energía y organizacióna la que es posible atribuir propósito en el sentido de capacidad de obrar ensu propio beneficio (Kauffman, 2003, 160).

En suma, la bacteria representa su mundo y usa ese conocimiento para adaptarse. Dicho conocimiento se puede representar como una regla que establece que a una condición específica le corresponde una respuesta u acción: si A entonces b. Estas reglas, que Holland (2004) llama "modelos internos", y que se condensan en los genes o en la cultura, sintetizan las lecciones de supervivencia aprendidas durante millones de años de evolución. El bioquímico daniel Koshland reflexiona sobre las capacidades de las procariotas:

'Elección', 'discriminación', 'memoria', 'aprendizaje', 'instinto', 'juicio' y 'adaptación' son palabras que normalmente identificamos con procesos nerviosos superiores. Pero, en cierto sentido, se puede decir que una bacteria posee todas estas propiedades [...] sería insensato concluir que las analogías soloson semánticas, pues parece haber relaciones subyacentes en mecanismosmoleculares y funciones biológicas. Por ejemplo, el aprendizaje en las especies superiores implica sucesos a largo plazo e interacciones complejas, pero la síntesis enzimática inducida debe considerarse como uno de los dispositivos moleculares más probables para fijar algunas conexiones neuronales y eliminarotras. La diferencia entre instinto y aprendizaje se convierte en una cuestión de escala temporal, no de principio (Koshland, 1992, 1055-1063).

A través de los modelos internos -sujetos a variación y a presiones selectivas- los agentes han desarrollado un mecanismo de anticipación -implícita o explícita- de las consecuencias de sus acciones o de las acciones de otros agentes. Los procesos evolutivos han creado agentes adaptables con "poder cognitivo" para predecir estados del mundo y moldearlo en su beneficio (Gell-Mann, 1995).

¿Cuál es la diferencia esencial entre el aprendizaje ex post y el aprendizaje ex ante? mientras que en el aprendizaje ex post no hay incertidumbre -los acontecimientos están consumados- en el aprendizaje ex ante el agente debe tomar decisiones riesgosas en poco tiempo,con pocos recursos y alta incertidumbre. ¿cuáles son las implicacionesde que los agentes tengan capacidad para explorar más allá de su experiencia, para simular el futuro? El concepto de "aprendizaje ex ante" ayuda a dilucidar la naturaleza del descubrimiento inductivo y de la expansión del conocimiento.

MODELOS INTERNOS, INDUCCIÓN Y HEURÍSTICA DEL DESCUBRIMIENTO

El agente dotado de modelos internos -capaz de simular internamente secuencias complejas de acción- puede requerir un solo ensayo para hacer buenas inferencias, sin una voluminosa acumulación de datos o estímulos del mundo25. Todo agente debe resolver problemas y esto lo lleva a explotar lo que sabe, a extender sus conocimientos a otros campos. El agente aprende a asociar el evento A con el evento b. Este proceso de inducción y generalización no se debe a una reducción y comparación lógica de las conjeturas, sino al proceso darwiniano de competencia/cooperación de los modelos internos.

Debido a que las personas tienen poco o ningún acceso a estos procesos, ocontrol volitivo sobre ellos, y a que se desarrollaron para resolver problemas de importancia evolutiva y no de dictámenes lógicos, el comportamiento que generan estos procesos no sigue necesariamente los axiomas normativos deinferencia y elección (Camerer, 2005, 11).

Por ello hay que entender cómo se realizan los procesos de inducción.para nuestros propósitos, cabe destacar la heurística del descubrimiento que sugiere bart nooteboom (2000) porque explica cómo evoluciona la práctica de explotación/exploración y reconstruye y explica el proceso de expansión del conocimiento26. Esta heurística consta de cuatro pasos: consolidación, generalización, diferenciación y reciprocación (gráfica 4)27

- Consolidación. En este paso, el lenguaje, el conocimiento, la tecnología y la organización se consolidan en prácticas estándar que sirven de base para una explotación eficiente. Los problemas mal o débilmente definidos se convierten en problemas bien definidos. El producto de la consolidación puede servir como plataforma para nuevas aplicaciones y, por tanto, como base para la generalización; o llevar a la repetición ciega e inercial de las prácticas.

- Generalización. Una manera de probar una práctica es aplicarla en contextos nuevos, por ello la consolidación es la base para la generalización. Esta induce actividades de exploración si precisa los límites de las prácticas, identifica los elementos de las prácticas que se deben preservar y promueve el uso de prácticas vecinas.

- Diferenciación.puesto que el agente actúa en distintos contextos,la práctica se debe ajustar a cada ambiente específico. En este paso se crean prácticas asociadas a nuevos contextos.

- Reciprocación. En este paso se adoptan elementos de prácticas ajenas empleadas en otros contextos. o se transfieren elementos de prácticas existentes a prácticas externas de otros contextos. Puede llevar a establecer prácticas novedosas o a una exploración caótica y desorganizada.

La heurística del descubrimiento condensa una larga experiencia inductiva derivada de la práctica, resultado de millones de años de procesos analíticos condensados, acumulados y explotados por los sistemas complejos adaptables generación tras generación. El tipo de conocimiento que así se logra no se opone a la experiencia analítica consciente; la heurística del descubrimiento es resultado de la capacidad analítica del agente, es post-analítica y no pre-analítica o no analítica.

Aprender supone procesar activamente la información que se obtiene del ambiente28. Esta experiencia está inscrita en la historia del agente, dentro de una ecología de acciones con otros agentes con los cuales co-evoluciona. El universo es creativo y emergente (Kauffman,1993 y 1995; Watts, 2003).

SOLUCIÓN DE PROBLEMAS Y APRENDIZAJE MEDIOS-FINES

¿Se puede estudiar la solución de problemas sin considerar las restricciones del agente? El proceso de búsqueda tiene límites. Parasobrevivir, el agente -dotado de energía limitada- debe administrar el tiempo y la energía. La duración y la intensidad de la búsqueda dependen de los recursos disponibles: materiales, energía, información (Simon, 1956; march y Simon, 1958; cyert y march, 1963; gegirenzer y selten, 2001; todd, 2001). Por ejemplo, para alimentarse,un animal (ratón, conejo o ser humano) debe explorar el espacio de posibles soluciones. Imaginemos que el alimento está al final de cada camino y distribuido de diversas maneras. Puede estar concentrado en caminos adyacentes o repartidos al azar. Existen tres maneras de explorar el espacio: exhaustiva, aleatoria y selectiva. ¿Cuáles son los posibles resultados de cada una de ellas?

- La búsqueda exhaustiva se puede aplicar con éxito a circunstancias simples, poco frecuentes en la vida. Si el problema tiene alta complejidad temporal y espacial, esta estrategia no es factible29.

- La exploración aleatoria contiene promesas y amenazas. Es altamente riesgosa en la medida en que depende de la suerte. Es útil e inevitable cuando no se dispone de información y experiencia previas, cuando hay que escapar de una región sin soluciones o se encuentra en un subóptimo de bajo nivel30.

- La búsqueda selectiva, que aprovecha las señales o pistas del ambiente, parece ser la más racional, acertada y plausible para explicarel comportamiento de los agentes adaptables.

Para entender mejor este proceso se debe considerar el impacto deléxito o el fracaso sobre las expectativas y la intensidad de la búsqueda. El grado de éxito puede alterar o sustituir el proceso de búsqueda31. En forma sintética, se puede decir que el agente responde a los resultadosde su acción dependiendo de la intensidad de la búsqueda, de su nivel de aspiraciones, de sus recursos y de la estructura del mundo32.

CONCLUSIÓN

La teoría evolutiva de nelson y Winter supone que gran parte del comportamiento es guiado por rutinas. El énfasis excesivo en las rutinas ha llevado a proponer explicaciones del aprendizaje interesantes pero erróneas o incompletas. Esta concepción del agente ha alejado cada vez más a la teoría económica evolutiva de una explicación del comportamiento racional consciente y deliberado. La omisión del comportamiento racional y deliberado, de las expectativas, la imaginación y la práctica es consecuencia de la ambigüedad del concepto de "rutina".

Para la teoría económica es útil e ineludible examinar e integrar los resultados de ciencias experimentales como la psicología cognitiva y la neuroeconomía. vivimos en una época estimulante, en la que la comunidad científica construye puentes para unir sus programas de investigación y tejer, con hilo más fino, una explicación coherente y verosímil de los procesos cognitivos. Lo que enseñan estas ciencias es que debemos considerar la dimensión cognitivo/emocional y los procesos automático/controlado de la toma de decisiones. La capacidad cognitiva, considerada como evolución de los modelos internosgenerales y específicos -incrustados en diferentes subsistemas- que compiten y cooperan, sigue pautas evolutivas darwinianas. El agente elimina conjeturas con base en las señales que envía el ambiente (causalidad ascendente) y en la revisión de los modelos internos(causalidad descendente).

Es necesario sustituir la visión del agente programado por la del agente complejo adaptable, con su arquitectura y sus programas específicos. Un agente que aprende de diversas maneras, por retroalimentación con el ambiente, por ensayo y error, mediante el ajuste de los medios y los fines y con base en modelos internos. Para entender mejor el comportamiento de los agentes sería útil integrar estas formas de aprender dentro de la heurística del descubrimiento.

La práctica de los agentes se puede explicar a partir de los procesos de variabilidad, orden y mecanismo de selección, siguiendo pautas evolutivas darwinianas. El concepto de práctica se convierte así en unidad de análisis, porque permite desagregar en unidades discretas sus múltiples dimensiones, porque lleva a replantear las presiones que enfrenta el agente adaptable (asociadas a la estructura del ambiente) y porque integra el aprendizaje ex post y el aprendizaje ex ante.

El agente es su historia, y más que eso. Es un sistema biológico que tiene libre albedrío y espacio para explorar dentro de sí y en el ambiente márgenes de acción no acotados por su historia. El agente es fruto de una historia de millones de años de logros inductivos. El concepto de práctica lo representa como un sujeto hábil, inteligente, imaginativo, creador y anticipador. Este artículo invita a ampliar y profundizar este campo de investigación.


PIE DE PÁGINA

1Es necesario rescatar la tradición de Simon (1957) y Cyert y March (1963) y refinar el concepto de racionalidad limitada. Gegirenzer y Selten (2001) revisan la literatura sobre el tema y abren una fecunda vía de reflexión congruente con esta tradición.
2El "Darwinismo Universal" consiste en aplicar los principios darwinistas -mutación, herencia y selección- a la explicación de todo sistema adaptativo complejo. Kauffman (1995) señala que para explicar los regímenes de complejidad existentes se debe añadir el principio de auto-organización.
3El concepto de práctica, desarrollado por Kitcher (1993) y Martínez (2003), permite explicar el avance de la ciencia en forma realista y coherente. Este concepto de la filosofía de la ciencia se puede extender a la teoría económica pues ayuda a entender la evolución de los agentes adaptables. Una justificación particular es que Philip Kitcher (1993), John Holland (1998 y 2004) y geoffrey Hodgson (1999 y 2007) buscan explicar los procesos evolutivos de la sociedad yla economía desde una perspectiva darwiniana.
4Como dicen becker et al. (2005, 784): "los investigadores a menudo eligen términos y definiciones diferentes para describir las rutinas y así contribuyen adificultar la acumulación del conocimiento sobre las rutinas. Incluso dentro de la literatura inspirada por Nelson y Winter (1982) aún no se ha logrado una conceptualización y una terminología generalmente aceptadas".
5Aquí se alejan de la tradición de Herbert Simon. Mientras que este se centraen la toma de decisiones del agente individual caracterizado por una racionalidad acotada -los agentes económicos son "intencionalmente racionales solo en formalimitada" (Simon, 1988, xxv)- Nelson y Winter se centran en la organización y ledan primacía. Además, Simon considera necesario dar "un lugar al comportamiento racional". Por otra parte, Williamson (1989, 56) considera que nelson y Wintera sumen formas de racionalidad débil u orgánica. Débil en comparación con la racionalidad maximizadora del enfoque neoclásico, y orgánica porque atribuyen racionalidad a la organización y no a los agentes individuales. La reduccióndel actor individual al actor colectivo tiene serias implicaciones metodológicas. Hodgson (2007) critica este enfoque y propone una alternativa: reconocer la doble causalidad entre el individuo y la organización, cuyas formas de existenciay propiedades son diferentes, y estudiar ambos niveles.
6Por los genes o por la cultura.
7En el concepto de práctica integramos dos dimensiones ausentes en Kitcher (1993): el aprendizaje ex ante y el aprendizaje ex post, que son esenciales para entender la naturaleza de la exigencia de adaptación en condiciones de incertidumbre.
8Esta nueva cartografía de la capacidad del agente se basa en resultados experimentales. La neurociencia informa sus resultados a la psicología cognitiva yesta a la economía. A partir de camerer et al. (2005), la neurociencia informa ala economía, sin mediación, un campo convergente que se llama neuroeconomía.
9La programación dinámica y el árbol de decisiones son representaciones estilizadas deeste proceso controlado (Simon, 1970).
10El conductismo establece la primacía de la experiencia y del mundo externo sobre el agente. no le interesa el fondo genético ni la historia evolutiva de la especie, solo tiene relevancia el ambiente. no le interesa la organización internadel agente, lo que cuenta es su capacidad para retener la estructura causal del mundo y almacenar esa información. La estructura del mundo determina la conducta del organismo. El conductismo estricto en psicología solo tiene interés histórico, está extinto como corriente de pensamiento. Esa manera de concebir alagente se retoma, aunque no en la forma extrema del conductismo, en la teoría conexionista de Rumelhart y mcclelland (1986), en la cual la realidad, en particular los estímulos, imprime en las redes neuronales del agente las conexiones causales que luego le permitirán adaptarse y sobrevivir. Holland (1998 y 2004)es cercano al conexionismo.
11Todas las teorías del aprendizaje tienen un componente de ensayo y error (Campbell, 1997, 61). La evolución de los organismos se puede representar desdeesta misma perspectiva. "todo organismo se puede considerar como un sistemajerárquico de controles plásticos [...] los subsistemas controlados hacen movimientos de ensayo y error que el sistema de control suprime en parte y restringeen parte" (popper, 1992, 23).
12La creación de nuevas hipótesis se puede interpretar como una mutación.
13Aparente porque puede o no reflejar la causalidad del mundo (nivel ontológico); a veces los agentes ven causalidad donde no existe o no reconocen nexos causales cuando sí existen, etc.
14De acuerdo con el grado de estructuración de los problemas, Newell y Simon (1977) identificaron dos tipos: problemas bien definidos y débilmente definidos. En los primeros, el agente puede considerar todos los elementos: el estado inicial,los operadores, las promesas y los estados de solución no son ambiguos, están bien definidos. Así puede elegir una solución satisfactoria. En los segundos, los elementos son desconocidos. Los operadores y los estados de solución no están bien definidos o son ambiguos. Requieren integrar diferentes campos de conocimiento y suelen tener varias soluciones (o ser insolubles), así como múltiples criterios para evaluarlas.
15El agente no sigue las reglas de la lógica o el cálculo de probabilidades -como sostiene la economía neoclásica- sino que responde a la necesidad de enfrentar, con recursos limitados, problemas débilmente definidos (Simon, 1969; Kahnemanet al., 1982; Gigerenzer y Selten, 2001; Gigerenzer, 2001).
16El conocimiento de "cómo funciona el mundo", tanto si corresponde a uncircuito booleano simple o a teorías científicas, se denomina modelo del mundo. Se reconocen dos tipos de modelos: internos y externos (Holland, 2004).
17En esta mismo sentido, Simon (1989) advirtió que había que ser cautelosos alaplicar las ideas darwinianas al estudio de la sociedad; en particular, con respecto a los supuestos estadísticos.
18A diferencia de la teoría conductista, la teoría cognitiva considera al agentecomo un actor activo.
19Una cosa es reconocer la importancia de las recompensas y otra muy distinta sustituir la explicación del agente por el nexo acción-recompensa, como hacíael conductismo.
20El cerebro puede ejecutar hasta 200 billones de operaciones en un segundo, enforma paralela. La deliberación consciente es una parte diminuta de la inteligencia. Algunos psicólogos creen que el pensamiento serial y deliberativo corresponde apenas al 3%. La memoria procedimental permite que la parte deliberativa estélibre para explorar o resolver problemas. Este 3% es crítico en la construcción de modelos internos y en la formación de estrategias con pocos recursos y pocotiempo disponible.
21En psicología cognitiva, el conexionismo actual combina las ideas de Rumelhart y Mcclelland (1986) con las teorías que reconocen estructuras innatas-genéticamente programadas- de aprendizaje (Pinker, 2003).
22Utilizando mecanismos de marbeteado (Holland, 2004).
23Cooperan cuando un modelo específico no puede representar el curso deacción y, por ende, se requiere el concurso de los modelos internos generales. En cambio, cuando los modelos generales no son suficientemente precisos para organizar la práctica emergen modelos internos específicos, provistos de mayory más precisa información (Holland et al, 1989; Holland, 2004).
24Corriente causal de interacción ascendente y descendente (Hodgson, 1999). Marx llamó "praxis" a esta dialéctica sujeto-mundo.
25En el proceso de aprendizaje los agentes generan nuevos órganos, instrumentos, comportamiento e hipótesis.
26Su explicación evita las dos visiones extremas: la del agente perfectamente racional y la del agente programado supra socializado.
27Kitcher (1993) identifica algunas etapas del progreso conceptual, que coinciden con la explicación de nooteboom: introducción de esquemas incorrectos, eliminación de esquemas incorrectos, generalización de los esquemas y extensión explicativa.
28¿Aprendemos de la experiencia? Existen diversas respuestas. Una, frecuenteen la literatura, es que el aprendizaje por la experiencia depende de la capacidad para representar el ambiente. otra, que el aprendizaje basado en la experienciano lleva necesariamente a prácticas óptimas. Una tercera, que la experiencia no envía señales claras y, por ello, es un mal maestro; depende del agente quese hagan inferencias correctas. y otra más, que los individuos -igual que lasorganizaciones- tienen limitaciones asociadas a sesgos cognitivos, a conflictos y a la división entre trabajo manual e intelectual (Kahneman y Tversky, 1979; Kahneman et al., 1982).
29La teoría neoclásica se centra en los problemas de optimización, dado un conjunto finito y computable de operaciones. La programación lineal, por ejemplo, permite encontrar una solución óptima pero únicamente de problemas bien definidos y sencillos, poco frecuentes. Carece de instrumentos para resolver los problemas frecuentes y complejos, con explosión combinatoria, o débilmente definidos, y que no forman parte de su programa de investigación (Simon, 1998; Hodgson, 1999).
30Según la biología evolutiva, la naturaleza -por medio de mutaciones genéticas- explora espacios de posibilidad no adyacentes o no correlacionados conla trayectoria genética de la especie. La mutación permite escapar al encierro alque puede llevar la historia evolutiva del agente (Kauffman, 1993, 1995 y 2003; Holland, 2004).
31Cyert y March (1963) consideran que el éxito disminuye la intensidad de la búsqueda, aumenta los recursos y amplía los objetivos del agente. El fracaso intensifica la búsqueda, reduce el nivel de recursos y los objetivos. En este proceso se deben tener en cuenta la velocidad de ajuste de las aspiraciones y los recursos. Un texto de economía evolutiva -en la tradición norteamericana- que avanza en esta dirección es el de Samuel Bowles (2004).
32Esta visión del agente concuerda con el concepto de racionalidad ecológica expuesto por vernon l. Smith (2003) y Gegirenzer y Selten (2001).


REFERENCIAS BIBLIOGRÁFICAS

1. Abernathy, W. y J., utterback. "Patterns of industrial innovation", Technology Review 81, 1978, pp. 41-47.

2. Axerold, R. y M. Cohen. Harnessing complexity: Organizational implications of a scientific frontier, New York, Basic Books, 2000.

3. Argyris, Ch. Sobre el aprendizaje organizacional, México D.F., Oxford University Press, 2001.

4. Becker, M. "The concept of routines twenty years alter nelson and Winter (1982): A review of the literature", Industrial and Corporate Change 4, 2004, pp. 643-677.

5. Becker, M., N. Lazaric, R. Nelson y S. Winter. "Applying organizational routines in understanding organizational change", Industrial and Corporate Change 14, 5, 2005, pp. 775-791.

6. Berkowitz, L. "Anger", Dalgleish, T. y M. J. Power, eds., Handbook of cognition and emotion, pp. 411-428, New York, Wiley, 1999.

7. Bowles, S. Microeconomics: Behavior, institutions, and evolution, Princeton, Princeton University Press, 2004.

8. Buck, R. "The biological affects: A typology", Psychological Review 106,2, 1999, pp. 301-336.

9. Camerer, C., G. Loewenstein y D. Prelec. "Neuroeconomics: How neuroscience can inform Economics", Journal of Economic Literature XlIII, march, 2005, pp. 9-64.

10. Campbell, D. "Epistemología evolucionista", Martínez, S. y L. Olivè, comps., Epistemología evolucionista, México, Paidós-UNAM, 1997.

11. Cohen, M. D., R. Burkhart, G. Dosi, M. Egidi, L. Marengo, M. Warglieny S. Winter. "Routines and other recurrent action pattern of organizations: contemporary research issues", Industrial and Corporate Change 5, 1996, pp. 653-698.

12. Cyert, R. y J. March. Behavioral theory of the firm, Englewood Cliffs, NJ, Prentice Hall, 1963.

13. Dawkins, R. El gen egoísta: las bases biológicas de nuestra conducta, Barcelona, Salvat, 1993.

14. Dennet, D. La peligrosa idea de Darwin: evolución y significado de la vida, Barcelona, Galaxia Gutemberg, 1999.

15. Dijksterhuis, M., F. Van Den Bosch y H. Volberda. "Where do neworganization forms come from? management logics as a source of coevolution", Organization Science 10, 5, 1999, pp. 569-582.

16. Dosi, G., R. Nelson y S. Winter "Introduction", The Nature and Dynamics of Organizational Capabilities, Oxford, Oxford University Press, 2000.

17. Eisenhardt, K. y J. Martin. "Dynamic capabilities: What are they?", Strategic Management Journal 21, 2000, pp. 1105-1121.

18. Ehrlich, P. R. Naturalezas humanas: genes, culturas y la perspectiva humana, México D.F., Fondo de Cultura Económica, 2005.

19. Felin, T. y N. Foss. "Organizational routines: A skeptical look", DRUID Working Paper no. 04-13, Dinamarca, 2004.

20. Frijda, N. The emotions, Cambridge, Cambridge University Press, 1986.

21. Gell-Mann M. El quark y el jaguar: Aventuras en lo simple y lo complejo, Barcelona, Tusquets, 1995.

22. Gigerenzer, G. "The adaptive toolbook", Gigerenzer, G. y R. Selten, eds., Bounded rationality: The adaptive toolbox, Cambridge, Mass. The MIT Press, 2001.

23. Gigerenzer, G. y R. Selten. "Rethinking rationality", Gigerenzer, G. y R. Selten, eds., Bounded rationality: The adaptive toolbox, Cambridge, Mass. The MIT Press, 2001.

24. Croguennec, A-g. y Lara, A. "Co-evolución de clusters, empresas einstituciones en la frontera norte de méxico", Lara, A., ed., Co-evolución de empresas, instituciones y regiones: Una nueva visión, México D,F., UAMALTEC-Porrúa, 2007.

25. Henderson, R. e I. M. Cockburn. "Measuring competence? Exploringfirm effects in pharmaceutical research", Strategic Management Journal 15, 1994, pp. 63-84.

26. Hodgson, G. Economía institucional y evolutiva contemporánea, México D.F., Universidad Autónoma Metropolitana, 2007.

27. Hodgson, G. M. y K. Thorbjørn. "The firm as an interactor: firmsas vehicles for habits and routines", Journal of Evolutionary Economics 14, 3, 2004, pp. 281-307.

28. Hodgson, G. M. "Is social evolution lamarckian or darwinian?", Laurent, J. y J. Nightingale, eds., Darwinism and evolutionary economics, pp. 87-118, Cheltenham, Edward Elgar, 2001.

29. Hodgson, G. M. Evolution and institutions: On evolutionary economics and the evolution of economics, Cheltenham and Northampton, Edward Elgar, 1999.

30. Hogarth, R. M. Educar la intuición, Barcelona, Paidós, 2002.

31. Holland, J. K. El orden oculto: De cómo la adaptación crea la complejidad, México D.F., Fondo de Cultura Económica, 2004.

32. Holland, J. K. Emergence, Redwood City, CA, Addison Wesley, 1998.

33. Holland, J. K. Holyoak, R. Nisbett y P. Thagard. Induction: Processes of inference, learning, and discovery, London, The MIT Press, 1989.

34. Johnson-Laird, P. El ordenador y la mente, Barcelona, Paidós, 2000.

35. Kahneman, D., P. Slovic y A. Tversky, eds. Judgment under uncertainty: Heuristics and biases, New York, Cambridge University Press, 1982.

36. Kahneman, D. y A. Tversky. "Prospect theory: An analysis of decisionunder risk", Econometrica 47, 1979, pp. 263-291.

37. Kauffman, S. Investigaciones: complejidad, autoorganización y nuevas leyes para una biología general, Barcelona, Tusquets, 2003.

38. Kauffman, S. At Home in the universe: The search of the laws of selforganizations and complexity, New York, Oxford University Press, 1995.

39. Kauffman, S. Origins of order: Self-organizations and selection in evolution, Nueva York, Oxford University Press, 1993.

40. Kitcher P. The advancement of science, New York, Oxford University Press, 1993.

41. Koshland, D. E. "A response-regulated model in a simple sensory system", Science 196, 1992, pp. 1055-1063.

42. Lewin, A., C. Long y T. Carroll. "The coevolution of new organizationalforms", Organization Science 10, 5, 1999, pp. 535-550.

43. March, J. "Exploration and exploitation in organizational learning", Organization Science 2, 1, special issue, 1991, pp. 71-87.

44. March J. y H. Simon. Teoría de la organización, Barcelona, Ariel, 1958.

45. Martínez, S. Geografía de las prácticas científicas: racionalidad heurística y normatividad, México D.F., UNAM, 2003.

46. Margulis, L. y D Sagan. ¿Qué es la vida?, 2ª. edición, Barcelona, Tusquets, 2005.

47. Murmann, J. P., H. Aldrich, D. Levinthal y S. Winter. "Evolutionary thought in management and organizational theory at the beginning of the new millennium", Journal of Management Inquiry 12, 2003, pp. 1-19.

48. Moreno, CH. A. y A. Lara. "Instituciones de metrología e innovación en elsector automotriz: El caso CENAM y Volkswagen", Sistemas de Innovación en México: Regiones, Redes y Sectores, México D.F., 2009, pp. 217-241.

49. Nelson R. y S. Winter. "An Evolutionary Theory of Economic Change", Cambridge, Mass., The Belknap Press of Harvard University Press, 1982.

50. Newell, A. y H. Simon. Human problem solving, Englewoods Cliffs, NJ, Prentice Hall, 1977.

51. Nooteboom, B. Learning and innovation in organizations and economies, Oxford, Oxford University Press, 2000.

52. Pinker, S. The Blank Slate: The modern denial of human nature, New York, Penguin Books, 2003.

53. Popper. K. Of clouds and clocks: An approach to the problem of rationality and the freedom of man, ST. Louis, Miss., Washington University, 1966.

54. Popper R. Karl. Conocimiento objetivo, Tecnos, Madrid, 1992.

55. Rumelhart, D., J. Mcclelland y PDP Research Group. Parallel distributed processing: Explorations in the microstructure of cognition, vol. I, Cambridge, Mass., MIT Press, 1986.

56. Selten R. "What is bounded rationality", Gigerenzer, G. y R. Selten, eds., Bounded rationality: The adaptive toolbox, Cambridge, Mass. The MIT Press, 2001.

57. Simon, H. A. Bounded rationality, Eatwell, J, M. Milgate y P. Newman, eds., The New Palgrave: A Dictionary of Economics, London, Macmillan, 1998b.

58. Simon, H. A. Naturaleza y límites de la razón humana, México D,F., Fondo de Cultura Económica, 1989.

59. Simon, H. A. El comportamiento administrativo, Buenos Aires, Aguilar, 1988.

60. Simon, H. A. "Ciencia cognitiva: la más nueva ciencia de lo artificial", Norman, D., ed., Perspectivas de la ciencia cognitiva, Barcelona, Paidós, 1987.

61. Simon, H. A. "Teorías acerca de la adopción de decisiones en economíay la ciencia del comportamiento", Panoramas contemporáneos de la teoría económica, Simon, H., R. Dorfman et al., Madrid, Alianza Editorial, 1970.

62. Simon, H. A. The sciences of the artificial, Cambridge, Mass., MIT Press, 1969.

63. Simon, H. A. Models of man, New York, John Wiley and Sons, 1957.

64. Simon, H. A. "Rational choice and the structure of the environment", Psychological Review 63, 1956, pp. 129-138.

65. Smith, V. L. "Constructivist and ecological rationality in economics", American Economic Review 93, 3, 2003, pp. 465- 508.

66. Teece, D. J., G. P. Pisano y A. Shuen. "Dynamic capabilities and strategic management", Strategic Management Journal 18, 1997, pp. 509-556.

67. Todd P. "Fast and frugal heuristic for enviromentally bounded minds", Gigerenzer, G. y R. Selten, eds., Bounded rationality: The adaptive toolbox, Cambridge, Mass. The MIT Press, 2001

68. Watts, D. Small worlds: The dynamics of networks between order and randomness, Princeton, Princeton University Press, 2003.

69. Williamson O. E. Las instituciones económicas del capitalismo, México D.F., Fondo de Cultura Económica, 1989.

70. Winter, S. G. "Understanding dynamic capabilities", Strategic Management Journal 24, 2003, pp. 991-995.

71. Zajonc, R. B. "Emotions", Gilbert, D. T., S. T. Fiske y G. Lindzey, eds., Handbook of social psychology, New York, Oxford University Press, 1998, pp. 591-632.