POLARIZACIÓN Y CONFLICTO SOCIAL


POLARIZATION AND SOCIAL CONFLICT

Ernesto Cárdenas*

* Magíster en Economía, candidato a Doctor en Economía de la Universidad de Siena, coordinador del Grupo de Investigación en Historia y Pensamiento Económico y Director(e) del Centro de Investigación en Economía Política de la Facultad de Economía de la Universidad Externado de Colombia, Bogotá, Colombia, [ernesto.cardenas@uexternado.edu.co]. Agradezco la colaboración de Carlos Gradín. Fecha de recepción: 4 de abril de 2011, fecha de modificación: 22 de abril de 2011, fecha de aceptación: 25 de abril de 2011.


RESUMEN

[Palabras clave: desigualdad, polarización, conflicto social; JEL: D74]

En este ensayo se presenta la teoría de la polarización desarrollada en economía, su relevancia para explicar el surgimiento de conflictos sociales y sus principales diferencias con la teoría más conocida de la desigualdad. En particular, se resume la estructura de identificación-distanciamiento desarrollada por Esteban y Ray, así como el índice propuesto por estos mismos autores y algunas de sus extensiones, como la polarización explicada y la polarización de grupos.

ABSTRACT

[Keywords: inequality, polarization, social conflict; JEL: D74]

Polarization seems to be a more accurate concept for the explanation of the emergence of social conflicts than that of inequality. This paper succinctly presents both concepts and summarizes the theory and index of economic polarization developed by Esteban and Ray within its identification-alienation framework and some of its extensions such as the group and explained polarization.


Pienso que las sociedades con mayores niveles de polarización tienen más probabilidades de enfrentar conflictos sociales, tipo guerra civil, y que una comprensión sistemática del concepto de polarización puede ayudar a diseñar y evaluar políticas públicas que atenúen o solucionen estos conflictos; idea que ha motivado mi trabajo en estos últimos años. Inicié la investigación con el estudio de la que en su momento era la explicación “natural” de esos conflictos y que, palabras más palabras menos, los explicaba en términos de desigualdad. Esa explicación no me dejó satisfecho y me dediqué a estudiar el concepto de polarización, que consideré más apropiado: de hecho, el concepto de desigualdad se puede como una condición necesaria pero no suficiente para la polarización y considerar a esta última más pertinente para explicar el surgimiento de conflictos sociales.

En mi afán por entender estos conceptos, no sólo sus fundamentos teóricos sino también su aplicación práctica, hice un trabajo en el que doy cuenta de la estructura teórica subyacente a ambos conceptos y estimo un índice de polarización con todos sus componentes para Bogotá (Cárdenas, 2011a). Luego percibí la necesidad de articular las estructuras económicas y políticas para entender los resultados sociales que observamos, y me dediqué a construir un modelo de economía política donde hay polarización en la estructura productiva y en la estructura política, el cual muestra que cambios en variables objetivas, como los precios, afectan la probabilidad del surgimiento de conflictos sociales (Cárdenas, 2011b). El caso reciente de Egipto se puede analizar a la luz de ese modelo. Posteriormente, entendiendo que una manera de atenuar la polarización es considerar las múltiples dimensiones que caracterizan a las relaciones sociales y no sólo una de ellas, introduje las nociones básicas del concepto de polarización en la teoría de redes e ideé un modelo que permite analizar la polarización de una manera multidimensional (Cárdenas, 2011c).

En este escrito me limito a presentar con algún detalle la teoría de la polarización que se ha desarrollado en economía, y a mostrar sus diferencias con la teoría de la desigualdad, más conocida, y su relevancia para explicar conflictos sociales.

Marx, quizá el primer economista que abordó la noción de polarización y su relación con el conflicto social, destacó la existencia de dos grupos bien definidos y enfrentados en un conflicto social: trabajadores y capitalistas. No obstante, la falta de una teoría de la polarización pospuso al análisis sistemático de este fenómeno hasta hace poco. En las ciencias sociales, la noción de polarización se ha abordado en forma difusa y sin una clara comprensión de los canales a través de los cuales afecta la probabilidad de que aparezcan conflictos sociales. En economía, por ejemplo, el primer capítulo del célebre trabajo de Amartya Sen “sobre la desigualdad económica” (1997) comienza así: “La relación entre desigualdad y rebelión es de hecho muy cercana y se da en ambos sentidos”. Pero no aclara los canales a través de los cuales dicha relación ocurre. Además, ¿estamos seguros de que la desigualdad es el concepto relevante para explicar rebeliones o conflictos sociales?

Parece que el concepto de polarización tiene una relación más estrecha con los conflictos sociales que el de desigualdad, y que es más útil para explicarlos. Para ser más preciso, la desigualdad es una condición necesaria pero no suficiente. Es entonces importante aclarar las diferencias teóricas entre estos dos conceptos, porque pueden dar luz a la hora de ejecutar y evaluar las decisiones de política económica.

Desde un punto de vista más general es justo reconocer que la idea de que una sociedad polarizada tiene más probabilidades de sufrir conflictos sociales no es exclusiva de la economía. Sociólogos y politólogos como Simmel (1922), Gurr (1970) y Tilly (1978), entre otros, también percibieron esta relación. No obstante, la falta de una teoría de la polarización propia de estas disciplinas obliga a que este escrito se base en la teoría desarrollada recientemente en economía.

En la primera sección se revisa el concepto de desigualdad y los axiomas básicos necesarios para construir una medida apropiada. Luego, para hacer comprensible la comparación con medidas de polarización se presenta el indicador de desigualdad que se suele utilizar en economía, el coeficiente de Gini. En la segunda sección se presentan en detalle la teoría de la polarización desarrollada en economía y los axiomas básicos necesarios para construir una medida apropiada, así como el indicador que proponen Esteban y Ray, el de más amplia utilización. Además se presentan algunas extensiones de este indicador, como la polarización de grupo y la polarización explicada. Por último se presentan las conclusiones.

LA DESIGUALDAD EN ECONOMÍA

La presentación de la noción de desigualdad en economía facilita la comprensión de la polarización, un concepto relacionado pero diferente. El análisis exhaustivo del concepto de desigualdad excede los límites de este escrito; aquí sólo presento sus componentes fundamentales para que el lector entienda más fácilmente la noción de polarización en cuanto está relacionada con la desigualdad1.

CÓMO SE DEFINE LA DESIGUALDAD EN ECONOMÍA

Cuando se habla de desigualdad cabe preguntar cuál es su significado y, de manera natural, cuál es el concepto de justicia en general y de justicia económica en particular. Filósofos, sociólogos, politólogos, estadísticos y economistas han dedicado tiempo y esfuerzo a estos temas. Aquí me limito a la definición de desigualdad económica en términos de ingresos, no porque crea que la desigualdad se limite al ingreso o a la riqueza sino porque se suele aceptar que el ingreso es un componente fundamental de otras formas de desigualdad.

En forma sucinta, la desigualdad económica se puede definir como la disparidad fundamental que hace posibles ciertas elecciones materiales a un individuo y se las impide a otros (Ray, 1998). Esta noción de desigualdad se sintetiza en un indicador, mediante una regla que asigna un grado de desigualdad a cada posible distribución del ingreso o la riqueza. Para que esa regla sea apropiada debe satisfacer un conjunto mínimo de requerimientos tales como anonimidad, independencia con respecto al tamaño de la población y a niveles absolutos de ingreso, y el criterio de Dalton. Niveles superiores del indicador indican mayores niveles de desigualdad.

Para ser más concreto, sea I = I(y1, y2, ..., yn) una función definida sobre todas las posibles distribuciones de ingreso y = (y1, y2, ..., yn), donde yi representa el ingreso del individuo i = 1,..., n para cualquier entero positivo n. La función I se puede interpretar como una medida de desigualdad si satisface los requerimientos mínimos mencionados y que formalizo a continuación:

Criterio de anonimidad: dada una distribución del ingreso y, las permutaciones de ingresos entre individuos no deben alterar la medida de desigualdad.

Criterio de independencia con respecto a la población: cualquier población, independientemente de su tamaño, con las mismas proporciones de población que obtienen los mismos niveles de ingreso debe tener la misma medida de desigualdad.

I(y1, y2, ..., yn) = I(y1, y2, ..., yn; y1, y2, ..., yn)

Criterio de independencia con respecto al ingreso relativo: cualquier población, independientemente de sus niveles absolutos de ingreso, con los mismos valores de ingreso relativos debe tener la misma medida de desigualdad.

I(y1, y2, ..., yn) = I(ρy1, ρy2, ..., ρyn) para cualquier ρ > 0

Criterio de Dalton: el principio de Dalton, propuesto en 1920, dice que si una distribución del ingreso se puede obtener a partir de la construcción de una secuencia regresiva de transferencias de otra distribución, la primera debe ser más desigual que la segunda. En otras palabras, cualquier transferencia de ingreso de yi hacia yj, con yi = yj, incrementa la desigualdad.

La medida de desigualdad I satisface el principio de Dalton si para cada distribución del ingreso y, y para cada transferencia δ > 0

I(y1, y2, ..., yi, ..., yj, ..., yn) < I(y1, y2, ..., yi - δ, ..., yj + δ, ..., yn),

toda vez que yi = yj.

En economía se han propuesto diversas medidas de desigualdad, desde la más simple, como el rango, hasta las más sofisticadas, como la medida de entropía de Theil, pasando por el coeficiente de Gini2.

Antes de explicar la medida más popular de desigualdad en economía, el coeficiente de Gini, presento brevemente la curva de Lorenz, no solo porque facilita la comprensión del coeficiente de Gini, sino porque agrupa los cuatro criterios anteriores en uno solo, el criterio de Lorenz.

La curva de Lorenz

La curva de Lorenz es una representación gráfica de la distribución del ingreso en una sociedad. Para obtener dicha curva, la sociedad se ordena en porcentajes acumulativos de ingreso, desde el más pobre hasta el más rico, en el eje horizontal, y los porcentajes del ingreso que obtiene cada fracción de la población se miden en el eje vertical.

Gráfica 1
Curva de Lorenz

Por ejemplo, el punto A de la gráfica 1 indica que el 20% acumulado de la población más pobre recibe el 10% del ingreso acumulado; el punto B indica que el 40% acumulado de la población más pobre recibe el 65% del ingreso acumulado y así sucesivamente.

Se deben resaltar tres propiedades importantes de la curva de Lorenz. Primera, la curva empieza y termina sobre la línea de 45° que divide el plano en dos; esto significa que el 0% más pobre de la población recibe el 0% del ingreso y que el 100% más pobre recibe el 100% del ingreso. Segunda, la curva de Lorenz nunca puede tener una pendiente menor cuando nos desplazamos sobre ella de izquierda a derecha, puesto que la pendiente en cualquier punto de la curva representa la contribución marginal de un individuo particular a la fracción de ingreso nacional acumulada hasta ese punto y ordenado a los individuos empezando por el más pobre y terminando en el más rico; de modo que la pendiente no puede disminuir. Tercera, si cada individuo gana el mismo monto de ingreso la curva de Lorenz coincide con la línea de 45°. Cualquier punto sobre la línea diagonal de 45° indica que y = x, lo que significa, por ejemplo, que el 10% más pobre gana el 10% del ingreso nacional y así sucesivamente. En otras palabras, el ingreso nacional se distribuye de igual manera entre los individuos de la población. De hecho, la línea de 45° se llama línea de igualdad total.

Es fácil tener una idea intuitiva del nivel de desigualdad en una sociedad observando su curva de Lorenz: cuanto entre mayor sea el área entre la línea de igualdad total y la curva de Lorenz mayor será el nivel de desigualdad en esa sociedad. Como ya mencioné, la curva de Lorenz es importante porque resume en un solo criterio los cuatro criterios enunciados al inicio de la sección que debe cumplir una medida adecuada de desigualdad.

Criterio de Lorenz: la medida de desigualdad I satisface el criterio de Lorenz si para cada par de distribuciones de ingresos y y z, I(y1, y2, ..., yn) ≥ I(z1, z2, ..., zn) pues la curva de Lorenz de la distribución y se encuentra en todos sus puntos a la derecha de la distribución z.

Una medida de desigualdad es consistente con el criterio de Lorenz si y solo si satisface simultáneamente los criterios de anonimidad, independencia con respecto a la población, independencia con respecto al ingreso relativo y el principio de Dalton (ver Foster, 1985).

EL COEFICIENTE DE GINI: UN ÍNDICE DE DESIGUALDAD ECONÓMICA

La curva de Lorenz es un indicador de la desigualdad en cualquier sociedad, pero en sí misma no mide la desigualdad, el coeficiente de Gini sí la mide.

El coeficiente de Gini, propuesto en 1912, mide la diferencia entre la línea de igualdad total y la curva de Lorenz, y la expresa como una relación con respecto a la región triangular situada por debajo de la línea de 45°. Formalmente, se define como:

La fórmula del coeficiente de Gini se puede ver como la normalización de la suma de los valores absolutos de las diferencias entre todos los pares posibles de ingreso en una distribución. Esa sumatoria se normaliza dividiéndola por 2, el cuadrado de la población y su ingreso promedio, debido a que al hacer todas las comparaciones de ingresos entre pares de individuos cada yi - yj se cuenta dos veces (aparece otra vez cuando calculamos yj - yi), y entonces hay que dividir por 2; el segundo divisor ajusta la sumatoria con respecto al tamaño de la población, el número de todos los pares posibles de ingresos comparables es n2; el ingreso promedio, μ, normaliza el ingreso. Para los propósitos de este trabajo es importante señalar que el coeficiente de Gini se basa en comparaciones individuales de ingreso (no de grupos) y que el individuo ni tiene el mismo peso de cualquier otro nj en la población; ambos están elevados a la potencia 1.

LA POLARIZACIÓN EN ECONOMÍA

En esta sección presento la teoría de la polarización desarrollada en economía que se resume en el índice de polarización de Esteban-Gradín-Ray (EGR). Primero presento el concepto de polarización desarrollado por Esteban y Ray (1994) y algunos de sus refinamientos teóricos, en particular los de Esteban, Gradín y Ray (1999), Gradín (1999) y Esteban, Duclos y Ray (2004).

La propuesta de una definición axiomática y de una medida del concepto de polarización se inició, de manera independiente, con los trabajos de Esteban y Ray (1994) y Wolfson (1994). El primero de ellos define formalmente el concepto de polarización de tal modo que supera una debilidad de las medidas tradicionales de desigualdad a la hora de incorporar interpretaciones más amplias de distancia social en términos económicos. Aunque esta interpretación no es nueva, relaciona sociedades divididas en pocos grupos homogéneos en su interior y distantes entre sí con el incremento de la probabilidad de situaciones conflictivas. En otras palabras, Esteban y Ray llegan al índice de polarización mediante el estudio de las medidas de desigualdad. Con un enfoque diferente, el trabajo de Wolfson presenta una definición formal del concepto de polarización ante la necesidad de diferenciar el fenómeno de “desaparición de la clase media” y el proceso más general de desigualdad económica. Wolfson identifica la desaparición de la clase media, detectada en los estudios de la variación de la distribución del ingreso en América Latina a comienzos de los ochenta, con el concepto de polarización.

Como ya mencioné, en este escrito presento la estructura teórica de Esteban y Ray, y no la de Wolfson, porque se puede demostrar que el índice de polarización de Wolfson es un caso particular del índice de polarización de Esteban y Ray.

CÓMO SE DEFINE LA POLARIZACIÓN

Supongamos que podemos observar la distribución de un conjunto de atributos Y en una población. Si la distribución describe una población agrupada en torno a pocos polos, pero diferentes, podemos decir que la población está polarizada respecto del conjunto de características Y. El conjunto de atributos puede incluir varias características, pero en la práctica usualmente sólo contiene uno, por ejemplo, preferencias políticas o religiosas, ingreso, etc. Si el conjunto de atributos se reduce a ingresos o riqueza decimos que la población presenta polarización económica.

Para facilitar la comprensión del concepto, consideremos el siguiente ejemplo: supongamos que la segunda columna del cuadro 1 reporta los niveles de ingreso de diez países cuyas economías son cerradas, es decir, que no tienen comercio exterior. Y, además, que esos países deciden abrir sus fronteras al comercio internacional para reducir los niveles de desigualdad. La tercera columna reporta los ingresos de esos mismos países después de 5 años de comercio internacional.

Cuadro 1


Las dos distribuciones del ingreso, antes y después de los acuerdos de libre comercio, se representan en las gráficas 2 y 3 respectivamente.

Gráfica 2

Gráfica 3

El ingreso promedio de la primera distribución es de μ = 5,5 unidades. La segunda distribución, después de 5 años de libre comercio, se puede ver como una redistribución de transferencias a partir de la primera distribución. Los países con un ingreso superior al promedio convergen a un promedio local de μa = 8 unidades, mientras que los países con ingreso inferior al promedio convergen al promedio local de μb = 3 unidades. Al comparar estas dos distribuciones siempre se debe tener, con cualquier medida de desigualdad basada en el principio de Dalton, que el nivel de desigualdad disminuye al pasar de la primera a la segunda, pero en este caso el nivel de polarización ha aumentado claramente.

Este ejemplo muestra que la polarización es diferente de la desigualdad; en efecto, puede haber una reducción de los niveles de desigualdad junto con un aumento de los niveles de polarización3.

En la segunda distribución, la que se obtiene luego de las transferencias, los países forman dos grupos, uno alrededor de μa y otro alrededor de μb, con un aumento de la distancia entre los dos grupos. Es decir, surgen dos grupos homogéneos que muestran una distancia significativa, o heterogeneidad, entre ellos. Estas dos características, homogeneidad dentro de los grupos y heterogeneidad entre grupos son los elementos claves cuando se habla de polarización y constituyen el núcleo de la teoría de identificación-distanciamiento propuesta por Esteban y Ray: si la distribución de una población con respecto a un conjunto de características particulares se reúne en pocos grupos, de tal modo que los atributos de los miembros de cada grupo son muy similares y los atributos de los miembros de los diferentes grupos son muy distintos, se puede decir que la población es polarizada. Es la literatura especializada se dice que los miembros de cada grupo tienen un gran sentido de identificación y que hay un gran sentimiento de distanciamiento entre grupos.

UN ÍNDICE DE POLARIZACIÓN4

¿Cómo medir polarización en economía? Hasta ahora debería ser claro que una medida de polarización debe incorporar tres elementos básicos: a) debe existir un número pequeño de grupos pero representativos de la sociedad5; b) un individuo que pertenece a uno de los grupos debe sentirse muy identificado con los demás miembros de su grupo, y c) individuos pertenecientes a un mismo grupo deben sentirse distantes de los miembros de otros grupos.

Formalmente, consideremos que la pareja de vectores (π, y) representa una distribución del ingreso donde πi Î π es la fracción de la población situada en el nivel de ingreso yi Î y. El vector y está ordenado de tal modo que yi ≤ yi + 1 para todo i = 1,..., n y el total de la población asociado con (π, y) está dado por πi y π > 0. Así, una medida de polarización (P) es una función P: (π, y) ® R+.

El sentimiento de identificación dentro de los grupos se representa mediante una función continua y creciente, la función de identificación I(πi): R+ ® R+, para todo i, donde πi > 0 es la medida de personas del mismo grupo de ingresos del individuo i, yi. El sentimiento de distanciamiento del individuo yi con respecto al individuo yj se representa mediante una función continua y no decreciente, la función de distanciamiento a(δ(yi, yj)): R+ ® R+, con δ(yi, yj) = |yi - yj|.

Los sentimientos de distanciamiento y de identificación se suponen simétricos, es decir, el distanciamiento y la identificación que siente el individuo yi con respecto a yj son iguales a los que siente el individuo yj con respecto a yi.

Finalmente, la polarización total en una sociedad se define como la suma de todos los antagonismos efectivos T(I, a), es decir, como la suma de todos los sentimientos de distanciamiento y de identificación entre los individuos de manera simultanea.

donde T(I, a) es una función estrictamente creciente en a y T(I, 0) = 0.

La ecuación (2) se puede ver como una forma funcional general de una medida de polarización. La medida particular de polarización depende de la elección específica de las funciones I, a, y T.

Igual que en el caso de medidas de desigualdad, una medida de polarización debe satisfacer ciertos axiomas o principios deseables:

Axioma 1: Dadas unas masas de población p > 0, q > 0 con p > q, si la masa p se sitúa en el nivel yo y dos masas q una en el nivel yx y la otra en el nivel yz tal que yo < yx < yz, existe un ε > 0 y un μ > 0 (que dependen de π y de yx), de tal modo que si δ(yx, yz) < ε y q < μp la unión de las dos masas q en su punto intermedio, (x + y)/2, aumenta el nivel de polarización.

Este axioma refleja la siguiente intuición: si unimos las dos poblaciones pequeñas, manteniendo constante su distancia promedio con respecto a la tercera población, la polarización debería aumentar.

Axioma 2: Dadas unas masas de población p > 0, q > 0 y r > 0 con p > r, si la masa π se sitúa en el nivel yo, q en el nivel yx y r en el nivel yz con yo < yx < yz y yx > |yx - yz|, e xiste un ε > 0 tal que si la masa de población q se desplaza a la derecha (en dirección de r) en una cantidad que no excede a e, el nivel de polarización debería aumentar.

Este axioma refleja la siguiente intuición: la masa de población p es más grande que la masa r. Además, la masa q situada entre las masas p y r está ubicada al menos tan cerca del segundo grupo como lo está del primero. Así, cambios pequeños en la posición del grupo q hacia el grupo más cercano y más pequeño deberían aumentar el nivel de polarización.

Axioma 3: Dadas unas masas de población q > 0, se sitúa una masa q en el nivel y x. Cualquier nueva distribución formada a partir de cambios en la masa central q en dos masas laterales, π y r, cada una de ellas situada a d unidades de distancia de y x, debería aumentar los niveles de polarización.

Este axioma refleja la siguiente intuición: si la masa de población del medio se divide en dos grupos iguales separados uno del otro, el nivel de polarización debería aumentar.

La medida de polarización que proponen Esteban y Ray satisface estos tres axiomas, y está dada por:

para cualquier constante K > 0 y α Î (0, 1,6]. Aquí a = |yi - yj|, I = πiα y T = aI. En adelante me referiré a esta medida como índice de polarización de Esteban-Ray (ER).

Es importante destacar una deferencia importante entre una medida de polarización y una de desigualdad: la de polarización tiene en cuenta la existencia de grupos y su importancia relativa, de hecho asigna pesos, α, a cada grupo que compone la población objeto de la medida, en vez de hacer comparaciones entre individuos como hace el coeficiente de Gini, una medida de desigualdad.

DOS CONSIDERACIONES SOBRE EL ÍNDICE DE POLARIZACIÓN ER

El índice ER se basa en una distribución discreta de grupos de ingreso, es decir, en un número finito de grupos de ingreso, y esto trae consigo dos dificultades. Primera, dada cualquier distribución, se supone que está distribuida de antemano en grupos de acuerdo con la estructura de identificación y distanciamiento descrita anteriormente. Segunda, el índice de polarización ER es, por tanto, una medida discontinua.

EL PROBLEMA DE LA AGRUPACIÓN ÓPTIMA, LA CONTRIBUCIÓN DE GRADÍN

La intuición que se refleja en el primer problema del índice ER es que trata a los individuos pertenecientes a cada uno de los grupos como un grupo unificado, sin tener en cuenta la dispersión que existe entre esos individuos en la distribución original. Gradín, Esteban y Ray (1999) propusieron una solución a este problema de agrupación óptima6.

La solución consiste en corregir el índice ER por un factor que capte la dispersión de los miembros de cada grupo. La medida que incluye dicha corrección recibe el nombre de índice de polarización extendida (en adelante EGR) y se formaliza de la siguiente manera:

donde ¦ es la función de distribución original de los datos, ρ* la agrupación óptima en n grupos de la distribución original, G( ·) el coeficiente de Gini sobre la distribución respectiva y β el peso que se asigna al término de error en el proceso de agrupación, [G(F) - G(ρ*)].

Cabe señalar que el número de grupos, n, sigue siendo una decisión arbitraria, exógena, mientras que la localización de los grupos se hace endógena mediante la agrupación (partición) óptima, ρ*, de la distribución original.

En términos gráficos, la agrupación óptima de la distribución original equivale a transformar la curva de Lorenz de la distribución original en una curva de Lorenz formada por n segmentos lineales. El proceso de encontrar la ubicación óptima de los grupos equivale a minimizar el área entre la curva de Lorenz original y la curva formada por n segmentos lineales (Esteban, Gradín y Ray, 1999). Por esta razón podemos escribir la falta de identificación o término de error como ε(f, ρ*) = [G(f) - G(ρ*)].

EL PROBLEMA DE LA DISCONTINUIDAD, LA CONTRIBUCIÓN DE DUCLOS

El trabajo de Duclos, Esteban y Ray (en adelante DER) propone una solución al segundo problema del índice ER, el de la discontinuidad, que consiste en establecer los axiomas necesarios para una medida de polarización antes descritos, pero para el caso de distribuciones continuas. Además, y como solución alterna al problema de la agrupación óptima utiliza métodos no paramétricos, la distribución de Kernel, para encontrar la ubicación óptima de los grupos. El índice DER está dado por:

donde α Î [0,25, 1] por razones técnicas (Duclos, Esteban y Ray, 2004).

INTERPRETACIÓN DE LA POLARIZACIÓN ECONÓMICA

Hasta ahora me he concentrado en los fundamentos teóricos de la teoría de polarización en economía, en particular en la estructura de identificación y distanciamiento, y en la manera de medirla, propuestas por Esteban y Ray. Ahora paso a la interpretación socioeconómica del índice y de sus componentes.

No hay duda de que variables tales como la edad, la educación o la capacidad innata de los individuos se relacionan con sus niveles de ingresos y, así, con los niveles de polarización económica. Es natural, entonces, que el siguiente paso en el estudio de la polarización sea el análisis de las posibles relaciones causales entre diferentes variables socioeconómicas y sus efectos sobre los niveles de polarización. Conozco dos herramientas teóricas que se han aplicado con este fin, polarización de grupo y polarización explicada, propuestas por Carlos Gradín (2000), que explico a continuación.

POLARIZACIÓN DE GRUPOS

La polarización de grupos (GP) es una herramienta para analizar los efectos de las variables socioeconómicas sobre los niveles de polarización. La idea básica no es sencilla. Consideremos una característica diferente del ingreso -por ejemplo., edad, ocupación, religión, raza o educación-que permita hacer una partición exhaustiva de la población en k grupos. Las características más relevantes serán aquellas que muestren simultáneamente altos niveles de polarización entre grupos y altos niveles de homogeneidad dentro de ellos.

Para emplear esta medida de polarización de grupos se especifica una característica c que produzca una partición de la población en k grupos, ρc(q, x) = (q1, q2 ,..., qk; x1, x2 ,..., xk), donde qi representa la fracción de la población en el grupo i y x1 ≤ x2 ≤ ... ≤ xk indican el ingreso promedio de cada grupo. El índice de polarización de grupo (PGP) se define como el nivel de polarización que se encuentra a partir de la partición exógena ρc que representa la distribución F, es decir:

Aquí los grupos no provienen necesariamente de diferentes intervalos en términos de ingreso; son generados exógenamente a partir de diferentes características socioeconómicas y están formados por quienes comparten tales características. Dada la posibilidad de obtener valores negativos, el índice PGP se normaliza de la siguiente manera:

POLARIZACIÓN EXPLICADA

Una segunda herramienta para analizar el efecto de las variables socioeconómicas sobre los niveles de polarización es la polarización explicada (EP). Este concepto refleja la siguiente intuición: puesto que no hay una razón a priori para suponer que conocemos las características socioeconómicas más relevantes para explicar la polarización, lo que se supone implícitamente cuando se calcula la polarización de grupo, usamos entonces el ingreso como proxy del resto de variables socioeconómicas y buscamos aquellas características que expliquen mejor el sentimiento de distanciamiento entre grupos en términos de ingreso, porque los individuos pertenecen a cada grupo justamente porque comparten esta característica.

Formalmente, sea ρ* (π, y, z) = (π1, π2 ,..., πn; y1, y2 ,..., yn; z0, z1 ,..., zn) la partición óptima que usamos para estimar la polarización en términos de ingreso sobre la distribución (π, y), donde πi es la fracción de la población en el grupo i, situado en el intervalo [zj - 1, zj ] y yi es el ingreso promedio del grupo i. Luego supongamos que la característica c es la característica socioeconómica relevante para explicar la polarización económica. El método sugiere hacer una nueva partición de la distribución original, ahora basada en c. Sea ρc(q, x) = (q1, q2 ,..., qk; x1, x2 ,..., xk) la nueva partición. Esta vez, qj es la fracción de la población en el grupo j y x1 ≤ x2 ≤ ... ≤ xk los ingresos promedio de los grupos. Ahora no tenemos intervalos de ingresos para la ubicación de los grupos debido precisamente a que los grupos son determinados a partir de la característica c.

Entonces podemos definir una nueva partición ρ+ de (π, y) de la siguiente manera: los individuos del primer grupo son todos los individuos en ρc cuyo nivel de ingreso promedio está en el intervalo [z0, z1]; los individuos del segundo grupo son todos los individuos en ρc cuyo nivel de ingreso promedio está en el intervalo [z1, z2] y así sucesivamente. Esta partición esta dada por ρ+(r, w, z) = (r1, r2 ,..., rn; w1, w2 ,..., wn; z0, z1 ,..., z1). Aquí, ri es la fracción de la población en el grupo i, ubicada en el intervalo [zj - 1, zj ] y wi es el ingreso promedio del grupo i7.

Para fijar las ideas consideremos el siguiente ejemplo. Sea ρ* (π, y, z) la partición óptima de una distribución para dos grupos de ingreso, el primero formado por todos los individuos cuyo nivel de ingreso es inferior al ingreso promedio de la distribución y el segundo formado por aquellos cuyo ingreso es superior al promedio. Sea ρc(q, x) una nueva partición de la distribución original en dos grupos basada en la ubicación geográfica, por ejemplo, población urbana y rural. Calculamos el ingreso promedio de cada uno de los grupos en ρc y observamos si están por encima o por debajo del ingreso promedio en ρ*. Para propósitos ilustrativos supongamos que el ingreso promedio en el área rural es inferior al de la distribución original mientras que el urbano es superior. Luego, arreglamos la nueva partición ρ+(r, w, z). Esta partición tendrá en el primer grupo, r1, a todos los individuos que pertenecen a q1 en ρc, es decir, a los que viven en áreas rurales, y en el segundo grupo, r2, a todos los que pertenecen a q2 en ρc, es decir, a los que viven en áreas urbanas. El hecho importante es que, en esta nueva distribución, ρ+, las personas cuyo ingreso es superior al promedio de la distribución original pero viven en áreas rurales pertenecerán al primer grupo.

Si la medida de polarización calculada con base en la partición ρ+, a partir de la característica c, es igual a la medida calculada con base en la partición ρ*, decimos que la característica c explica totalmente el nivel de polarización económica en ρ*. En general, cuanto más alto sea el índice de polarización explicada EP mayor será la fracción que explica la característica c. El índice EP será igual a 1 si ρ+ = ρ y será igual a 0 si no hay polarización entre los grupos dada la característica c.

En la práctica el índice EP se calcula de la siguiente manera:

PROBLEMA DE SIMULTANEIDAD

Desde mi punto de vista es importante señalar lo que denominaría “problema de simultaneidad” cuando se analiza la causalidad entre variables socioeconómicas y niveles de polarización, por ejemplo, mediante la polarización de grupos o la polarización explicada. En concreto: es posible que diferentes individuos tengan diferentes características socioeconómicas precisamente porque tienen diferentes niveles de ingreso.

CONCLUSIONES

Es importante distinguir entre polarización y desigualdad debido a que la polarización tiene una relación más estrecha con el surgimiento de conflictos sociales tipo guerra civil que la desigualdad. En términos formales, la polarización es claramente diferente de la desigualdad cuando los distintos grupos de la población se ponderan de manera diferente, una característica que hace que este concepto sea más apropiado para explicar el surgimiento de conflictos sociales. Supongamos que podemos observar la distribución de un conjunto de atributos Y en una población. Si la distribución muestra una agrupación en torno a pocos polos, pero diferentes, la población está polarizada en términos del conjunto de características Y. Estas características son la base de la teoría de la polarización de Esteban y Ray. Si nos concentramos en la riqueza o el ingreso de los individuos como que caracteriza la distribución de la población, hablamos de polarización económica.

La polarización de grupo y la polarización explicada ayudan a explicar la relación entre diferentes características socioeconómicas de los individuos y la pertenencia a un grupo de ingresos. No obstante, es importante tener en cuenta que diferentes individuos pueden tener diferentes características socioeconómicas precisamente porque tienen niveles de ingreso diferentes, a lo que denomino problema de simultaneidad.

Desde una perspectiva más general, para desactivar conflictos sociales se requiere una elaborar una visión multidimensional del fenómeno de la polarización. En otro escrito (Cárdenas, 2011c) recurro a la teoría de redes para avanzar en esa dirección.

NOTAS AL PIE

1. El lector interesado en la desigualdad puede remitirse a los trabajos de Sen y Foster (1997) o al de Silber (1999).

2. El rango, quizá la medida más simple de desigualdad económica, resulta de la comparación entre los dos valores extremos de una distribución del ingreso como relación con respecto a su ingreso promedio: R = (Maxiyi ­ Miniyi)/ μ.

La medida de entropía de Theil está dada por: T = log(n) - H(x), donde H(x) = xilog(1/xi), y resulta de la comparación entre el valor máximo de H(x) y su valor actual para la distribución del ingreso dada. Si la distribución del ingreso resulta ser aquella en la que cada persona obtiene la misma proporción del ingreso, xi = 1/n, H(x) alcanza su valor máximo H(X) = log(n) y por lo tanto T = 0. Por el contrario, en el caso de completa desigualdad H(X) = 0 y por tanto T = log(n).

Para una revisión de las principales medidas de desigualdad, ver Sen (1997, cap. 2). nota al pie

3. Aunque la polarización es diferente de la desigualdad, esto no significa que los dos conceptos sean necesariamente opuestos, sólo son diferentes. De hecho, es posible que aumente la polarización al tiempo que aumenta la desigualdad (Esteban y Ray 1994).

4. Para un análisis comparativo de diferentes medidas de polarización, ver Esteban y Ray (2011).

5. Se podría pensar en grupos que no sean significativos e incluso en individuos, pero la probabilidad de que se inicie un conflicto social en esos casos es insignificante.

6. El problema de agrupación óptima es el siguiente: dada una distribución del ingreso, hay que dividirla en grupos de tal modo que las diferencias de ingreso dentro de los grupos sean mínimas y entre los grupos sean máximas (ver Aghevli y Mehran, 1981).

7. Podemos expresar ri y wi como: rj =


REFERENCIAS BIBLIOGRÁFICAS

1. Aghevli, B. y F. Mehran. “Optimal grouping of income distribution data”, Journal of the American Statistical Association 76, 1981, pp. 22-26.

2. Cárdenas, E. “Analizyng polarization: Evidence from Bogotá”, tesis doctoral en Economía, Universidad de Siena, 2011a.

3. Cárdenas, E. “A political economy model of social polarization and civil war”, tesis doctoral en Economía, Universidad de Siena, 2011b.

4. Cárdenas, E. “Polarization and social conflict: A network approach”, tesis doctoral en Economía, Universidad de Siena, 2011c.

5. Dalton, H. “The measurement of the inequality of incomes”, Economic Journal 30, 1920.

6. Duclos, J., J. Esteban y D. Ray. “Polarization: C concepts, measurement, estimation”, Econometrica 72, 2004, pp. 1737-1772.

7. Esteban, J. y D. Ray. “Conflict and distribution”, Journal of Economic Theory 87, 1999, pp. 379-415.

8. Esteban, J. y D. Ray. “On the measurement of polarization”, Econometrica 62, 1994, pp. 819-851.

9. Esteban, J., C. Gradín y D. Ray. “Comparing polarization measures”, Oxford Handbook of the Economics of Peace and Conflict, Oxford, Oxford University Press, 2011.

10. Esteban, J., C. Gradín y D. Ray. “Extensions of a measure of polarization, with an application to the income distribution of five OECD countries”, mimeo, Instituto de Análisis Económico de Galicia, 1999.

11. Gini, C. Variabilità e mutabilità, Bologna, Università di Cagliari, 1912.

12. Gradín, C. “Polarization by sub-populations in Spain, 1973-91”, Review of Income and Wealth 46, 2000, pp. 457-474.

13. Gurr, T. R. Why men rebel, Princeton, Princeton University Press, 1970.

14. Love, R. y M. C. Wolfson. “Income inequality: Statistical methodology and Canadian illustrations”, Catalogue 13-3559 Occasional Statistics Canada, 1976.

15. Ray, D. Development economics, Princeton, Princeton University Press, 1988.

16. Sen, A. K. y J. E. Foster. On economic inequality, Oxford, Clarendon Press, 1997.

17. Silber, J. Handbook of income inequality measurement, Boston, Kluwer Academic Publishers, 1999.

18. Simmel, G. Conflict and the web of group affiliations, 1922, Glencoe, Free Press, 1955.

19. Tilly, Ch. From mobilization to revolution, New York, McGraw-Hill, 1978.

20. Wolfson, M. “When inequalities diverge”, American Economic Review 84, 1994, pp. 353-358.

21. Wolfson, M. “Divergent inequalities: Theory and empirical results”, Review of Income and Wealth 43, 1997, pp. 401-421.