domingo, 4 de noviembre de 2018

Cuotas de mujeres en las empresas, ¿realmente funcionan? El caso de Noruega

Una de las últimas iniciativas de nuestro gobierno es imponer cuotas de mujeres [1] en las cúpulas directivas de las empresas. Las motivaciones son variadas: romper el techo de cristal, luchar contra la discriminación hacia las mujeres, acabar con la brecha salarial... Pero no es el objetivo de este artículo criticar las motivaciones ideológicas detrás de semejante iniciativa.

En el artículo voy a comentar diferentes estudios que analizan los efectos de la cuota que se impuso en Noruega durante la década pasada para saber qué efectos tiene, si es que tiene alguno.

El caso de Noruega

En diciembre de 2003, el parlamento noruego aprobó una ley única en su especie que pedía a todas las public limited firms* que tuvieran al menos un 40% de representación femenina en sus mesas de dirección para julio de 2005. Cuando llegó el final del plazo, las mujeres sólo tenían una representación del 9%, así que en enero de 2006 la ley pasó a ser obligatoria y dio un plazo de 2 años para su cumplimiento. En abril de 2008, todas las empresas requeridas cumplían con la norma.

Este evento es muy importante porque provoca un cambio exógeno en la estructura de las mesas de dirección de todas las empresas afectadas. ¿Y por qué es importante? Voy a poner un ejemplo sencillo: si detectas que las empresas con mujeres tienen alguna característica especial, no sabrías decir si las mujeres causan la aparición de dicha característica, o la presencia de esa característica causa que haya más mujeres. Sin embargo, la segunda parte del razonamiento no podría darse en este caso, ya que la causa de haya más mujeres es conocida: la cuota. Por tanto, se concluiría que las mujeres causan esa característica. Por supuesto, esto es sólo un ejemplo para entender el interés que tiene estudiar este fenómeno. La realidad, como veremos, es mucho más compleja.

Antes de comenzar, no voy a analizar los efectos en el precio de las acciones de las empresas afectadas debido al anuncio de las cuotas ya que los resultados son inconsistentes, tal y como apuntan Matsa y Miller (2012) [3] y Ferreira (2014) [4].

* En Noruega, este término se refiere a empresas con al menos 150.000$ de capital social y que cotizan en bolsa.

Resultados de las cuotas


Aher y Dittmar (2012)

El primer estudio que vamos a ver es Aher y Dittmar (2012) [2]. Estos autores comparan el valor en bolsa de las empresas entre 2002 y 2009 (antes y después de la cuota), y el resultado es:
The point estimate implies that a ten percent increase in the percentage of female directors leads to a decline in Tobin’s Q of 0.19, compared to the mean of 1.53 across all firms and years. This is a large effect on the value of firms [...].

The persistence in the value loss suggests that declines in firm value are not simply temporary overreactions by the stock market. Instead, the imposition of the quota appears to have affected the fundamentals of Norwegian firms. [...]

Firms with no female directors at the announcement of the gender quota lost over 3 percentage points in value compared to those with at least one female director. The instrumental variables estimates suggest that the forced addition of new female directors on boards led to value losses of upwards of 20 percent for the firms with large constraints.
Traducción:
El punto estimado implica que un incremento del diez por ciento en el porcentaje de directivas provoca una disminución en la Tobin's Q de 0,19, comparado con una media de 1,53 a lo largo de todas las empresas y años. Este es un gran efecto en el valor de las empresas [...].

La persistencia en la pérdida de valor sugiere que las disminuciones en el valor de las empresas no son reacciones exageradas temporales del mercado de valores. En su lugar, la imposición de la cuota parece que ha afectado a las bases de las empresas noruegas. [...]

Las empresas sin directivas en el momento del anuncio de la cuota de género perdieron más de 3 puntos porcentuales en su valor comparadas con aquellas con al menos una directiva. Las estimaciones de las variables instrumentales sugieren que la adición forzada de nuevas directivas en las mesas de dirección provocó unas pérdidas de valor de hasta el 20 por ciento en las empresas con grandes restricciones.
Al final de la cita dice "con grandes restricciones". Esas "restricciones" se refiere a la dificultad de las empresas para contratar nuevas directivas (ej.: porque tenía pocas o ninguna directiva en el momento del anuncio de la cuota, porque la empresa está en un sector con poca presencia femenina...).

El estudio encuentra algunos cambios en las políticas de las empresas que tuvieron que añadir mujeres debido a la cuota. Sobre todo un mayor endeudamiento, un incremento en el tamaño de las empresas (consistente con una mayor adquisición de activos) y un aumento del coste laboral (consistente con los resultados de Matsa y Miller (2012) [3]).
the firms most affected by the quota undertook significantly more acquisitions than those less affected. This is consistent with the increase in debt and reduction in cash [...] the significantly higher levels of acquisition expenditures are found in the later years in the sample, corresponding to years when firm value declined substantially. [...] The increase in acquisitions is also consistent with the result that the quota led to increases in firm size and employment.
Traducción:
Las empresas más afectadas por la cuota emprendieron significativamente más adquisiciones que aquellas menos afectadas. Esto es consistente con el incremento en deuda y la reducción de efectivo. [...] Los niveles significativamente más altos de gastos adquisitivos se encuentran en los últimos años de la muestra, correspondiendo a los años en los que el valor de las empresas se redujo sustancialmente. [...] El incremento en las adquisiciones también es consistente con el resultado de que la cuota llevó a aumentar el tamaño de la empresa y el empleo.
El estudio comenta que las mujeres que entraron eran menos experimentadas y más jóvenes que los directivos masculinos a los que sustituyeron (en general, el tamaño de las mesas de dirección no cambió). No está claro si el efecto observado en el estudio es debido a que las nuevas directivas son mujeres, son jóvenes, tienen menos experiencia o a cualquier combinación de las tres variables:
The negative effect of gender becomes insignificant when age and experience are included, which could imply that the effect is not driven by gender changes. However, we are careful to place little emphasis on such tests due to their inherent endogeneity. In addition, we cannot be sure that omitted variables do not confound these tests and affect their estimated magnitudes. For instance, age may be correlated with risk aversion and experience may proxy for a director’s social connections. However, our main results do provide strong casual evidence of the effect of the quota on value, board characteristics, and firm policies individually.
Traducción:
El efecto negativo del sexo [de las nuevas directivas] llega a ser insignificante cuando la edad y la experiencia se incluyen, lo que puede implicar que el efecto no está relacionado con los cambios de sexo. Sin embargo, somos cautos en poner poco énfasis en dichas pruebas debido a su endogenia inherente. Además, no podemos estar seguros de si hay variables omitidas que confundan estas pruebas y afecten a las magnitudes estimadas. Por ejemplo, la edad puede estar correlacionada con la aversión al riesgo y la experiencia puede ser un proxy para las relaciones sociales del directivo. Sin embargo, nuestros resultados principales proveen de fuertes evidencias causales del efecto de la cuota en el valor, características de la mesa de dirección y políticas de empresa por separado.
No se puede determinar si las empresas escogieron deliberadamente mujeres jóvenes y con poca experiencia para cumplir con las cuotas o si esas mujeres eran las mejores disponibles. No obstante, el estudio comenta que los directivos sustituidos fueron los más jóvenes e inexpertos de la mesa de dirección, lo que indicaría que las mesas de dirección valoran la edad y la experiencia. Entonces, resulta poco probable que las mesas de dirección escogieran directivas todavía más jóvenes y con menos experiencia para sustituir a los que se fueron de manera deliberada.

Matsa y Miller (2012)

El siguiente estudio que vamos a ver es Matsa y Miller (2012) [3]. Estos autores lo que hacen es comparar las public limited firms (las afectadas por la cuota) con las que no fueron afectadas por las cuotas por no pertenecer a ese grupo y con empresas en otros países nórdicos entre 2006 y 2009. Los resultados en la rentabilidad son:
The median profitability of listed firms in Norway decreases by more than 20 percent after the quota (from 5.8 to 4.6 percent) and average profitability drops even more (from 2.4 to 0.2 percent), but events unrelated to the quota may contribute to these changes. To isolate the impact of the quota, we examine changes in profits during the same time period among samples of similar comparison firms that were not directly affected by the quota. [...] none of the other groups exhibits a similar decline.
Traducción:
La mediana de la rentabilidad de las empresas listadas en Noruega [las afectadas por la cuota] se redujo en más de un 20 por ciento después de la cuota (de 5,8 a 4,6 por ciento) y el promedio de la rentabilidad cayó todavía más (de 2,4 a 0,2 por ciento), pero tal vez hubo algún evento no relacionado con la cuota que pudiera contribuir a estos cambios. Para aislar el impacto de la cuota, examinamos los cambios en la rentabilidad a lo largo del mismo periodo de tiempo con muestras de empresas de comparación similares que no fueron afectadas directamente por la cuota. [...] ninguno de los otros grupos mostró una reducción similar.
Otro resultado que arroja el estudio es el aumento de los costes laborales (también observado en Aher y Dittmar (2012) [2]) en las empresas asociado a las cuotas debido principalmente a la reducción en los despidos:
these estimates suggest that the growth in relative employment after the quota primarily results from fewer workforce reductions, rather than more workforce expansions.
Traducción:
Estas estimaciones sugieren que el crecimiento en el empleo relativo después de la cuota es consecuencia principalmente de menos reducciones de la fuerza de trabajo, en vez de más expansiones de la fuerza de trabajo.
Los autores de este estudio tratan de averiguar los factores a los que son atribuibles los cambios observados. Pero a diferencia de Aher y Dittmar (2012) [2], no encuentran la edad y la experiencia de las nuevas directivas estadísticamente significativas. Tras descartar otros factores, los autores acaban atribuyendo los cambios en las empresas observados en su estudio a las diferencias en prioridades y valores entre los directivos y directivas.

Dale-Olsen, Schøne & Verner (2013)

El siguiente estudio en la lista es Dale-Olsen, Schøne & Verner (2013) [5]. Estos autores comparan a las empresas afectadas por la cuota con aquellas que no fueron afectadas (por no ser public limited). El resultado es que no encuentran diferencias significativas entre el antes y el después:
Our main conclusion is that the short-run impact of the reform on economic firm performance is negligible. This implies either that the short-run influence of boards is small, or that newly recruited women do not bring along markedly different resources and perspectives compared to the men that they replace.
Traducción:
Nuestra principal conclusión es que el impacto a corto plazo de la reforma en el rendimiento económico de las empresas es despreciable. Esto implica que o bien la influencia a corto plazo en las mesas de dirección es pequeña, o bien que las nuevas mujeres reclutas no traen consigo recursos o perspectivas marcadamente diferentes comparadas con las de los hombres que reemplazan.
Una limitación de este estudio es que, a diferencia de los anteriores, cubre entre 2003 y 2007, cuando la reforma terminó en 2008. El motivo, según los autores, es para evitar el impacto de la crisis de 2008, evento que los otros estudios sí que tuvieron que tener en cuenta.

El estudio también realiza una crítica a Matsa y Miller (2012) [3] y Aher y Dittmar (2012) [2]:
In our opinion, these studies have a weak methodology, face selection problems, and ignore the potential differential impact of the reform depending on board size. Our analyses aim to correct many of these issues.
Traducción:
En nuestra opinión, estos estudios tienen metodologías débiles, presentan problemas de selección, e ignoran las potencial impacto diferencial de la reforma en función del tamaño de la mesa de dirección. Nuestros análisis tratan de corregir varios de estos problemas.
Para luego concluir que no hay ningún impacto en función del tamaño de la mesa de dirección:
for all board size groups [...] the reform has no significant impact on the operating revenues or on the operating costs
Traducción:
para todos los grupos de tamaño de mesa de dirección [...]  la reforma no tiene un impacto significativo en los beneficios operativos ni en los costes operativos
Más adelante comentaré estas y otras críticas a los trabajos de Matsa y Miller (2012) [3] y Aher y Dittmar (2012) [2].

Este estudio fue publicado en la revista Feminist Economics. Así que no es de extrañar que este estudio tenga una opinión negativa de los otros estudios y que concluya que la cuota ha sido todo un éxito simplemente porque ha conseguido que haya más mujeres en los puestos de dirección.

Smith (2014) y Choobineh (2016)

Para cerrar el tema de los efectos financieros en las empresas, traigo los meta-análisis de Smith (2014) [6] y Choobineh (2016) [7]. Tanto uno como otro comentan el tema de las cuotas noruegas, y los trabajos comentados son los que hay en este artículo. No voy a citar porque repetiría lo mismo que ya he comentado. El motivo por el que incluyo estos meta-análisis es por si alguien piensa que he elegido los estudios para presentar una postura sesgada.

Bertrand, Black, Jensen, Lleras (2014)

Buscando efectos de las cuotas de Noruega, encontré el estudio de Bertrand, Black, Jensen, Lleras (2014) [8] que realiza una encuesta entre 763 jóvenes estudiantes noruegos de la Norwegian School of Economics. También analiza el impacto de la cuota en la brecha salarial y en las mujeres dentro de las empresas. El abstract tiene un buen resumen de los resultados:
We document that the newly (post-reform) appointed female board members were observably more qualified than their female predecessors, and that the gender gap in earnings within boards fell substantially. While the reform may have improved the representation of female employees at the very top of the earnings distribution (top 5 highest earners) within firms that were mandated to increase female participation on their board, there is no evidence that these gains at the very top trickled-down. Moreover the reform had no obvious impact on highly qualified women whose qualifications mirror those of board members but who were not appointed to boards. We observe no statistically significant change in the gender wage gaps or in female representation in top positions, although standard errors are large enough that we cannot rule economically meaningful gains. Finally, there is little evidence that the reform affected the decisions of women more generally; it was not accompanied by any change in female enrollment in business education programs, or a convergence in earnings trajectories between recent male and female graduates of such programs. While young women preparing for a career in business report being aware of the reform and expect their earnings and promotion chances to benefit from it, the reform did not affect their fertility and marital plans. Overall, in the short run the reform had very little discernable impact on women in business beyond its direct effect on the newly appointed female board members.
Traducción (negritas mías):
Documentamos que las nuevas directivas (post reforma) seleccionadas en las mesas de dirección estaban visiblemente más cualificadas que sus predecesoras, y que la brecha salarial en las mesas de dirección se redujo considerablemente. Mientras que la reforma puede haber mejorado la representación de mujeres en lo más alto de la distribución de salarios (en el top 5 de mayores salarios) dentro de las empresas que fueron obligadas a incrementar la participación femenina en su mesa de dirección, no hay evidencia de que estas ganancias en lo más alto repercutieran hacia abajo. Es más, la reforma no ha tenido un impacto obvio en las mujeres altamente cualificadas cuyas cualificaciones son iguales a las de las mujeres miembros de las mesas dirección pero que no fueron seleccionadas para las mesas de dirección.  No observamos ningún cambio estadísticamente significativo en la brecha salarial o en la representación femenina en las posiciones más altas, aunque los errores estándares son lo suficientemente amplios como para que no podamos rechazar ganancias económicamente significativas. Finalmente, hay muy poca evidencia de que la reforma haya afectado a las decisiones de las mujeres en general; no ha sido acompañada por un cambio en los ingresos de mujeres en cursos de educación empresarial, o en una convergencia de salarios en las trayectorias entre graduados recientes hombres y mujeres de dichos cursos. Mientras que las mujeres jóvenes que se preparan para una carrera en los negocios afirman conocer sobre la reforma y esperan que sus ganancias y sus oportunidades de promoción se beneficien de ello, la reforma no ha afectado sus planes de fertilidad o maritales. En general, en el corto plazo la reforma ha tenido un impacto poco perceptible en las mujeres en los negocios más allá de su efecto directo sobre las nuevas mujeres seleccionadas como miembros de las mesas de dirección.
Cuando en el abstract dicen que "no hay evidencia de que estas ganancias en lo más alto repercutieran hacia abajo" lo que quieren decir exactamente es que esperaban que un aumento de las mujeres en lo más alto de la empresa desencadenara un aumento de las mujeres en el resto de la jerarquía de la empresa. La teoría que motiva esa idea es la siguiente:
If boards play a direct role in the selection of C-suite executives, female board members might be vocal proponents of female candidates for these positions, or might be able to leverage their own female-heavier business networks, to recommend female candidates for these positions. A higher share of women in the C-suite might then trickle down to a higher share of women in lower-down executive positions. Finally if boards can help shape human resource policies, female board members might be more likely to support changes in corporate policies that improve work-family balance, such as more part-time work or more amenities for women with children.
Traducción:
Si las mesas de dirección juegan un rol directo en la selección de los ejecutivos de la C-suite, los miembros femeninos de la mesa de dirección pueden proponer candidatas para estas posiciones, o pueden ser capaces de aprovechar sus propias redes de contactos femeninas, para recomendar candidatas para estas posiciones. Un mayor porcentaje de mujeres en la C-suite puede entonces repercutir en un mayor porcentaje de mujeres en las posiciones ejecutivas más bajas. Finalmente, si las mesas de dirección pueden cambiar las políticas de recursos humanos, las mujeres miembros de la mesa de dirección serás más proclives a apoyar cambios en políticas corporativas que mejores la conciliación laboral, como más puestos a tiempo parcial o más comodidades para mujeres con hijos.
A la luz de los resultados del análisis, nada de eso ha ocurrido. En general, aparte de lo más obvio, el estudio no encuentra ningún impacto social de la cuota.

Críticas a los anteriores estudios

Por supuesto, los anteriores estudios no están exentos de críticas. El trabajo de Ferreira (2014) [4] presenta una lista de problemas metodológicos que resumo a continuación.

No hay un momento definido del comienzo de la cuota

Un problema que tiene estudiar este fenómeno es que no está claro cuándo comienza a hacer efecto. Además de que no hace efecto en todas las empresas al mismo tiempo. ¿Qué momento sería el comienzo del efecto de las cuotas? Tal vez el anuncio de la cuota opcional en 2002, ¿o el anuncio de la cuota obligatoria en 2005? Si os habéis fijado, los estudios que analizan la cuota comienzan cada uno en un año diferente y analizan periodos diferentes (más o menos es el mismo marco temporal, pero no exactamente el mismo). Esto hace difícil comparar los resultados.

Por ejemplo, en una de las citas que he puesto de Aher y Dittmar (2012) [2], veíamos que comentaban que los efectos de las cuotas se notaban más en los últimos años. Tal vez por eso Dale-Olsen, Schøne & Verner (2013) [5] no encontraron ningún efecto, ya que cogieron datos hasta 2007, cuando Aher y Dittmar (2012) [2] llegan a 2009.

No hay un grupo de control satisfactorio

Como en todo experimento, lo suyo es comparar las empresas afectadas por la cuota con un conjunto de empresas no afectadas por la cuota y observar las diferencias. El problema es que eso no es posible debido a que la cuota se aplica a todas las empresas.

La solución de Aher y Dittmar (2012) [2] fue comparar las empresas que tuvieron que añadir más mujeres con aquellas que tuvieron que añadir menos. El problema de esta aproximación es que las empresas tuvieron un tiempo para elegir cuándo añadir mujeres a su mesa de dirección, y se desconocen los motivos por los cuales tardaron más o menos.

Por otro lado, Matsa y Miller (2012) [3] y Dale-Olsen, Schøne & Verner (2013) [5] optaron por comparar las empresas con aquellas que no eran public limited, y que por tanto no estaban afectadas por la cuota. Pero ya estamos hablando de distintos tipos de empresas que pueden tener variables desconocidas que sean diferentes. Otra opción es comparar con las empresas public limited de otros países nórdicos, pero esto tiene el problema de que no puedes saber si estas empresas se hubieran comportado de otra manera si la cuota noruega no hubiera existido, aparte de que tienen marcos legales diferentes.

La muestra es autoseleccionada

Durante el periodo de adaptación a la cuota, muchas empresas cambiaron su organización para no ser public limited y así evitar la cuota. Es decir, se quedaron las empresas que decidieron asumir la cuota o que no pudieron cambiar su organización. Tal vez estas empresas tienen alguna característica desconocida en común que las haga diferentes y los efectos observados se deban a ello.

Sin embargo, Aher y Dittmar (2012) [2] tienen esto en cuenta y analizan las empresas que cambiaron su organización para evitar la cuota y llegan a la conclusión de que si dichas empresas no hubieran cambiado, los resultados de su análisis se reforzarían.

Efectos de otras reformas

La ventana de efecto de las cuotas (2003 - 2008) es amplia, y durante la misma sucedieron otras reformas que tal vez expliquen los efectos observados.

Por ejemplo, Ferreira (2014) [4] menciona la adopción en Noruega de las normas contables IFRS en 2005 como posible factor. Los estudios de Aher y Dittmar (2012) [2] y Dale-Olsen, Schøne & Verner (2013) [5] lo tienen en cuenta, pero no así Matsa y Miller (2012) [3]. Lo que ocurre es ambos estudios concluyen que el cambio contable a la normativa IFRS tiene una escasa influencia en los resultados.

La causalidad no está clara

Finalmente, Ferreira (2014) [4] señala la falta de consistencia en las causa que provocan los cambios observados. Mientras que Aher y Dittmar (2012) [2] dicen que podría deberse a la juventud o a la falta de experiencia de las nuevas directivas, Matsa y Miller (2012) [3] atribuyen sus observaciones a las diferentes características entre directivos y directivas.

Además, Ferreira (2014) [4] propone como posible explicación el hecho de que la mayoría de mujeres directivas en Noruega sean directoras externas, lo que aumentaría la independencia de la mesa de dirección.

Conclusiones

Voy a comenzar citando a Ferreira (2014) [4]:
To conclude, current research does not really support a business case for board gender quotas. But it does not provide a case against quotas either. There is little hope that any (credible) research will ever do so. Causal effects will always be too hard to estimate, unless governments unintentionally help us with badly designed policies that randomly assign quotas to some firms and not to others.
Traducción:
Para concluir, la investigación actual no apoya una justificación basada en el negocio para las cuotas de género. Pero tampoco apoya un justificación en contra. Hay muy poca esperanza de que alguna investigación (creíble) lo consiga. Los efectos causales serán siempre demasiado difíciles de estimar, a menos que los gobiernos involuntariamente nos ayuden con políticas pésimamente diseñadas que asignen cuotas aleatoriamente a unas empresas pero a otras no.
La postura aquí representada sería una postura conservadora y muy exigente con la evidencia, que está muy bien. Además, deja claro que el tema de la causalidad es muy difícil de demostrar, tanto para bien como para mal. No obstante, deja abierto el debate moral.

Una postura feminista podría ser que, como no se han demostrado efectos negativos de las cuotas, ¿por qué no ponerlas? Aumentaría la presencia femenina en los puestos altos de la sociedad, y eso podría animar a las mujeres jóvenes en sus carreras profesionales, o podría mejorar la situación de las mujeres en el mundo laboral. Sin embargo, Bertrand, Black, Jensen, Lleras (2014) [8] no encuentran ninguno de esos efectos. A pesar de ello, afirman que las cuotas han sido un éxito porque la presencia de mujeres en los puestos altos de dirección ha mejorado.

A pesar de las limitaciones metodológicas, la investigación alrededor de la cuota noruega revela que los efectos (aparte del obvio aumento de mujeres en los puestos de directivos) han sido inexistentes en el mejor de los casos o negativos en el peor. La evidencia empírica del caso de Noruega no acompaña a los defensores de las cuotas.

Bibliografía

1. No sólo cúpulas: el Gobierno impondrá cuotas de mujeres en los cargos intermedios de las empresas http://www.elmundo.es/economia/empresas/2018/10/03/5bb3b931ca474120388b4570.html

2. Changing of the Boards: The Act on Firm Valuation Mandated Female Board Presentation, Kenneth R. Ahern y Amy K. Dittmar (2012). https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1364470

3. A Female Style in Corporate Leadership? Evidence from Quotas, David A. Matsa y Amalia R. Miller (2012). https://pdfs.semanticscholar.org/cb47/c48e88b7cf86aa0519145ec03dd61db55f65.pdf

4. Board Diversity: Should We Trust Research to Inform Policy?, Daniel Ferreira (2014).
https://onlinelibrary.wiley.com/doi/abs/10.1111/corg.12092

5. Diversity among Norwegian Boards of Directors: Does a Quota for Women Improve Firm Performance? Harald Dale-Olsen, Pål Schøne & Mette Verner (2013)https://www.tandfonline.com/doi/full/10.1080/13545701.2013.830188

6. Gender quotas on boards of directors - Little evidence that gender quotas for women on boards of directors improve firm performance. Nina Smith (2014) https://wol.iza.org/uploads/articles/7/pdfs/gender-quotas-on-boards-of-directors.pdf

7. Gender Quotas for Corporate Boards: A Holistic Analysis, Neeka Choobineh (2016). https://repository.upenn.edu/cgi/viewcontent.cgi?article=1004&context=joseph_wharton_scholars


8. Breaking the Glass Ceiling? The Effect of Board Quotas on Female Labor Market Outcomes in Norway. Marianne Bertrand, Sandra E. Black, Sissel Jensen, Adriana Lleras (2014) http://ftp.iza.org/dp8266.pdf

martes, 7 de agosto de 2018

Perspectiva de género: ¿sirven los gestos para condenar?

Estos últimos meses el Tribunal Supremo publicó las Sentencias 2003/2018[1] y 2182/2018[2], en las que da a entender que las mujeres denunciantes de violencia de género deberían tener un trato especial a la hora de valorar su testimonio en el juicio. Entre otros, está la posibilidad de considerar los gestos de la mujer en la evaluación de su testimonio. Y es entonces cuando debemos hacernos la siguiente pregunta: ¿puede determinarse la veracidad o falsedad de un testimonio a partir de los componentes no verbales del mismo?

Lo que dice la Sentencia 2003/2018


En la página 6 la Sentencia pone (negritas mías):
1.- Parámetros de valoración de la declaración de la víctima por el Tribunal. El Tribunal puede realizar ese proceso valorativo, dado que en la declaración de la víctima puede apreciar:
a.- Escuchar la declaración de la víctima y no solo escucharla, sino valorar sus expresiones.
b.- La forma en la que contesta a las preguntas,
c.- Las reacciones de la víctima a las preguntas de los abogados y el Ministerio Público.
d.- La inexistencia de contradicciones ante determinadas preguntas que ya fueron hechas en sus anteriores declaraciones.
e.- La expresión gestual de la víctima al declarar ante el Tribunal.
Esta Sentencia afirma que las expresiones pueden usarse para valorar el testimonio de una víctima con el objeto de enervar la presunción de inocencia, pero no da pistas sobre por qué debería hacerse. Para eso vamos a ver la siguiente Sentencia.

Lo que dice la Sentencia 2182/2018


La parte de interés de la Sentencia se encuentra en la página 11 de la misma. La justificación para este trato especial en la valoración del testimonio de las mujeres víctimas de violencia de género es el siguiente (negritas originales):
Ello, sin embargo, no quiere decir que la credibilidad de las víctimas sea distinta del resto de los testigos [...], y otorgar una especie de presunción de veracidad siempre y en cualquier caso, pero sí puede apreciarse y observarse por el Tribunal con mayor precisión la forma de narrar el acaecimiento de un hecho por haberlo vivido en primera persona y ser sujeto pasivo del delito [...] se trata de llevar a cabo la valoración de la declaración de la víctima, sujeto pasivo de un delito, en una posición cualificada como testigo que no solo "ha visto" un hecho, sino que "lo ha sufrido"
O dicho con otras palabras: la forma de narrar los hechos de una víctima es especial y diferente de la de alguien que no lo es (ej: un testigo ocular de los hechos o una denunciante mentirosa).

Y ello conlleva lo siguiente:
se prestará especial atención en la forma de cómo cuenta la experiencia vivida, sus gestos, [...] el Tribunal valorará su declaración a la hora de percibir cómo cuenta el suceso vivido en primera persona, sus gestos, sus respuestas y su firmeza a la hora de atender el interrogatorio en el plenario con respecto a su posición como un testigo cualificado que es, al mismo tiempo, la víctima del delito.
Efectivamente, si consideras que la forma de narrar un hecho es diferente en función de si lo has vivido o no, entonces dichas diferencias pueden ser percibidas y utilizadas para determinar la veracidad o falsedad de un testimonio.

Pero esto no es lo único que dice la Sentencia:
sobre todo, tener en cuenta si puede existir algún tipo de enemistad en su declaración. En este último punto debe tenerse muy presente que la circunstancia de que entre autor del delito y víctima haya existido algún tipo de enfrentamiento, o haber sido la víctima sujeto pasivo de otros hechos delictivos precedentes, ello no debe conllevar que se dude de su veracidad, ya que la circunstancia de que existan estos antecedentes no deben disminuir su credibilidad
Además, al parecer no debe tenerse en cuenta que pudiera haber una situación de enfrentamiento entre los miembros de la pareja a la hora de valorar la credibilidad del testimonio porque... bueno... porque... porque patata. No da ninguna razón por la cual no deba hacerse.

Y finalmente, también añade la Sentencia:
Tampoco será un elemento negativo hacia la víctima la circunstancia de que tarde en denunciar en hechos de violencia de género, dadas las especiales circunstancias que rodean a estos casos en los que las víctimas pueden tardar en tomar la decisión en denunciar por tratarse el denunciado de su pareja, o ex pareja, lo que es un dato que puede incidir en esas dudas de las víctimas que están sometidas a esa especial posición psicológica en la que quien les ha agredido es su propia pareja, algo, realmente, que nunca pudieron esperar cuando iniciaron su relación
No importa lo que tarda en denunciar. Si tarda mucho es porque probablemente sea una víctima. Si tarda poco también.

Comentarios a las Sentencias


¿Hay que tener en cuenta los enfrentamientos u otros hechos delictivos previos?

En la Sentencia del Tribunal Supremo, como hemos visto, se afirma que no deben valorarse pero no dan ninguna razón para ello. Sin embargo, sí que podemos encontrar más de una razón para que se haga.

En mi artículo en el que comenté a fondo la declaración de la víctima como única prueba de cargo [3], podemos encontrar tres criterios que se utilizan para valorar el testimonio de la denunciante:
  • Falta de incredibilidad subjetiva derivada de un constatado móvil espurio: resentimiento, enemistad, etc.
  • Verosimilitud proporcionada por corroboraciones objetivas periféricas.
  • Persistencia en la incriminación: prolongada en el tiempo, plural y sin ambigüedades ni contradicciones.
La afirmación de la Sentencia entra en conflicto con el primero de los puntos. La existencia de una situación conflictiva en la pareja (ej: divorcio, disputa por la custodia) puede derivar en que la mujer denuncie falsamente a su pareja con el objetivo de conseguir ventajas procesales o como método de venganza, movida por su resentimiento.

Así pues, si se evita que el juzgador pueda valorar circunstancias que pueden suponer un posible móvil espurio, se están limitando las herramientas que un hombre denunciado puede utilizar para desvirtuar el testimonio que le incrimina, vulnerando su derecho a la defensa.

Otro motivo para examinar las circunstancias previas en caso de enfrentamientos en la pareja es porque, en caso de que dichos enfrentamientos existan, no se puede hablar de sumisión, sometimiento, miedo, etc. Muchos jueces así lo entienden, como ya mostré en mi artículo sobre la necesidad de demostrar el ánimo machista [4] en los casos de violencia de género (específicamente, el ejemplo de la STS 681/2008).

En este caso, se está evitando que el juez pudiera valorar unas circunstancias que acreditaran la ausencia de una situación de poder del hombre hacia la mujer y, por tanto, de violencia de género.

¿Hay que tener en cuenta la tardanza en denunciar?


Pues depende de la tardanza de la que estemos hablando y si hay circunstancias que la justifiquen. Una tardanza de semanas o meses puede ser comprensible, pero puede resultar sospechoso denunciar después de años o incluso décadas. Este es uno de esos casos en los que resulta complicado crear una regla universal.

Por ejemplo, vamos a ver la reciente Sentencia condenatoria de Juana Rivas [5] (Sentencia 257/2018 del Juzgado de lo Penal nº 1 de Granada). En ella podemos encontrar:
[Juana Rivas] No explicó ni se comprende que si fue maltratada en Italia entre 2012 y 2016, al nivel que ella dijo, de tortura y terror, no denunciara allí al momento en que se producía cada uno de los varios episodios que tuvieron lugar, según ella, tratándose de un país con una legislación y cultura de rechazo a estas conductas, similar a la nuestra. Si hubiera residido en otro país con una cultura de las que manifiestamente no combaten el maltrato, sería comprensible que no hubiera denuncia e incluso podría tener sentido haber callado los hechos hasta en su círculo más íntimo. Pero no es el caso de Italia. Y ni en este país, ni en España inicia actuación alguna en respuesta a esos supuestos episodios, ni siquiera aporta dato alguno indiciario de haber tenido lugar alguno de ellos, a nivel incluso de haberlo contado a familiares o allegados.
Si aceptamos la tesis de la Sentencia del Tribunal Supremo que estamos comentando, un párrafo como este no sería posible.

¿Hay que tener en cuenta los gestos?


Veamos primero qué es lo que dice al respecto la jurisprudencia relevante. El Tribunal Constitucional, en su Sentencia 217/1989 [6] dijo (negritas mías):
por lo que se refiere al alcance incriminador de las declaraciones prestadas por los acusados tanto en las diligencias policiales y sumariales como en el acto del juicio oral, es indudable, conforme a la doctrina constitucional anteriormente mencionada, que es consustancial a los principios de oralidad, inmediación y libre valoración de la prueba el examinar gestos de los intervinientes en la misma, tales como los de turbación o sorpresa, a través de los cuales pueda el Juez o Tribunal de instancia fundar su íntima convicción acerca de la veracidad o mendacidad de la declaración de los intervinientes en la prueba
Y nunca más volvió a decir nada más al respecto. Casi veinte años más tarde, el Tribunal Supremo sienta jurisprudencia en sus Sentencias 6995/2006 [7] y 8207/2007 [8]. En la Sentencia de 2006 podemos leer:
Sus comportamientos o movimientos corporales externos no pueden elevarse a la categoría de signos inequívocos de credibilidad o falsedad en el testimonio. La prueba no puede depender de la actitud, serena, fría, calculadora o agitada, del testigo de cargo.

La credibilidad no puede basarse en una concepción anticuada, mítica y casi mágica que atribuye a los jueces una capacidad intuitiva y cognoscitiva de las hábitos externos, tonos de voces, fenotipos y emociones, expresadas corporalmente, que nada tienen que ver con el contenido de las pruebas y que no pueden ser usadas como elemento desfavorable e inculpatorio. Un sistema democrático no puede admitir que un ciudadano que entra como acusado en la Sala de juicios salga condenado por gestos, reacciones capilares o movimientos corporales realizados durante su declaración. Tampoco esta técnica es válida para detectar la credibilidad de los testigos. En consecuencia, el mito de la inmediación debe ceder ante la tutela judicial efectiva que sólo es posible mediante la racional, metódica y analítica disección de las pruebas interrelacionándolas de forma lógica y llegando a una conclusión que esté por encima de la duda razonable.
La Sentencia 6995/2006 nos deja un ejemplo de ambigüedad en el testimonio:
la reiteración mimética en los testimonios inculpatorios no es un signo de credibilidad, sino que puede ser todo lo contrario. La persona decidida a imputar un hecho delictivo a otra, cuanto más falsa sea la acusación, mas cuidado tendrá en mantener una versión uniforme que no se vea alterada por circunstancias tan naturales como el transcurso del tiempo y su influencia sobre la percepción, cada vez más lejana, de los hechos
Está claro que hay jueces que consideran que evaluar los gestos y otros componentes no verbales es un error y que no pueden utilizarse para determinar la veracidad o falsedad de un testimonio debido a que no pueden extraerse conclusiones consistentes de los mismos.

Es aquí donde sale a relucir una consecuencia necesaria que resulta de defender la postura contraria. Si seguimos el razonamiento de las Sentencias 2003/2018 y 2182/2018 del Tribunal Supremo y asumimos que las formas y gestos del testimonio de una víctima son diferentes de otra persona que no lo es, de aquí se sigue necesariamente que debe existir una lista de componentes no verbales cuya presencia o ausencia ayude a determinar la veracidad o falsedad de un testimonio. Por supuesto, la Sentencia no dice nada acerca de qué elementos concretos son de utilidad. No obstante, si la hipótesis es cierta, dicha lista debe poder existir.

Entonces, formulemos la pregunta: ¿es posible saber si alguien miente o dice la verdad a partir del lenguaje no verbal? Si es que sí: ¿qué elementos son los que delatan o respaldan el testimonio?

¿Es posible saber si alguien miente o dice la verdad a partir del lenguaje no verbal?


Para ello voy a citar el meta-análisis que realizó Jaume Masip, psicólogo español, en 2005 [9], este otro meta-análisis de 2007 [10] y este otro estudio de 2013 [11], que es bastante extenso.

¿Somos capaces de detectar mentiras?

Vamos a empezar por el trabajo de Jaume Masip [9]. Antes de zambullirnos directamente en los indicadores no verbales, vamos a explorar cómo de buenos somos detectando mentiras en general. Así pues, ¿cuál es el grado de acierto de las personas detectando si una declaración es verdadera o falsa? (negritas mías):
Examinando un total de 193 muestras distintas de receptores, con una cantidad total de 14.379 observadores, han hallado una precisión media del 54.5%. En otro trabajo más amplio (incluye un total de 349 muestras de receptores, con 22.282 sujetos que evaluaron la credibilidad de los mensajes de 3864 emisores), Bond y DePaulo (en prensa) hallaron una precisión media del 53.4%. Si bien ésta es significativamente superior al 50% esperado por azar, en términos absolutos es una precisión extremadamente pobre. Significa que de cada 100 mensajes hay 47 que se juzgan erróneamente. Es decir, tenemos casi la misma probabilidad de acertar nuestros juicios que de fallarlos. La precisión de los detectores humanos al hacer juicios de credibilidad sobre la base de la observación del comportamiento es, pese a lo que dice la sabiduría popular, extremadamente limitada. De hecho, de las diversas aproximaciones a la detección del engaño, la no-verbal es la que arroja unos niveles de precisión más bajos.
Pero claro, podemos pensar que los jueces y otros agentes relacionados con el proceso judicial son profesionales dedicados a detectar engaños y que su capacidad de detección de la mentira será superior al promedio del general de la población... ¿o no? (negritas mías):
Esta limitación se extiende asimismo a aquellos profesionales para los cuales detectar mentiras es importante [...] Aamodt y Mitchell (en prensa) informan de niveles del 50.8% para las muestras de detectives, del 54.5% para policías federales norteamericanos, del 55.3% para policías y para agentes de aduanas, del 59.0% para jueces y del 61.6% para las cuatro muestras de psicólogos incluidas en su meta-análisis. Bond y DePaulo (en prensa) utilizan contrastes estadísticos para comparar la precisión de "expertos" (personal de los cuerpos de seguridad, jueces, psiquiatras, auditores...) y "no-expertos". Ni en las comparaciones intraestudio (al considerar conjuntamente todos los experimentos en que se había hecho esta comparación) ni en las comparaciones interestudio (comparación del nivel de precisión en experimentos en que los observadores habían sido "expertos" con experimentos en que éstos habían sido "no-expertos") las diferencias resultan significativas. En las comparaciones interestudio los niveles de precisión hallados han sido 52.9% para los "expertos" y 56.9% para los "no-expertos". En definitiva, los profesionales familiarizados con el engaño no son mejores detectores que los observadores legos.
Pues parece que la cosa no mejora mucho. Pero esto no era exactamente lo que estábamos buscando. Estos porcentajes se refieren al acierto de verdades o mentiras (o sea, a identificar verdades como verdades y mentiras como mentiras). Lo que estábamos buscando era, dada una mentira, la probabilidad de acertar que es una mentira (negritas mías):
La investigación muestra que las personas identificamos con mayor facilidad verdades que mentiras (Levine, Park y McCornack, 1999). Esto es así porque presentamos una tendencia a considerar que los demás dicen la verdad, lo cual incrementa nuestra precisión al juzgar verdades y la reduce al juzgar las mentiras (Levine et al., 1999; Masip et al., 2002b). Así, por ejemplo, en el meta-análisis de Bond y DePaulo (en prensa) se halló que el porcentaje medio de juicios de verdad fue del 55.0%, significativamente superior al 50% esperado por azar. Esto hizo que la precisión al juzgar declaraciones verdaderas se situara en el 60.3%, sensiblemente por encima de la precisión al juzgar declaraciones falsas, que alcanzó tan sólo la tasa del 48.7%.
[...]
En cualquier caso, la tendencia a juzgar las declaraciones como verdaderas parece ser menor entre aquellos profesionales para quienes la detección de la mentira es más relevante que en otras personas (Bond y DePaulo, en prensa). Se ha llegado incluso a afirmar, sobre la base de los resultados empíricos, que en realidad tales profesionales presentan un sesgo opuesto que les lleva a considerar que las declaraciones son falsas (Meissner y Kassin, 2002), y que presentan una tendencia generalizada a cuestionar la veracidad de las comunicaciones emitidas por los demás (Masip, Alonso, Garrido y Antón, 2005).
Pues vamos de mal en peor. Ahora resulta que al considerar sólo las mentiras, hay un poco más del 50% de probabilidad de ser tomadas como verdad. Pero parece que entre los profesionales de la detección del engaño, este sesgo no existe y que incluso se invierte.

¿Somos conscientes de nuestra capacidad para detectar la veracidad o falsedad de una declaración?

DePaulo, Charlton, Cooper, Lindsay y Muhlenbruck (1997) hicieron un meta-análisis de la investigación sobre la confianza al hacer juicios de veracidad. [...] En definitiva, las personas no tenemos conciencia de lo correctos o incorrectos que son nuestros juicios de credibilidad.
Blanco y en botella.

¿Hay algún indicador fiable no verbal de la mentira?

Desgraciadamente, la mayor parte de los mejores indicadores para detectar una mentira son verbales (negritas mías):
Con el fin de aislar los indicadores más válidos del engaño, DePaulo et al. (2003) se centraron en aquellos basados en un número de comparaciones superior a cinco y con un tamaño del efecto igual o superior a 0.20 en valores absolutos. Sólo hallaron 12 de tales indicadores, la mayoría de naturaleza verbal. La clave más discriminativa (d = -0.55) parece ser la inmediaticidad verbal y vocal. Esto significa que al mentir las personas responden de manera menos directa, relevante y clara que al decir la verdad, y que además lo hacen de forma evasiva e impersonal (DePaulo et al., 2003). Además, en comparación con las comunicaciones de quienes dicen la verdad, las comunicaciones de los mentirosos parecerán más ambivalentes y discrepantes (por ej., habrá falta de concordancia entre lo expresado a través de unos canales y otros) (d = 0.34). Asimismo, las mentiras tendrán menos detalles (d = -0.30), una estructura menos lógica (d = -0.25) y un menor engranaje contextual (d = -0.21) que las verdades. Éstos son tres criterios verbales del Análisis de Contenido Basado en Criterios o CBCA7 (Garrido y Masip, 2000, 2004; Masip, Garrido y Herrero, 2003; Vrij, 2005). Las narraciones falsas también parecerán menos plausibles (d = -0.23) y contendrán más afirmaciones negativas y quejas (d = 0.21) que las verdaderas. El narrador parecerá inseguro y vacilante en su voz y en sus palabras (d = 0.30), dará la impresión de estar más nervioso o tenso (d = 0.27), su voz también sonará tensa (d = 0.26) y de hecho su tono fundamental (frecuencia de la voz) será más agudo (d = 0.21). Además, la implicación personal del narrador a nivel verbal y no-verbal será menor en declaraciones falsas que en declaraciones verdaderas (d = -0.21).
Para complicar más el asunto, hay determinados indicadores que cambian según las circunstancias. Por ejemplo, el tiempo que se tarda en responder. El tiempo que se tarda en responder una pregunta será mayor si el mentiroso no ha tenido tiempo de prepararse una historia comparado con decir la verdad, pero será menor en el caso de que la mentira esté preparada.

Conclusiones de Jaume Masip

Es importante que el lector tenga en cuenta que la mayor parte de los hallazgos descritos en el presente trabajo proviene de estudios meta-analíticos muy abarcadores, por lo que las muestras son extremadamente amplias y heterogéneas (y, por ende, representativas), y los resultados reflejan fielmente los hallazgos globales de virtualmente toda la investigación realizada. [...]. Así, se concluye lo siguiente:
(a) la capacidad del ser humano para discriminar entre verdades y mentiras es extremadamente limitada; esto es así incluso en grupos profesionales para quienes la detección del engaño es una tarea importante en su trabajo;
(b) las personas no tenemos conciencia de lo correctos o incorrectos que son nuestros juicios de credibilidad;
(c) tendemos a sobreestimar nuestra capacidad de identificar verdades y mentiras;
(d) utilizamos claves equivocadas al hacer juicios de credibilidad;
(e) las creencias populares sobre los indicadores del engaño son erróneas;
(f) las creencias de los profesionales para quienes la detección del engaño es una tarea importante son también erróneas y similares a las de las otras personas;
(g) no se ha demostrado que los indicadores conductuales que se mencionan en la mayoría de los libros "de autoayuda" permitan una adecuada discriminación entre verdades y mentiras;
(h) existen muy pocas conductas que realmente permitan diferenciar entre verdades y mentiras;
(i) al contrario de lo que se da a entender en muchos libros "de autoayuda" y de lo que sostiene la sabiduría popular, el significado y el poder de discriminación de las claves conductuales dependen de una serie de variables situacionales;
(j) también al contrario de lo que afirman determinados libros dirigidos al gran público, aprender a discriminar entre verdades y mentiras es extremadamente difícil, como muestra la limitada eficacia de distintos programas de entrenamiento;
(k) en lugar de incrementar la precisión global, los entrenamientos al uso aumentan el sesgo a decir que las declaraciones son falsas.
El análisis de Jaume Masip es más amplio y toca otros temas como creencias populares, la posibilidad de entrenarse en la detección de mentiras y la credibilidad de los libros de autoayuda. Os invito a que lo leáis entero (enlace al pie del artículo).

¿Pero seguro que el gesto X no sirve para detectar mentiras?


Ciertamente, el artículo de Jaume no entra comentar indicadores no verbales específicos, ya que se queda con los indicadores más significativos (ya sean verbales o no) y luego menciona algunos indicadores no verbales circunstanciales. El propio trabajo de Jaume advierte que las creencias populares sobre los indicadores de mentira son falsas, así que muy probablemente eso que estás pensando que crees que te sirve para detectar mentirosos no funciona. De todas formas, no está de más mostrar material específico sobre indicadores no verbales en la detección de mentiras. Téngase en cuenta que, en estos estudios, se graba a los sujetos del estudio y luego se analiza el vídeo para tomar nota de sus indicadores no verbales. De otra forma, sería imposible realizar mediciones como contar el número de parpadeos o las veces que se rascan.

Veamos el estudio de Rebecca van Beek (2013) [11]. En el estudio llaman "carga cognitiva" a una serie de restricciones que imponían a los mentirosos a la hora de mentir. Se compararon tres grupos, los que decían la verdad, los que mentían y los que mentían con restricciones (con "carga cognitiva"). Cito las conclusiones directamente:
H1: Cognitive load positively moderates the effect of lying on cues to deception. Overall this hypothesis is not confirmed [...]
H2: Liars show more signs of self-manipulation than truth tellers. This hypothesis is disconfirmed. There is no difference between liars and truth tellers in showing of self-manipulation, which means touching the own body, body movements, and posture shifts.[...]
H3: Liars will behave less nervous. H4: Liars make less movements with hands and fingers. H5: Liars use more illustrative gestures and less non-illustrative gestures than truth tellers. These hypotheses are not supported. There was no difference between liars and truth tellers in showing of nervousness, movements with hands and fingers, and gestures.[...]
H6: Liars shrug their shoulder (one or both sides) more than truth tellers. This hypothesis is partly confirmed. At study 1 liars without cognitive load show shrug their shoulder symmetrically more truth tellers. This effect is higher for women than for men. However there is no difference between telling the truth or lying with cognitive load.[...]
H7: Liars nod more than truth tellers, while there is no difference between them in the amount of headshakes. H8: Liars raise their chin more and are more gaze aversive than truth tellers. These hypotheses are disconfirmed. There is no difference between liars and truth tellers in nodding, raising the chin, and gaze aversion. There also is no difference in the amount of headshakes which partly confirms hypothesis 7.[...]
H9: Liars press their lips and swallow more than truth tellers, and liars smile less than truth tellers. This hypothesis is not confirmed. Liars do not press their lips or swallow more. Nor smile liars less than truth tellers. Overall are the cues of the lips not significantly different between liars and truth tellers. However liars bite their lips less than truth tellers.[...]
All in all, this study shows many cues of deceptions are not really, or at least not all the time, a cue to deception. Therefore, even by taking close look to the nonverbal behaviour, no one is sure that somebody is lying.
Traducción (negritas mías):
H1: La carga cognitiva modera positivamente el efecto de mentir en los indicadores de engaño. En general esta hipótesis no está confirmada [...]
H2: Los mentirosos muestran más signos de movimientos corporales que los que dicen la verdad. Está hipótesis está refutada. No hay diferencia entre mentirosos y honestos en los indicadores de movimientos corporales, que incluyen tocar el propio cuerpo, movimientos corporales y cambios de postura.[...]
H3: Los mentirosos se comportan de manera menos nerviosa. H4: Los mentirosos realizan menos movimientos con las manos y dedos. H5: Los mentirosos utilizan más gestos ilustrativos y menos gestos no ilustrativos que los honestos. Estas hipótesis no están confirmadas. No hay diferencia entre mentirosos y honestos cuando muestran nerviosismo, movimientos con las manos y dedos y gestos.[...]
H6: Los mentirosos encogen sus hombros (un lado o ambos lados) más que los honestos. Esta hipótesis está confirmada parcialmente. En el estudio 1, los mentirosos sin carga cognitiva encogen sus hombros de manera más simétrica que los que dicen la verdad. El efecto es mayor en hombres que en mujeres. Sin embargo, no hay diferencia en el encogimiento de hombros entre decir la verdad o mentir con carga cognitiva. [...]
H7: Los mentirosos asienten más que los honestos, mientras que no hay ninguna diferencia entre ellos en la cantidad de negaciones con la cabeza. H8: Los mentirosos elevan su barbilla más y evitan más las miradas que los honestos. Estas hipótesis están refutadas. No hay diferencia entre mentirosos y honestos en asentimientos, elevación de la barbilla y evitación de la mirada. Tampoco hay diferencia en las negaciones con la cabeza, lo que confirma parcialmente la hipótesis 7.[...]
H9: Los mentirosos aprietan los labios y tragan saliva más que los que dicen la verdad, y los mentirosos sonríen menos que los honestos. Esta hipótesis no está confirmada. Los mentirosos no aprietan sus labios o tragan saliva más. Tampoco sonríen menos que los honestos. En general, los indicadores labiales no son significativamente diferentes entre mentirosos y honestos. Sin embargo, los mentirosos se muerden los labios menos que los honestos.[...]
Considerándolo todo, este estudio muestra que muchos de los indicadores de engaños no son realmente, o al menos no todo el tiempo, indicadores de engaño. Así pues, incluso realizando un análisis minucioso del comportamiento no verbal, nadie está seguro de si alguien está mintiendo.
Los dos indicadores no verbales que han resultado significativos son el encogimiento de hombros simétrico y el morderse los labios. Del primero, es circunstancial (sólo se dio cuando no había carga cognitiva) y no sé hasta qué punto puedes ponerte a ponderar lo simétrico que es un encogimiento de hombros mientras escuchas a otra persona (eso, si encoge los hombros, claro). Del segundo (morderse menos los labios), puede ser difícil de detectar en una entrevista cara a cara. Además el estudio recomienda estudiar más a fondo lo de morderse los labios.

Vamos ahora a mirar este otro meta-análisis (S. Sporer, B. Schwandt, 2007) [10]:
Overall analyses weighted by sample size indicated that out of 12 behaviors investigated, only 3 were reliably associated with deception: Nodding (r .091), hand movements (r .186), and foot and leg movements (r .067) were negatively associated with deception. [...] The effect sizes of these behaviors, however, were small except for hand and finger movements, which were small to medium.
Traducción:
Análisis globales ponderados por tamaño de la muestra indican que de los 12 comportamientos investigados, sólo 3 han sido asociados confiablemente con el engaño: Asentir (r .091), mover las manos (r .186), y mover el pie y la pierna (r. 067) fueron asociados negativamente con la mentira. [...] El tamaño de los efectos de estos comportamientos, sin embargo, fueron pequeños excepto por el movimiento de manos y dedos, que fue de pequeño a medio.
Los otros comportamientos estudiados fueron parpadeos, contacto visual, evitación del contacto visual, movimientos de cabeza, sonrisas, adaptors (que definen como tocarse partes del cuerpo, rascarse), illustrators (frecuencia en los movimientos de las manos que acompañan a lo que se está diciendo) y cambios de postura (suman 11, es un error del texto del estudio que ponen 12).

Para que no haya dudas, lo que dice en la cita es que los mentirosos asienten menos y mueven menos los pies, piernas y manos que los que dicen la verdad. Hay otros indicadores que muestran alguna significancia, pero sólo en determinadas circunstancias (ej: los adaptors). El problema es que todos estos efectos son pequeños y es poco práctico pedirle a alguien que esté atento a ellos y a las circunstancias en los que éstos aparecen, cuando sea aplicable.

Conclusión


Podemos observar, tras los trabajos presentados, que resulta difícil establecer uno o más indicadores no verbales consistentes de la mentira. En cada trabajo encuentran unos distintos, tienen efectos bajos, generalmente son circunstanciales y pueden ser difíciles de apreciar en la práctica (esto es, en una declaración cara a cara). Y como nos recuerdan en el último meta-análisis presentado [11]:
The comparison between beliefs and actual indicators of deception makes it very clear that lay people and professionals alike assume much stronger associations between certain behaviors and deception than have been found in the studies reviewed. [...] Across these studies, it is quite striking that irrespective of their professions, people assume the existence of much stronger cues to deception than are found in empirical studies.
Traducción:
La comparación entre creencias e indicadores reales de engaño deja bien claro que tanto la gente corriente como los profesionales asumen asociaciones más fuertes entre ciertos comportamientos y el engaño que los que se encuentran en los estudios revisados. [...] A lo largo de estos estudios, es bastante sorprendente que, independientemente de su profesión, la gente asume la existencia de indicadores mucho más fuertes de engaño que los que se encuentran en los estudios empíricos.
Esto es lo mismo que nos encontrábamos en el meta-análisis de Jaume. Los autores pasan a realizar un repaso de las creencias populares acerca de indicadores del engaño señalando las muchas diferencias con los estudios analizados. Así, finalmente deben concluir:
Consequently, practitioners need to be taught that nonverbal behaviors in general are not reliable cues to deception, despite beliefs to the contrary.
Traducción:
En consecuencia, los facultativos necesitan aprender que los comportamientos no verbales no son, en general, indicadores fiables de engaño, a pesar de las creencias que dicen lo contrario.
Centrándonos en la Sentencia que encabeza el artículo, lo que ocurre es que el juez considera que la denunciante es víctima antes del juicio. Afirmar que una persona es víctima es asumir implícitamente que existe un agresor (porque la víctima tiene que ser víctima de algo). Y claro, no vas a dudar de la palabra de una persona que consideras víctima. A partir de esta premisa, resulta lógico que el juez considere inválido cualquier criterio que pueda utilizarse para desvirtuar el testimonio de la que él considera la víctima. Es por eso que el juez desecha categóricamente un criterio sin dar razón ninguna en un caso (el de la presencia de conflictos o enfrentamientos con el denunciado), dando razones vagas en otro (el del tiempo transcurrido hasta la denuncia) y en el último caso utiliza un método arbitrario (la valoración gestual)  para justificar su creencia en el testimonio, aunque dichos métodos, como hemos visto, carezcan de fiabilidad.

Os dejo con una tabla resumen de la jurisprudencia que hemos visto en el artículo:



Bibliografía

1. Sentencia del Tribunal Supremo 2003/2018 http://www.poderjudicial.es/search/contenidos.action?action=contentpdf&databasematch=TS&reference=8413171&links=&optimize=20180608&publicinterface=true

2. Sentencia del Tribunal Supremo 2182/2018 http://www.poderjudicial.es/search/contenidos.action?action=contentpdf&databasematch=TS&reference=8423797&links=&optimize=20180619&publicinterface=true

3. Declaración de la víctima en los casos de violencia de género como única prueba de cargo  http://observatoriogalileo.blogspot.com/2017/10/declaracion-de-la-victima-en-los-casos.html

4. ¿Es necesario demostrar el ánimo machista en los delitos de violencia de género? http://observatoriogalileo.blogspot.com/2018/02/es-necesario-demostrar-el-animo.html

5. Sentencia 257/2018 del Juzgado de lo Penal nº 1 de Granada  https://elpais.com/politica/2018/07/27/actualidad/1532681780_809702.html

6. Sentencia del Tribunal Constitucional 217/1989 http://hj.tribunalconstitucional.es/HJ/en/Resolucion/Show/1423

7. Sentencia del Tribunal Supremo 6995/2006 http://www.poderjudicial.es/search/contenidos.action?action=contentpdf&databasematch=TS&reference=650181&links=%221063%2F2006%22&optimize=20061214&publicinterface=true

8. Sentencia del Tribunal Supremo 8207/2007 http://www.poderjudicial.es/search/contenidos.action?action=contentpdf&databasematch=TS&reference=305787&links=%221058%2F2007%22&optimize=20080110&publicinterface=true

9. ¿Se pilla antes a un mentiroso que a un cojo? Sabiduría popular frente a conocimiento científico sobre la detección no-verbal del engaño, Jaume Masip, 2005
http://www.papelesdelpsicologo.es/pdf/1248.pdf

10. Moderators of Nonverbal Indicators of Deception: A Meta-Analytic Synthesis, S. Sporer, B. Schwandt, 2007
https://www.researchgate.net/publication/232579068_Moderators_of_nonverbal_Indicators_of_deception_A_meta-analytic_synthesis

11.1 Nonverbal Cues to Deception: The Effects of Cognitive Load and Repetition on Cues to Deception, van Beek, 2013
http://arno.uvt.nl/show.cgi?fid=131114

sábado, 7 de abril de 2018

¿Es positivo que haya mujeres en los consejos de dirección?

Seguro que habéis leído o escuchado alguna vez que la diversidad de género es positiva en los consejos de dirección [1], que está asociada a una mejor toma de decisiones y, por tanto, a un aumento del rendimiento de la empresa. Siguiendo este razonamiento, se han tomado decisiones en algunos países como forzar a que las empresas tengan un cupo de mujeres [2] en sus consejos de dirección. Vamos a ver de dónde viene esta idea y si realmente funciona.

Sobre la diversidad de sexo en los grupos de trabajo

Lo primero de todo, vamos a preguntarnos si, en general, el sexo de una persona influye en el rendimiento de un grupo de trabajo. Si hay algún efecto, entonces la composición sexual de la mesa de dirección podría estar relacionada con las decisiones que toma y, por tanto, con el rendimiento de la empresa.

Para intentar responder a esta pregunta vamos a echarle un vistazo a Work Group Diversity [3], que es una revisión de la literatura sobre estudios de diversidad en grupos de trabajo publicada en 2007, y el meta-análisis de Philips y O'Reilly (1998) [4]: Demography and Diversity in Organizations: A Review of 40 Years of Research (Demografía y diversidad en organizaciones: Una revisión de 40 años de investigación). Este meta-análisis reúne más de 80 estudios sobre diversidad.

La diversidad en los grupos de trabajo

Lo primero de todo vamos a definir qué entendemos por "diversidad en los grupos de trabajo". En Work Group Diversity [3]:
Although the field is known as “organizational diversity,” theory and research focus almost exclusively on the work group level, studying how group composition affects group performance, cohesion, and social interaction, and group members’ commitment, satisfaction, and other indicators of subjective well-being.
Traducción:
Aunque el campo es conocido como "diversidad organizativa", la teoría e investigación se centran casi exclusivamente en los grupos de trabajo, estudiando cómo la composición afecta al rendimiento, cohesión e interacción social del grupo, y al compromiso, satisfacción y otros indicadores de bienestar subjetivo.
Un grupo de trabajo es un grupo de personas que tienen un objetivo común (ej: tomar una decisión, llevar adelante un proyecto...). Las diferencias que analizan los estudios de la diversidad en los grupos de trabajo son muy variadas, y las que podrían estudiarse sólo limitadas por la imaginación. Además de los habituales sexo, raza u orientación sexual, también existen estudios sobre diferente personalidad (ej: personas extrovertidas con introvertidas), educación, nacionalidad, edad o ideología política.

¿Qué efectos tiene la diversidad en general en grupos de trabajo?

Work Group Diversity [3], página 6:
In a meta-analysis of 13 studies, Bowers et al. (2000) distinguished gender, personality, attitude, and ability diversity and found no reliable relationship between any form of diversity and group performance. In a meta-analysis of 24 studies, Webber & Donahue (2001) distinguished between highly job-related and less job-related diversity and found no reliable relationships for either form of diversity, neither with group performance nor with group cohesiveness.
Traducción:
En un meta-análisis de 13 estudios, Bowers et al. (2000) [5] distinguió diversidad en sexo, personalidad, actitud y habilidad y no encontró ninguna relación fiable entre cualquier forma de diversidad y el rendimiento del grupo. En un meta-análisis de 24 estudios, Webber & Donahue (2001) [6] distinguieron entre diversidad más relacionada con el trabajo y menos relacionada con el trabajo y no encontró ninguna relación fiable entre cualquiera de las formas diversidad, ni con el rendimiento ni con la cohesión del grupo.
Hay que tener en cuenta que estos meta-análisis afirman de que no se encontraron relaciones fiables, o sea, que funcionen independientemente de las circunstancias. Por ejemplo, en el estudio de Bowers et al. (2000) [5] se observa que la diversidad está relacionada positivamente cuando la tarea es compleja, pero negativamente cuando la tarea es sencilla. Esto quiere decir que la diversidad como variable principal no es buena o mala per se, sino que sus efectos dependen de las circunstancias.

Veamos ahora las conclusiones sobre la diversidad demográfica en los grupos en el meta-análisis de Philips y O'Reilly (1998) [4] a partir de la página 115:
First, there is substantial evidence from both laboratory and field studies conducted over the past four decades that variations in group composition can have important effects on group functioning. These studies show that increased diversity [...] typically has negative effects on social integration, communication, and conflict.
[...]
A second supportable conclusion is that at the micro level, increased diversity typically has negative effects on the ability of the group to meet its members' needs an to function effectively over time. The literature shows clearly that individuals are affected by the demographic composition of their work groups.
[...]
What is less clear from this research is precisely how and when differences in minority status lead to negative outcomes
[...]
At a more macro level, the evidence for performance effect is less clear. There is some indication that at the organizational level top management heterogeneity can be positively related to organizational performance [...]. However, other studies that look directly at process variables find similar effects for top team homogeneity
Traducción:
Primero, hay evidencia sustancial tanto de estudios de laboratorio como de campo realizados a lo largo de las últimas cuatro décadas de que las variaciones en la composición del grupo tienen importantes efectos en el funcionamiento del grupo. Estos estudios muestran que mayor diversidad [...] típicamente tiene efectos negativos de integración social, comunicación y conflicto personal.
[...]
Una segunda conclusión soportable es que a niveles bajos, más diversidad típicamente tiene efectos negativos en la habilidad del grupo para satisfacer las necesidades de sus miembros y para funcionar de manera efectiva a lo largo del tiempo. La literatura muestra claramente que a los individuos les afecta la composición demográfica de sus grupos de trabajo.
[...]
Lo que está menos claro de esta investigación es precisamente cómo y cuándo las diferencias en el estado minoritario tienen resultados negativos
[...]
A un nivel más alto, la evidencia para el efecto de rendimiento es menos clara. Hay alguna indicación de que la heterogeneidad al máximo nivel de la administración organizativa podría estar positivamente relacionada con el rendimiento de la organización [...]. Sin embargo, otros estudios que miran directamente las variables de proceso encuentran efectos similares para mesas de dirección homogéneas.
Generalmente, mayor diversidad parece implicar menor cohesión del grupo según este meta-análisis, pero los efectos en el rendimiento están más disputados.

Voy a explicar la parte del "estado minoritario" porque me parece que es poco clara. Los problemas de diversidad pueden surgir cuando aparece una minoría demográfica en un grupo. La cuestión es que no lo hacen de la misma manera en función de, por ejemplo, el tamaño del grupo minoritario. Otra incertidumbre es que los efectos no tienen por qué ser simétricos (ej: no es lo mismo un hombre en un grupo de mujeres, que una mujer en un grupo de hombres). También está el problema de que no siempre aparecen consecuencias negativas, de ahí el uso del adverbio "típicamente" en las conclusiones del meta-análisis. Para complicar más las cosas, algunos estudios asocian la diversidad con resultados positivos en algunas circunstancias. Y esta lista no agota todos los detalles que se pueden apreciar.

Por supuesto, he citado parte de las conclusiones generales para transmitir una idea somera del contenido del meta-análisis. En las 25 páginas de análisis sobre el efecto en los grupos de trabajo de las diferentes variables demográficas se aprecian muchos detalles y casos específicos, pero en este apartado se trata de dar una visión general.

Las evidencias de los estudios de diversidad son muy diversas, así que la revisión Work Group Diversity [3] comenta:
The inability to reliably link the positive and negative effects of diversity to types of diversity has led van Knippenberg et al. (2004) to propose that diversity research abandon attempts to explain the effects of diversity through typologies of diversity.
Traducción:
La incapacidad de vincular de manera fiable los efectos positivos y negativos de la diversidad a tipos de diversidad ha llevado a van Knippenberg et al. (2004) a proponer que la investigación en diversidad abandone los intentos de explicar los efectos de la diversidad a través de las tipologías de la diversidad.
O sea, que el estudio de las distintas variables demográficas por separado parece que no da resultados consistentes y que conviene utilizar enfoques alternativos. El trabajo Work Group Diversity que estoy comentando comparte esta conclusión, ya que uno de los autores es, precisamente, van Knippenberg.

Los autores pasan a comentar otro tipo de diversidades distintas de las demográficas, otras formas de evaluar cómo de diferentes son los miembros de un grupo, interseccionalidad entre diversidades, efectos de la diversidad a lo largo del tiempo, relaciones no lineales de la diversidad y otros temas.

Resumen:

  • La diversidad de un grupo puede no tener ningún efecto

  • Si tiene algún efecto, típicamente es negativo para la cohesión del grupo, pero no siempre

  • Si tiene algún efecto, puede ser negativo o positivo para el rendimiento del grupo

¿Qué efectos tiene la diversidad de sexo en un grupo de trabajo?

Hasta ahora, todo lo que hemos visto se refiere a la diversidad en general, siendo el sexo una de las muchas variables consideradas. Entonces, siguiendo las conclusiones generales, la diversidad de sexo es típicamente negativa para los grupos de trabajo. Pero, claro, "típicamente". Ahora vamos a examinar los efectos (si hay alguno) positivos y negativos de la diversidad de sexo en detalle. En el meta-análisis de Philips y O'Reilly (1998) [4], podemos encontrar estas conclusiones en la página 108:
The results of research on gender diversity suggest that the proportion of men and women in the sample may be an important predictor of the results. In general, gender diversity has negative effects on groups, especially on males. It is associated with higher turnover rates, especially among those who are more different. Men display lower levels of satisfaction an commitment when they are in the minority, while women appear less likely to have a negative psychological reaction. This is despite the fact that men in female-dominated groups are more likely to be accepted, less likely to be trated with hostility, and less likely to be stereotyped.
Traducción:
Los resultados de la investigación en diversidad de sexo sugieren que la proporción de hombres y mujeres en la muestra puede ser un importante predictor de los resultados. En general, la diversidad de género tienen un impacto negativo en los grupos, especialmente en hombres. Está asociada con altos ratios de rotación de personal, especialmente entre aquellos que son más diferentes. Los hombres muestran niveles de satisfacción y compromiso más bajos cuando están en minoría, mientras que las mujeres son menos propensas a experimentar una reacción psicológica negativa. Esto es a pesar del hecho de que los hombres en grupos dominados por mujeres son más propensos a ser aceptados, menos propensos a ser tratados con hostilidad y menos propensos a ser estereotipados.
Si nos vamos al apartado en donde analizan la relación entre la diversidad sexual y el desempeño del grupo de trabajo (página 107) encontramos:
In the laboratory the effects of gender diversity on group performance (cognitive or creative tasks) are mixed.
[...]
In organizational settings, studies examining the effects of sex diversity on group performance outcomes have found negative effects when the sample was male-dominated and no effect when the sample was female-dominated. Pelled (1997) found an indirect negative effect of gender diversity on a group's perceived productivity in a study of 42 organizational work teams. Sex diversity led to increased levels of emotional conflict, resulting in decreased productivity. Kizilos, Pelled, and Cummings (1996), using a sample that was less than 10 percent female, examined the effect of gender diversity on prosocial behavior. [...] The authors found a negative relationship between sex diversity and prosocial behavior toward customers. [...] In a study using a sample over half of whom were female, O'Reilly, Williams, and Barsade (1997) found no significant direct or indirect relationship between gender diversity and group performance measures.
Traducción:
En el laboratorio, los efectos de la diversidad de sexo en el rendimiento del grupo (tareas cognitivas o creativas) son mixtos.
[...]
En entornos organizativos, los estudios que examinan la diversidad de sexo en el rendimiento del grupo han encontrado efectos negativos cuando la muestra es mayoritariamente masculina y ningún efecto cuando la muestra es mayoritariamente femenina. Pelled (1997) [7] encontró un efecto indirecto negativo entre la diversidad de género y la productividad percibida del grupo en un estudio de 42 grupos de trabajo en una organización. Kizilos, Pelled y Cummings (1996), usando una muestra que tenía menos del 10 por ciento mujeres, examinaron los efectos de la diversidad de sexo en el comportamiento prosocial. [...] Los autores encontraron una relación negativa entre la diversidad de sexo y el comportamiento prosocial hacia los clientes. [...] En un estudio utilizando una muestra en la que más de la mitad eran mujeres, O'Reilly, Williams y Barsade (1997) [8] no encontraron relaciones significativas directas o indirectas entre diversidad de género y medidas de rendimiento de los grupos.
Pues parece que seguimos con la mismos resultados. Los efectos, cuando los hay, tienden a ser negativos.
En el meta-análisis se analizan otras variables en función de la diversidad de sexo como la satisfacción personal de los individuos dentro del grupo o la opinión sobre el rendimiento que los miembros del grupo tienen sobre otros miembros del grupo. Yo me he querido centrar en la parte en la que se comenta el rendimiento de los grupos.

¿Hay alguna forma de diversidad cuyos efectos sean generalmente positivos? 

Sí, la hay. En el meta-análisis de Philips y O'Reilly (1998) [4] podemos encontrar que la diversidad de trasfondo (background diversity) tiene resultados generalmente positivos. En la página 101:
Functional background may serve as a proxy for the information, knowledge, skills, and expertise that individuals bring to a group. The research suggest that the diversity of information functionally dissimilar individuals bring to the group improves performance in terms of creativity, but not necessarily implementation. For example, functionally diverse groups are slower (Hambrick, Cho, & Chen, 1996) and have lower cohesion than homogeneous groups (Ancona & Caldwell, 1992, p. 338). However, the overall evidence strongly suggest that functional diversity is likely to stimulate task conflict and improve performance (Jehn, Northcraft, & Neale, 1997; Pelled, Eisenhardt, & Xin, 1997).
Traducción:
El trasfondo funcional puede servir como aproximación de la información, conocimiento, habilidades y competencias que los individuos traen al grupo. La investigación sugiere que la diversidad de información funcionalmente diferente que los individuos traen al grupo mejora el rendimiento en términos de creatividad, pero no necesariamente de implementación. Por ejemplo, los grupos funcionalmente diversos son lentos (Hambrick, Cho & Chen, 1996) [9] y tienen menos cohesión que los grupos homogéneos (Ancona & Caldwell, 1992, p. 338) [10]. Sin embargo, la evidencia general sugiere fuertemente que es probable que la diversidad funcional estimule el conflicto en las tareas y mejore el rendimiento (Jehn, Northcraft & Neale, 1997 [11]; Pelled, Eisenhardt & Xin, 1997 [12]).
Parece que es buena idea juntar grupos multidisciplinares ya que obtienen generalmente buenos resultados.
Tiene sentido, ya que cuanta más información se tiene se puede tomar una mejor decisión. La parte negativa estriba en que, al tener mayor información, el grupo necesita más tiempo para organizarla y tomar una decisión. Por supuesto, no nos libramos del efecto negativo en la cohesión de grupo que llevamos viendo a lo largo de los diferentes tipos de diversidad.

Upper Echelons Theory

Podríamos traducir el nombre de esta teoría como "La teoría de los niveles altos". No obstante, al ser un nombre propio, respetaré el nombre original. Esta teoría fue desarrollada por Donald C. Hambrick en 1984 y revisada en 2007 [13]. La propia revisión de 2007 nos resume el modelo de la UET:
The central idea in our original paper, and the core of upper echelons theory, has two interconnected parts: (1) executives act on the basis of their personalized interpretations of the strategic situations they face, and (2) these personalized construals are a function of the executives' experiences, values, and personalities
Traducción:
La idea central de nuestro artículo original, y el núcleo de la upper echelons theory, tiene dos partes interconectadas: (1) los ejecutivos actúan en base a sus interpretaciones personales de las situaciones estratégicas a las que se enfrentan, y (2) estos constructos personalizados se definen en función de las experiencias, valores y características personales de los ejecutivos.
Así pues, las características de los ejecutivos predecirían las decisiones que toman y, a su vez, el rumbo de la empresa. Entonces, podría ser que determinadas características se asociaran con mejores decisiones y, por tanto, fueran más deseables que otras.

Ahora nos surge un problema. Si vamos a testar el modelo con datos del mundo real, ¿cómo determinamos qué características tiene cada ejecutivo? No es que se pueda ir haciendo test psicotécnicos a los ejecutivos o preguntándoles por sus experiencias pasadas alegremente. El artículo nos explica la forma que han tenido los investigadores del model UET para aproximar este problema:
demographic characteristics of executives can be used as valid, albeit incomplete and imprecise, proxies of executives' cognitive frames. [...] researchers can reliably use information on executives' functional backgrounds, industry and firm tenures, educational credentials, and affiliations to develop predictions of strategic actions.
Traducción:
las características demográficas de los ejecutivos se pueden usar como proxies válidos, aunque incompletos e imprecisos, de los marcos cognitivos de los ejecutivos. [...] los investigadores pueden usar de manera confiable información sobre los trasfondos funcionales, permanencia en la industria y en otras empresas, educación, y afiliaciones de los ejecutivos para desarrollar predicciones de decisiones estratégicas.
A partir de aquí, el autor comenta algunas limitaciones y críticas de su propio modelo que paso a resumir brevemente:
  • El modelo UET se basa en la premisa de que las mesas de dirección son muy influyentes en el rendimiento de la empresa. Esto puede no ser verdad, según Paul J. DiMaggio y Walter W. Powell, que defienden que las empresas están tan restringidas por normativas y otras influencias externas que provocan que los ejecutivos tengan poco margen de maniobra. Entonces, la UET sólo tendría sentido en aquellas circunstancias en las que la cúpula directiva de la empresa tenga libertad para tomar decisiones. 
  • No todas las mesas de dirección funcionan igual. Según la organización de cada empresa, los directivos tienen más o menos carga de trabajo. Un ejecutivo con mucha carga de trabajo tenderá a tomar decisiones sin pensar demasiado, lo que reflejará sus sesgos derivados de su trasfondo. Por contra, un ejecutivo menos estresado tendrá tiempo para analizar y decidir más objetivamente, lo que iría en contra la UET.
  • La posibilidad de causalidad inversa. El modelo UET utiliza el trasfondo de los ejecutivos como variable independiente, pero tal vez ocurra que determinados perfiles de personas se vean atraídos hacia determinados perfiles de industria. Por ejemplo, el modelo predice que las personas con perfil técnico tienen a invertir en I+D. Sin embargo, ocurre que las personas de perfil técnico son las que tienen más posibilidades de ascender en una empresa que invierte en I+D. O sea, ¿es la empresa la que invierte en I+D porque tiene más ejecutivos de perfil técnico, o es debido a que invierte en I+D que las personas con perfiles técnicos han progresado y llegado a la mesa de dirección?
  • La endogamia dentro de las empresas también presenta un problema. Por ejemplo, el modelo predice que las personas de un determinado perfil tienden a tomar determinadas decisiones. Pero, tal vez, lo que está ocurriendo es que las mesas de dirección están seleccionando individuos con un perfil determinado para tomar dichas decisiones. O sea, no se trata de que una persona ha llegado a la mesa de dirección y toma una serie de decisiones de acuerdo a su perfil. Sino que se necesitaban tomar una serie de decisiones, y la mesa de dirección decide colocar a una persona cuyo perfil se ajusta a las decisiones que hay que tomar para que lo haga.
El problema de fondo de todo esto es que no se puede realizar un estudio controlado colocando personas con diferentes características en distintas empresas y observar qué decisiones toman, así que sólo queda tomar datos del mundo real y analizarlos estadísticamente a ver si encajan. Es en ese momento cuando surgen las limitaciones anteriormente comentadas.

Finalmente, cito una de la últimas observaciones del autor del modelo:
So, when upper echelons researchers assert that executives matter, we don't mean that they only matter positively. They matter for good and for ill.
Traducción:
Así que, cuando los investigadores del UET afirman que los ejecutivos importan, no significa que solo importan positivamente. Importan para lo bueno y para lo malo.

La teoría feminista de la diversidad en las mesas de dirección

Para presentar la teoría feminista voy utilizar la explicación ofrecida en el meta-análisis de Post y Byron (2015) [14]. Concretamente, en el título "Female Representation on Boards and Firm Financial Performance" (Representación femenina en las mesas de dirección y el rendimiento financiero de la empresa".
According to UET, directors’ cognitive frames, that is, their information-seeking and information evaluation processes (Hambrick, 2007), are contingent on their experiences, knowledge and values. And, because these experiences, knowledge, and values shape how directors seek and interpret information, directors’ cognitive frames shape board decisions, decision-making processes, and, ultimately, firm outcomes. In this study, we argue that, because, in general, female and male directors may differ in their cognitive frames, director heterogeneity in terms of gender is likely to influence firm performance
Traducción:
De acuerdo al UET, los marcos cognitivos de los directivos, esto es, los procesos de búsqueda y evaluación de la información (Hambrick, 2007) [13], son contingentes con sus experiencias, conocimientos y valores. Y, debido a que dichas experiencias, conocimientos y valores conforman cómo los directivos buscan e interpretan la información, los marcos cognitivos de los directivos conforman las decisiones de la mesa de dirección, los procesos de decisión y, en última instancia, los resultados de la empresa. En este estudio, defendemos que, debido a que, en general, directores y directoras pueden diferir en sus marcos cognitivos, la heterogeneidad en términos de sexo es posible que influya el rendimiento de la empresa.
Con todo lo visto hasta ahora, estoy seguro que ya podéis entender cómo se hace para "rodear" el hecho de que la diversidad de sexo en los grupos de trabajo no da buenos resultados y defender que añadir mujeres a un grupo de hombres puede resultar en una mejora. El asunto es que no se trata del hecho de añadir mujeres en sí mismo, sino que añadir mujeres conlleva agregar diferentes marcos cognitivos (experiencias, conocimientos...). Dichos marcos vendrían a ser, más o menos, lo que Philips y O'Reilly llamaban diversidad de trasfondo. Y juntar gente con diversidad de trasfondo es generalmente bueno para el rendimiento del grupo.

El meta-análisis pasa ahora a justificar el hecho de que las mujeres pueden tener diferentes marcos cognitivos por el hecho de ser mujeres. Para ello, enumera una serie de diferencias entre directivos y directivas (ojo: entre directivos y directivas, no entre hombres y mujeres en general). Siguiendo el modelo UET, dichas diferencias deberían de traducirse en un comportamiento diferenciado de directivos y directivas.

El meta-análisis sigue con la justificación de que añadir diversidad de información mejora el rendimiento del grupo. Tal y como hemos visto anteriormente, este punto estaría respaldado por la evidencia. La sutil diferencia es que aquí tenemos que aceptar que incluir mujeres es equivalente a incluir diferencias en la información.

Críticas a la teoría feminista

Lo primero que hay que destacar es que, para justificar la supuesta diferente información que traen las mujeres, el meta-análisis de Post y Byron (2015) [14] pone como evidencia diferencias entre hombres directivos y mujeres directivas, no entre hombres y mujeres en general. Lógicamente, los hombres y mujeres en los puestos de dirección no son una muestra representativa de los hombres y mujeres en general y no podemos aplicar directamente los resultados del meta-análisis de Philips y O'Reilly (1998) [4]. El problema es que, de la misma forma, tampoco tiene por qué ser verdad que la diversidad de información de buenos resultados en las mesas de dirección.

El siguiente problema es que el modelo UET predice que las decisiones de los directivos están relacionadas con su marco cognitivo, pero no dice que cualquier característica del marco cognitivo esté relacionada con las decisiones que toman. Por ejemplo, en el meta-análisis de Post y Byron (2015) [14] podemos encontrar entre las diferencias entre hombres y mujeres directivos que:
In a study of new director appointments of UK firms, Singh and her colleagues (2008) found that, as compared to new male directors, new female directors were more likely to be non-nationals. [...] Additionally, research examining differences between female and male directors found that female directors report having a more diverse set of nonwork interests and to have greater interest in philanthropy and community service (Groysberg & Bell, 2013).
Traducción:
En un estudio de nuevos puestos de directivo en empresas de Reino Unido, Singh y sus colegas (2008) [15] encontraron que, comparadas con los nuevos directivos hombres, las nuevas directivas tenían mayor probabilidad de ser extranjeras. [...] Además, investigaciones que examinan las diferencias entre mujeres y hombres directivos encontró que las directivas afirman tener una mayor diversidad de intereses fuera del trabajo y tener un mayor interés en la filantropía y los servicios comunitarios (Gorysberg & Bell, 2013) [16].
Vale, y ahora, ¿cómo se relaciona que las directivas tiendan a ser extranjeras o que tengan interés el servicio comunitario con su rendimiento en las mesas de dirección específicamente? No se trata de negar las diferencias de trasfondo entre hombres y mujeres, sino que tal vez dichas diferencias no supongan ninguna influencia en su desempeño en las mesas de dirección (tal vez sí que puedan suponer una diferencia en otro tipo de situaciones). En el meta-análisis citan otras diferencias que están más relacionadas con el mundo laboral, pero mi argumento sigue en pie: no está claro cuánta influencia (si hay alguna) tienen cada una de esas diferencias en el resultado final.

Resultados de las investigaciones

Bueno, vale ya de tanta teoría. Vamos a ver qué nos dicen las investigaciones que se han realizado sobre la diversidad de sexo en las mesas de dirección. Para ello vamos a comentar el resultado de dos meta-análisis, el de Post y Byron (2015) [14] y el de Pletzer, Nikolova, Kedzior, and Voelpel (2015) [17]. Además, se da la circunstancia de que el segundo comenta los resultados del primero.

El meta-análisis de Post y Byron reúne 140 estudios que comprenden datos de más de 90.000 empresas (aunque puede que alguna empresa esté repetida):
One hundred forty (140) studies met the criteria for inclusion; these studies [...] include 92 journal articles, 8 theses or dissertations [...] conference or working papers, 4 technical reports, and 1 book chapter. Because some of the studies had multiple independent samples, the 140 studies included 144 independent samples, which represent separate effect sizes by industry sector or by country. These studies’ combined sample size consists of 90,070 firms (although this number may include some duplicate firms [...])
Traducción:
Ciento cuarenta (140) estudios cumplieron con los requisitos de inclusión; estos estudios [...] incluyen 92 artículos de revistas, 8 tesis o disertaciones [...] conferencias o estudios no publicados, 4 informes técnicos y un capítulo de un libro. Debido a que algunos de los estudios tiene múltiples muestras independientes, los 140 estudios incluyen 144 muestras independientes, que representan efectos de diferentes tamaños por sector industrial o por país. El tamaño combinado de las muestras de estos estudios consiste en 90.070 empresas (aunque este número puede que incluya algunas empresas duplicadas [...])
Por otro lado, Pletzer y sus colegas incluyen 20 estudios extraídos de revistas científicas que realizan revisión por pares:
Unlike Post and Byron, we only searched for (and included) studies published in peer-reviewed academic journals.
[...]
Data were extracted independently by three authors of this study from k = 20 studies (Post and Byron included 13 of the 20 studies from our sample in their analysis),
Traducción
A diferencia de Post and Byron, nosotros sólo hemos buscado (e incluido) estudios publicados en revistas académicas con revisión por pares.
[...]
Los datos fueron extraídos independientemente por los tres autores de este estudio de los k = 20 estudios (Post y Byron incluyeron 13 de los 30 estudios de nuestra muestra en su análisis),
Y el resultado final es (del apartado "Discussion" de Pletzer, Nikolova, Kedzior, and Voelpel (2015) [17]:
The main finding of the current study, based on data from 20 studies [...] published only in peer-reviewed academic journals, is that the relationship between the percentage of female directors on corporate boards and firm financial performance is consistently small and non-significant. The general magnitude of this result is in line with findings of Post and Byron, who, based on data from 140 published and unpublished studies, also found a small correlation between gender diversity on corporate boards and firm financial performance. This is especially noteworthy, because both meta-analyses are based on different study samples and different operationalizations of the main measures (female representation and firm performance), providing further evidence to conclude that female representation and firm performance are not strongly associated. Interestingly, the two meta-analyses differ in that Post and Byron find a statistically significant correlation between increased gender diversity on corporate boards and higher accounting returns. But concluding that a higher female representation on corporate boards has practical implications for the generation of profits from assets and investments seems debatable due to the overall small effect size. By testing the relationship of interest with our more rigorous and controlled methodological approach (for example, by including only peer-reviewed and published studies), we provide further evidence that female representation on corporate boards is not associated, positively or negatively, with firm performance.
Traducción (negritas mías):
El hallazgo principal del actual estudio, basado en los datos de 20 estudios [...] publicados sólo en revistas académicas con revisión por pares, es que la relación entre el porcentaje de mujeres directivas en las mesas de dirección y el rendimiento financiero de la empresa es consistentemente pequeño y no significativo. La magnitud general de este resultado está en línea con los hallazgos de Post y Byron, quienes, basándose en datos de 140 estudios publicados y no publicados, también encontraron una pequeña correlación entre la diversidad de sexo en las mesas de dirección y el rendimiento financiero de la empresa. Esto es especialmente notable, porque ambos meta-análisis están basados en muestras de estudios diferentes  y en diferentes metodologías de las medidas principales (representación femenina y rendimiento de la empresa), proveyendo todavía más evidencia para concluir que la representación femenina y el rendimiento de la empresa no están fuertemente asociadas. Curiosamente, los dos meta-análisis se diferencian en que Post y Byron encuentra una correlación estadísticamente significativa entre el incremento de la diversidad de sexo en las mesas de dirección y un mayor rendimiento contable. Pero concluyendo que el hecho de que a mayor representación femenina en las mesas de dirección tiene implicaciones prácticas para la generación de beneficios a partir de activos e inversiones es discutible debido al tamaño tan pequeño del efecto. A partir de testar la relación de interés con una aproximación metodológica más controlada y rigurosa (por ejemplo, a través de incluir sólo estudios publicados y revisados por pares), añadimos más evidencia de que la representación femenina en las mesas de dirección no está asociada, ni positiva ni negativamente, con el rendimiento de las empresas.
Así pues, después de tanta teoría, resulta que te da lo mismo poner hombres o mujeres en los puestos de dirección. No obstante, en la cita comentan que Post y Byron muestra una correlación significativa aunque muy pequeña. Vamos a verla:
Our results suggest that firms with greater female board representation tend to have higher accounting returns (r = +0.047)
Traducción:
Nuestros resultados sugieren que las empresas con mayor representación femenina tienen a tener mejores rendimientos contables  (r = +0.047)
Esto lo que quiere decir es que el 0,047% de la varianza en los beneficios de una empresa se explica a partir de el porcentaje de mujeres en la mesa de dirección. Y como se comenta en la cita del otro meta-análisis, el efecto es demasiado pequeño.

Y todos estos resultados, tienen un inconveniente todavía mayor. Aunque se hubiera encontrado correlación entre mujeres en la mesa de dirección y rendimiento de la empresa, faltaría demostrar la relación causal entre ambas (o sea, que realmente más mujeres en la mesa de dirección tiene como consecuencia un aumento de los beneficios). Este es el problema que había comentado en el apartado anterior, que en ninguna parte hay una demostración de que los diferentes marcos cognitivos entre hombres y mujeres se traduzcan en diferentes decisiones en el ámbito de los consejos de dirección.

Estudios que demuestran que la diversidad de sexo en las mesas de dirección da beneficios (y por qué no funcionan)

Por supuesto, no faltan estudios que observan la realidad y concluyen que las empresas aumentan sus beneficios cuando hay mujeres en sus mesas de dirección. Las feministas los presentan una y otra vez. El problema de esto lo comenta el meta-análisis de Post y Byron (2015) [14]:
Although business and government leaders have argued for increasing the presence of women on boards [...] whether this improves firm performance is unclear. Despite a relatively large literature examining the relationship between female board representation and firm performance, the empirical evidence is decidedly mixed. Some studies suggest that female directors add value, finding that firms with more female directors tend to generate higher returns on assets (Nguyen & Faff, 2012; Singh, Vinnicombe, & Johnson, 2001) and elicit positive stock market reactions (Campbell & Minguez-Vera, 2010). In contrast, other studies suggest that female directors decrease firm performance, finding that firms with more female directors experience lower accounting returns (Darmadi, 2011; Minguez-Vera & Martin, 2011) and an overall loss of value for stockholders (Bøhren & Strøm, 2010). Further muddying the waters, several studies have concluded that female board representation is unrelated to firm performance (Carter, D'Souza, Simkins, & Simpson, 2010; Rose, 2007; Shrader, Blackburn, & Iles, 1997).
Traducción:
Aunque líderes empresariales y gubernamentales han defendido el incremento de la presencia de las mujeres en las mesas de dirección [...]  no está claro que esto mejore el rendimiento de la empresa.  A pesar del relativamente largo corpus que examina la relación entre la representación femenina y el rendimiento de la empresa, la evidencia empírica es decididamente mixta. Algunos estudios sugieren que las directivas añaden valor, encontrando que las empresas con más directivas tienen a generar mejores devoluciones de activos (Nguyen & Faff, 2012 [18]; Singh, Vinnicombe, & Johnson, 2001) [19] y obtener reacciones positivas del mercado de valores (Campbell & Minguez-Vera, 2010 [20]). En contraste, otros estudios sugieren que las directivas decrementan el rendimiento de la empresa, encontrando que las empresas con más directivas experimentan rendimientos contables más bajos (Darmadi, 2011 [21]; Minguez-Vera & Martin, 2011 [22]) y una pérdida general de valor para los accionistas (Bøhren & Strøm, 2010 [23]). Para complicar más las cosas, varios estudios han concluido que la representación femenina en las mesas de dirección no está relacionada con el rendimiento de la empresa (Carter, D'Souza, Simkins, & Simpson, 2010 [24]; Rose, 2007 [25]; Shrader, Blackburn, & Iles, 1997 [26]).
En resumen, que hay estudios de todos los gustos y escogiendo unos u otros puedes dar la impresión que te dé la gana (positiva, negativa o ausencia de relación). Esta conclusión seguiría la línea presentada al principio del artículo, de que la diversidad presenta resultados generalmente inconsistentes.

Cabe destacar que uno de los estudios que cita el meta-análisis fue realizado en España (Minguez-Vera & Martin, 2011 [22]), en medianas y pequeñas empresas, y tuvo como resultado que el rendimiento de las empresas empeoraba con la presencia de mujeres. Los autores lo achacan a la elección por parte de las directivas de estrategias menos arriesgadas.

Conclusión

Tras todo lo visto, se pueden tomar dos posturas. La primera postura asumiría que la evidencia que rodea a la presencia de mujeres en los puestos de dirección es inconsistente al existir estudios que muestran influencias positivas, negativas o ausencia de relación. La otra postura es aceptar la ausencia de relación basándose en los dos meta-análisis presentados ya que es la postura que más apoyo empírico tiene. En ambos casos, la conclusión es que no puede asociarse la presencia de mujeres en la mesa directiva con una mejora del rendimiento de la empresa.

Una forma de conciliar las posturas podría ser que la regla general sea que no hay relación pero que existen circunstancias especiales en los que la presencia femenina en la mesa de dirección sí influye en los resultados de la empresa (para bien o para mal).

Bibliografía

1. Gender Diversity on Boards & Why it Matters
https://www.boardeffect.com/blog/gender-diversity-board-of-directors/

2. What Board Directors Really Think of Gender Quotas
https://hbr.org/2016/11/what-board-directors-really-think-of-gender-quotas

3. Work Group Diversity, van Knippenberg D, Schippers MC, 2007, https://www.ncbi.nlm.nih.gov/pubmed/16903805

4. Demography and Diversity in Organizations: A Review of 40 Years of Research, Katherine Y. Williams, Charles A. O'Reilly, 1998, https://ils.unc.edu/courses/2013_spring/inls285_001/materials/WIlliams.OReilly.1996.Diversity&demography.pdf

5. When Member Homogeneity is Needed in Work Teams: A Meta-Analysis, Bowers et al, 2000,
https://www.researchgate.net/publication/247720158_When_Member_Homogeneity_is_Needed_in_Work_Teams_A_Meta-Analysis

6. Impact of highly and less job-related diversity on work group cohesion and performance: a meta-analysis, Webber & Donahue, 2000, https://sigittaruna.files.wordpress.com/2014/10/impact-highly-and-less-job-related-sheila-simsarian-webber.pdf

7. Relational demography and perceptions of group conflict and performance: a field investigation, Pelled, 1997, https://www.emeraldinsight.com/doi/pdfplus/10.1108/eb022783

8. Group demography and innovation: Does diversity help?, O'Reilly, Williams & Barsade, 1997, https://www.researchgate.net/publication/232505430_Group_demography_and_innovation_Does_diversity_help

9. The Influence of Top Management Team Heterogeneity on Firms' Competitive Moves, Hambrick, Cho & Chen, 1996, https://www.researchgate.net/publication/271760849_The_Influence_of_Top_Management_Team_Heterogeneity_on_Firms%27_Competitive_Moves

10. Demography and Design: Predictors of New Product Team Performance, Ancona & Caldwell, 1992, https://pdfs.semanticscholar.org/2750/5da4b061ec1e843eb8b552d4682caf72c2e6.pdf

11. Exploring Pandora's Box; The Impact of Diversity and Conflict on Work Group Performance, Jehn, Northcraft & Neale, 1997, https://onlinelibrary.wiley.com/doi/abs/10.1111/j.1937-8327.1999.tb00118.x

12. Demographic diversity in work grou0pps An empirical assessment of linkages to intragroup conflict and performance, Pelled, Eisenhardt & Xin, 1997

13. Upper Echelons Theory: An Update, Donald C. Hambrick, 2007, https://www.researchgate.net/publication/276181695_Upper_Echelons_Theory_An_Update

14. Women on Boards and Firm Financial Performance: A Meta-Analysis, Corinne Post and Kris Byron, 2017, https://journals.aom.org/doi/abs/10.5465/amj.2013.0319

15. Newly  appointed directors in  the  boardroom: How do women and men differ?, Singh et al, 2008, https://dspace.lib.cranfield.ac.uk/bitstream/handle/1826/4221/Newly_appointed_directors_in_the_boardroom.pdf?sequence=1&isAllowed=y

16. Dysfunction in the Boardroom, Boris Groysberg, Deborah Bell, 2013, https://hbr.org/2013/06/dysfunction-in-the-boardroom

17. Does Gender Matter? Female Representation on Corporate Boards and Firm Financial Performance - A Meta-Analysis, Pletzer, Nikolova, Kedzior, and Voelpel, 2015, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4473005/

18. Impact of board size and board diversity on firm value: Australian evidence, Nguyen, Faff, 2006, https://www.researchgate.net/publication/290007015_Impact_of_board_size_and_board_diversity_on_firm_value_Australian_evidence

19. Women Directors on Top UK Boards, Singh, Vinnicombe, & Johnson, 2001, https://dspace.lib.cranfield.ac.uk/bitstream/handle/1826/964/Women_Directors_on_Top_UK_Boards-2001.pdf?sequence=1&isAllowed=y

20. Female board appointments and firm valuation: short and long-term effects, Campbell & Minguez-Vera, 2010, https://link.springer.com/article/10.1007/s10997-009-9092-y

21. Board Diversity and Firm Performance: The Indonesian Evidence, Darmadi, 2011, https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1727195

22. Gender and management on Spanish SMEs: An empirical analysis, Minguez-Vera & Martin, 2011, https://www.researchgate.net/publication/267311420_Gender_and_management_on_Spanish_SMEs_An_empirical_analysis

23. Governance and Politics: Regulating Independence and Diversity in the Board Room, Bøhren & Strøm, 2010, https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1468-5957.2010.02222.x

24. The Gender and Ethnic Diversity of US Boards and Board Committees and Firm Financial Performance, Carter, D'Souza, Simkins, & Simpson, 2010, https://www.researchgate.net/publication/227837358_The_Gender_and_Ethnic_Diversity_of_US_Boards_and_Board_Committees_and_Firm_Financial_Performance

25. Does female board representation influence firm performance? The Danish evidence. Corporate Governance: An International Review, Caspar Rose, 2007, https://www.researchgate.net/publication/4754152_Does_female_board_representation_influence_firm_performance_The_Danish_evidence_Corporate_Governance_An_International_Review_15_404-413

26. Women In Management And Firm Financial Performance: An Exploratory Study, Shrader, Blackburn, & Iles, 1997, https://www.jstor.org/stable/40604152