Siguiendo en la línea de mi post anterior, algunas muestras más generadas por el código que tengo y el tipo de preguntas o narrativas que se pueden generar cuando se examinan. En el caso anterior, a manera de ejemplo generé mapeos simples de términos como “PCP-SL” o “MRTA” en el documento de la cronología de eventos que está incluido en el Informe Final de la Comisión de la Verdad y Reconciliación. Aunque son interesantes, no son terriblemente profundos.
Pero también podemos hacer otros tipos de mapeos. Por ejemplo, si queremos hacer un poco de historia política reciente, podemos mapear búsquedas de los principales personajes de la historia política durante el periodo de violencia interna en el Perú entre 1978 y el año 2000. A manera de ejemplo, estos son los resultados de mapear en el documento la incidencia de los nombres de presidentes peruanos en este periodo (Belaúnde, García, Fujimori, Paniagua, Toledo), a lo largo del mismo periodo. Mayor o menor frecuencia puede indicar mayor o menor participación en la vida política a lo largo de este periodo, al menos en lo que refiere a lo documentado por la CVR.
Belaúnde:
1978: ##1 1979: ##1 1980: ###################################12 1981: #######################8 1982: ############################################15 1983: ##################################################17 1984: #########################################14 1985: ##1 1986: ##1 1987: ##1 1988: ########3 1989: ##1 1990: ##1 1991: ##1 1992: ##1 1993: ########3 1994: ##1 1995: 0 1996: ##1 1997: 0 1998: ##1 1999: #####2 2000: #################6
García (el término es problemático por ser un apellido bastante común, se presta a usos potencialmente ambiguos):
1978: #1 1979: ###2 1980: 0 1981: #1 1982: ###2 1983: ########5 1984: ########5 1985: #####################################22 1986: ##################################################29 1987: ####################12 1988: #####################################22 1989: ##################################################29 1990: ####################12 1991: ######4 1992: ###############9 1993: ###2 1994: #############8 1995: ########5 1996: ###2 1997: #1 1998: #1 1999: ######4 2000: ########5
Fujimori:
1978: 0 1979: 0 1980: 0 1981: 0 1982: 0 1983: 0 1984: 0 1985: 0 1986: 0 1987: 0 1988: 0 1989: 1 1990: ########################42 1991: ######################38 1992: ###############################54 1993: ##############################52 1994: ###############################55 1995: ################################56 1996: #########################43 1997: ##########################46 1998: ##############25 1999: #############################51 2000: ##################################################86
Paniagua:
1978: 0 1979: 0 1980: 0 1981: 0 1982: ##########1 1983: 0 1984: ##########1 1985: 0 1986: 0 1987: 0 1988: 0 1989: 0 1990: 0 1991: 0 1992: 0 1993: 0 1994: 0 1995: 0 1996: 0 1997: 0 1998: 0 1999: 0 2000: ##################################################5
Toledo:
1978: 0 1979: 0 1980: 0 1981: 0 1982: 0 1983: 0 1984: 0 1985: 0 1986: 0 1987: 0 1988: 0 1989: #####2 1990: 0 1991: 0 1992: 0 1993: 0 1994: #######################8 1995: ########3 1996: 0 1997: 0 1998: 0 1999: #####2 2000: ##################################################17
Cuando vemos los mapeos en comparación, ¿qué tipo de observaciones podemos hacer? Primero que nada, podemos ver que las “estelas” de Belaúnde y García son más extensas que las de los demás. Como podríamos anticipar, Fujimori no existe antes del 89: la data no hace sino validar su categoría de “outsider” al sistema política partidario, y su incremento abrupto y marcado en los años subsiguiente coincide con el descenso en la frecuencia de los demás nombres – coincidente con el desmantelamiento de la clase política tradicional que operó el fujimorismo. Paniagua tiene un rol menor en los ochentas y luego virtualmente desaparece hasta la transición del 2000, mientras que Toledo registra solamente en periodos electorales (1995 y 2000).
En realidad estos cuadros no muestran nada que no sepamos ya – de hecho, a muchas de estas observaciones sólo podemos llegar porque ya sabemos muchas de estas cosas, y apenas comparamos nuestro conocimiento con lo que muestra la data. Lo interesante está, creo, en que la data, sin haber sido diseñado para eso (o para siquiera ser considerada como data) efectivamente valida estos patrones. Si no supiéramos varias de las cosas que ya sabemos, y trabajáramos con documentos menos estructurados, un análisis de este tipo nos mostraría tendencias para poder volver sobre estos vacíos y patrones y examinar en detalle por qué se dan discrepancias o se generan tendencias.
En este caso los ejemplos nos sirven más bien para validar que la herramienta efectivamente arroja datos válidos y por extensión, potencialmente interesantes. Si nos mostrara patrones que no tienen mayor sentido, alrededor de los no podemos construir una narrativa coherente, entonces pensaríamos o que el algoritmo está mal diseñado o que mi capacidad de programación es muy pobre. Felizmente, parece que ambas cosas no son (totalmente) ciertas porque de hecho tenemos resultados en apariencia válidos, con lo cual podemos seguir buscando nuevas cadenas y combinaciones y comparaciones que nos empiecen a insinuar cosas que no sabemos.
Con lo cual vale la pena mencionar algo más sobre el código: por ahora, a lo mucho hay una o dos funciones interesantes y una capacidad muy pobre de representación gráfica. Pero espero ir ampliando esto con el tiempo para darle mayor utilidad. Por lo cual cualquier feedback me sirve para ir pensando en maneras cómo se pueden generar interrogaciones sistemáticas extendiendo el código. Una de las primeras cosas que quiero agregar, además, es la capacidad para generar mejores gráficos que reflejen con mayor claridad los patrones, y quizás incluso con la capacidad de comparar múltiples resultados al mismo tiempo (por ejemplo, la data presentada arriba sería mucho más útil comparada lado a lado que como cinco gráficos separados). También quiero buscar la manera de hacer búsquedas por colocaciones (bigramas, trigramas o enegramas) para poder buscar nombres completos, nombres de organizaciones e instituciones.









