Anàlisi lexicomètrica i comparativa de dos blogs feministes: un en català, l’altre en anglès.

En aquest treball farem una anàlisi lexicomètrica de dos blogs feministes. Un blog en català “Feminisme crític. El blog de l’observatori IQ” i l’altre un blog  de Portland en anglès anomenat “Bitch Media“. En total analitzarem 28 entrades, 18 del blog en català i 10 del blog en anglès. Hem agrupat les entrades de cada blog, de manera que tenim dos corpus d’entrdades, un pel blog en català i l’altre pel blog en anglès. Per fer-ho utilitzarem el programa Antconc que ens permet calcular la freqüència d’aparició del mots, la concordança (analitzar la paraula en el context on apareix i la distribució de les ocurrències). També és interessant la funció “Clusters/N-Grams”, que permet analitzar les ocurrències de grups de paraules. Per exemple, en la nostra anàlisi el grup (dones+adjectiu) ens dona els següents resultats: “dones assassinades” apareix 4 vegades. És el grup de dos mots significatius relacionats amb el mot “dones” que apareix amb més freqüència. Dones joves, dones refugiades o dones treballadores apareixen 2 vegades cadascun. En el cas de blog en anglès hem cercat l’equivalent “women”, però li hem dit a Antconc que el grup de coincidència fos a la dreta (adjectiu+women), ja que en anglès l’adjectiu va primer que el nom. Els resultats: trans women (18 vegades), Black women (9) o white (7). Aquestes dades ens poden donar uns primers indicis de quins són els problemes que centren les activitats dels dos blogs.

Aquest treball està fet amb Word, el qual permet manejar i adjuntar documents de text. Qui vulgui consultar la versió completa del treball ho pot fer en aquest enllaç: Anàlisi lexicomètrica (cal descarregar el document i obrir-lo amb Word per tal de poder veure els documents de txt adjunts)

Feta aquesta breu introducció anem a exposar les primeres dades.

Primeres dades[1]

types i tokens sense ”stopwords”  (taula 1):

Image 12

Com que les dues mostres tenen una mida diferent alhora d’analitzar les paraules calcularem la freqüència absoluta i la relativa. D’altra banda, hem descarregat les llistes corresponents d’”stopwords” pel català i l’anglès per tal d’eliminar els tokens que no ens serviran per a l’anàlisi.

types i tokens amb stopwords (taula 2):

Image 14

La freqüència absoluta dels tokens no variarà en els dos casos (amb stopwords o sense), mentre que la freqüència relativa serà diferent en funció de si la calculem a partir dels mots significatius o no. En aquest cas, hem decidit calcular la freqüència relativa tenint en compte l’”stopwords” (taula 2).

Procedirem de la següent manera. Crearem una llista de paraules amb la freqüència absoluta. La freqüència de cada mot de la llista podrà ser comparada amb el seu equivalent en l’altra llengua. Per exemple, “dones” apareix 297 vegades, i el seu equivalent en anglès “women” 133. Això ens dóna els valor absoluts dels mots, però no els relatius. Per a poder comparar-los cal calcular la freqüència relativa:

Freq. Absol.  / nº tokens

Exemple 1: a partir del total dels tokens

dones: 297/26566= 0,011

“women”: 133/21515= 0,006

Exemple 2: a partir dels tokens amb significat

dones: 297/11750= 0,025

“women”: 133/8548= 0,015

D’aquí ja en podem extreure una mica d’informació. El blog en català el mot “dones té una freqüència relativa més alta que l’estatunidenc. Això por ser perquè el blog català està més centrat en les dones com a col·lectiu, que no pas el dels Estats Units o que el blog en anglès, malgrat ser feminista, diversifica més els temes i, per tant, no se centra tant en les dones com a grup.

Llista de freqüències absolutes:

Com ja hem pogut veure els 10 mots amb més freqüència absoluta són: dones (297), homes (169), women (133), people (131), abortion (103), gènere (85), violència (77), feminist (68), feminism (60), persones (54).

A les següents taules recollim els mots que ens interessen en funció de la freqüència absoluta i relativa. Hem descartat alguns mots, com “temps” que en principi no ens aportaven informació rellevant per al nostre objectiu. És a dir, hem seleccionat els mots que ens interessaven des del punt de vista del feminisme i l’activisme per a poder comparar les tendències dels dos blogs.

Freqüència absoluta i relativa sense stopword

Image 4

Freqüència absoluta i relativa amb stopword

Image 5

En aquesta taula podem comprovar, com ja hem dit, que el mot dones/women té més incidència en el blog català. El mateix passa amb el mot homes/men el qual té una freqüència relativa de 0,014 en el blog català (169 ocurrències), mentre que el blog de Portland la freqüència relativa és de 0,001 (11 ocurrències). Això ens indica que la dialèctica dones/homes és molt més accentuada en el blog català que no pas en el de Portland.

Anem ara a analitzar la distribució dels mots dones/women. Per això anem a “concordance plot” i cerquem els dos mots:

                                       dones                                                   women

Image 6

Podem comprovar que la distribució dels dos mots és bastant regular, sobretot en el blog català, amb una important concentració al final de la mostra, com també passa, encara que menys important a la mostra del blog de Portland. Això ens indica que algunes entrades estan exposant molt clarament la problemàtica de les dones/women en plural. Per a tenir més informació caldria analitzar les entrades per separat, però això excediria els objectius d’aquest treball.

Un altre mot interessant és Black que apareix 48 vegades, mentre que els seus equivalents en català negre, negra o negres no tenen cap ocurrència.

Image 7

Donem una ullada a la distribució del mot “Black”. Comprovem que l’aparició del mot és concentra a al centre del corpus, fet que ens indica que el mot està concentrat en una o dues entrades de la nostra mostra. Això sembla indicar que el tema racial és molt present en el blog de Portland, fet que ja es fa evident quan entrem al blog. Fins i tot, podríem deduir que és un tema molt important als Estats Units i que l’activisme feminista aglutina moltes altres reivindicacions i drets socials. Això és pot constatar també en l’ocurrència del mot “rights” que apareix en 38 ocasions i en català 15.

Tanmateix, el mot Black per si sol ens diu poca cosa, tot i que ja ens dóna una idea e quins temes preocupen als articulistes del blog. Si volem analitzar el context on apareix aquest mot per tal de tenir informació rellevant cal anar a “Concordance”.

Image 8

Podem comprovar que el mot “Black” va acompanyat sovint de “woman”, “women”, “people”. D’altres de mots com resistance o derivats de “power”.

“Black women”: 9 vegades; “Black woman”: 3 vegades; “Black people”: 8 vegades.

Podem deduir que el sentit de col·lectiu és bastant fort, ja en 16 ocasions el mot “Black” va seguit d’una paraula que fa referència al col·lectiu: women (plural), people. Altres mots, com power o resistance indiquen lluita i resistència.

Afinem una mica més el context anant a “Clusters/n-grams” i li diem que analitzi les paraules que acompanyen el mot “Black” tant a la dreta com a l’esquerra.

Image 9

Els grups de dues paraules amb “Black a l’esquerra són els que hem indicat suara (Black women, etc.). En els grups de dues paraules amb “Black” a la dreta apareixen expressions com “abuses black”, “against black” o “violence black”.

A partir d’aquí podem analitzar qüestions relacionades amb la violència fent ús de mots com: violència/violence; assassinades/kill; mortes/die, etc.

En el blog català el mot dones apareix relacionat amb el mot “assassinades” en cinc ocasions, mentre que mortes apareix en 4 ocasions. En tot cas, el mot que es repeteix en més ocasions és “violència” (77 ocurrències) de les quals 21 vegades constitueix el grup “violència masclista” (21 ocurrències).

Image 10

En el blog de Portland mots com “killed”, “death”, “murdered”, etc. semblen tenir menys incidència: “killed” (5), “death” (6) i “murdered” i “homicides” (1). El mot “violence” arriba a les 13 ocurrències, mostrant una important diferència tant absoluta com relativa respecte del blog català. Violència té una freqüència relativa de 0,006, mentre que violence de 0,001, és a dir, 6 vegades menys. Interpretar aquestes dades es fa difícil sense tenir més informació de conjunt de les dues societats. El concepte “violència masclista” és molt important en el blog català, un concepte que no apareix al blog Bitch Media.

Image 11

En canvi el mot “Thrump” apareix fins a 24 vegades al blog Bitch Media. Si analitzem el context podem comprovar que Trump i la seva administració s’han convertit en un motiu de lluita afegit. També resulta interessant comprovar que el mot “Catalunya” té una ocurrència de 27 vegades, mentre que “United States” de 12. Això sembla indicar que el referent territorial és més accentuat en el cas de Catalunya. De totes maneres, com ja hem dit, cal prendre aquestes consideracions amb cautela, ja que depenen de molts factors, com per exemple el fet que “country” apareix fins a 23 i “our country” 3 vegades; “país” 12 i “nostre país” 5 vegades. El possessiu sembla indicar un sentit de pertinència més acusat en el cas català (seguim sense tenir prou context, ja que sense una lectura amplia dels articles és difícil saber a quin país es refereixen).

Conclusions

Les dades que es poden extreure dels diferents corpus són molt variades i sovint dependran dels objectius de la nostra anàlisi, és a dir, quins són els factors que ens interessen en cada moment. En aquest breu treball ens hem limitat a uns pocs factors, atès que un estudi en profunditat necessita d’altres dades significatives que el programa Antconc no pot proporcionar. D’altra banda, l’anàlisi de dos blogs escrits en llengües diferents i pertanyents a dues realitats relativament també diferents, reclama un estudi més aprofundit d’aquestes dues realitats per tal de no caure en la superficialitat de les dades aportades per Antconc. Una anàlisi d’aquesta magnitud sobrepassa els objectius d’aquest treball. Per això ens hem limitat a valorar superficialment algunes dades, com la freqüència de determinats mots per establir una taula comparativa que ens permetés constatar possibles diferències entre dos blogs feministes que, en principi, haurien de compartir una línia d’anàlisi de la realitat feminista.

El blog “Bitch Media” (en realitat és un conjunt de blogs)

Sempre tenint en compte que l’anàlisi, com hem dit, no pot passar d’unes valoracions superficials, podem dir que el blog dels Estats Units en anglès diversifica més la temàtica, és a dir, no només se centra en qüestions feministes pròpiament dites, sinó que el racisme hi té un paper molt important, sobretot pel que fa al tema dels negres dins la societat americana. Una altre qüestió rellevant per al blog estatunidenc és el dret de les dones a  l’avortament, una qüestió que cal analitzar dins la complexa societat americana on no tots els estats es regeixen per les mateixes lleis. Enllacem una notícia del diari Ara sobre la qüestió de l’avortament als Estats Units http://www.ara.cat/internacional/Suprem-EUA-lavortament-derogant-Texas_0_1603039864.html que serveix per a il·lustrar la lluita en la defensa del dret a l’avortament. No és estrany que la lluita per la igualtat social i de les dones vagi acompanyat del mot “rights” (en plural), fins a 38 vegades o “law” (24) i “laws” (11). Sembla evident que la lluita passa per la constitució de lleis que salvaguardin els drets de les dones i els col·lectius dins el conjunt de la societat estatunidenca.

El blog “Feminisme crític”

En el blog català, com hem dit, destaca la dialèctica dels mots “dones”/”homes” que dona la impressió que no s’ha produït una veritable emancipació del moviment feminista del mot “home”. Si haguéssim de fer ús de la teoria del marc mental de Lakoff podríem dir que existeix la necessitat d’evocar el marc conceptual “home/homes” o “masclista/masclistes”. És difícil fer valoracions sobre aquesta qüestió, ja que sense un coneixement profund del moviment la impressió és que el feminisme encara gira al voltant d’un referent: els “homes”. Com diu Lakoff cada vegada que pronuncies un mot, encara que sigui per a negar-lo, l’estàs evocant. Dit d’una altra manera, sembla que el feminisme no pot prescindir d’aquest marc mental o, i més no, no ha sabut canviar-lo. D’altra banda, a diferència del blog estatunidenc el blog català diversifica menys la temàtica i sembla que estar molt centrat en la problemàtica de les dones, gènere i violència (masclista). L’aparició dels mots igualtat (22 vegades) i desigualtats (23), juntament amb el marcat caràcter feminista des blogs indiquen una reivindicació dels drets de les dones, no només en l’àmbit de la llei, sinó també en l’àmbit social, és a dir, en el dia a dia. Que no n’hi prou amb les lleis, sinó que cal consciència social d’igualtat podria ser una de les conclusions del blog català.

Valoració de conjunt

Una breu anàlisi de conjunt ens indica que el terme dones/women és el més freqüent amb un total de 430 incidències i que mots com work/treball (amb 37 i 36 incidències, total 73) ocupen un espai relativament important en els discursos dels dos blogs, així com vida/life amb un total de 61 aparicions. La parella violència/violence és emprada en 90 ocasions, fet que indica la importància d’aquest factor. Finalment, l’ús dels mots autorreferencials com feminism-feminist-feminists són molt acusats en el blog estatunidenc amb un total 163 (0,019 de freqüència relativa), mentre que en al cas català és de 31 (0,002 de freqüència relativa), donant un total de 194 ocurrències. Això ens indica que l’autoafirmació com a grup és molt important pel feminisme, molt marcat, en el cas del blog Bitch Media.

————————————————————————————————————————————

[1] En lloc de fer captures de la pantalla, que només permeten veure un fragment del llistat, he extret els resultats en un fitxer de text. Això es pot fer dins Antconc anant a File i save output to text file. Per a obrir el text adjunt en el document Word cal posar-se damunt el document adjunt, pitjar botó de la dreta del ratolí, objecte empaquetador del Shell i activar contingut.

Un pensament sobre “Anàlisi lexicomètrica i comparativa de dos blogs feministes: un en català, l’altre en anglès.

  1. Em sembla increïble l’anàlisi que has fet. No tinc paraules! I jo aquí barallant-me amb el programa!

    Moltíssimes felicitats!

    Alba

    M'agrada

Deixa un comentari