martes, 30 de mayo de 2017

Anàlisi Lexicomètrica




Segons Borja Navarro AntConc és un programa per analitzar i extreure dades d'amplis corpus textuals com són la freqüència de les paraules, concordances, per  buscar les expressions regulars, etc. Mostra els texts de manera diferent: per freqüència, per patrons de busca, per paraules, etc. A partir d'aquí, els especialistes poden detectar aspectes dels texts i del llenguatge que d'altre forma no s'haurien detectat.[1]

Per fer l'estudi lexicomètric amb AntConc he agafat alguns articles del  blog de l'Ismael Peña-López, professor dels Estudis de Dret i Ciència Política de la UOC, especialitzat en estudiar l'impacte de les TIC a la societat, les opinions del qual he trobat especialment interessants.


Els articles parlen de la privacitat, la necessitat de la immersió lingüística a Catalunya, la democràcia directa i el vot electrònic, la sanitat pública i el canvi de paradigma cap a la societat del coneixement.

També he triat un article sobre els casos de corrupció del PP:


Un article anomenat Querer no es poder sobre una roda de premsa de l'Angela Merkel i l'Emmanuel Macron a Berlin:


I un article sobre el 15M:


Un cop entrats els articles a Ant Conc, el primer resultat de l'estudi de la freqüència de l'ús de paraules fou la següent:

Word Types
2579
Word Tokens
11552
Search Hits
0
1             532         de
2             418         que
3             365         xf
4             355         xe
5             353         la
6             301         n
7             275         en
8             250         a
9             247         el
10           225         y


La primera columna mostra la posició de la paraula, la segona mostra el nombre de vegades que es repeteix la paraula, la tercera columna és la paraula en sí. El No. de Tokens és el conjunt de caràcters separats per un espai en blanc i el No. de Typers es refereix als Tokens iguals.

Podem veure que les 10 paraules més usades són mots sense sentit o preposicions. Si fem un llistat de mots i unitats lèxiques sense sentit específic, no vàlides per a un treball terminològic, que surten amb elevada freqüència en els texts, i en fem un arxiu de text, podrem excloure-les  fent-ne un stopword list o filtre. 

Aplicant aquest filtre, les 15 paraules més freqüents són:

Word Types
2454
Word Tokens
4858
Search Hits
0
1             47           todo     
2             35           democracia       
3             31           pero     
4             27           voto     
5             24           cuando
6             23           castellano          
7             23           hacer   
8             23           herramientas   
9             19           instituciones     
10           17           bien      
11           16           forma  
12           15           ciudadanos       
13           15           innovar               
14           15           nueva  
15           15           poder


Les paraules podem veure-les per ordre alfabètic, també:

Word Types
2579
Word Tokens
11552
Search Hits
0
1             1             abandona          
2             1             abierta
3             1             abiertamente  
4             1             abierto
5             2             abiertos              
6             1             abog     
7             1             abogados           
8             1             aboguemos      
9             1             abordarlos         
10           1             aborto 
11           1             abra      
12           1             abraza 
13           1             abre     
14           1             abriendo            
15           1             absoluta


La llista de paraules és llarga, i en moltes ocasions tan sols volem analitzar la freqüència d'algunes d'elles. Si posen una paraula al buscador, per exemple "democracia" o "instituciones", el programa ens mostra en quina posició està i quina freqüència té.

Total No. of Cluster Types
16
Total No. of Cluster Tokens
35
1             9             1             democracia directa
2             7             1             democracia deliberativa
3             3             1             democracia l
4             3             1             democracia representativa
5             2             1             democracia h
6             1             1             democracia 4.0: en
7             1             1             democracia \x
8             1             1             democracia compuesto
9             1             1             democracia es
10           1             1             democracia no
11           1             1             democracia pasa
12           1             1             democracia real
13           1             1             democracia. el
14           1             1             democracia. un
15           1             1             democracia: el
16           1             1             democracia:\xa


Total No. of Cluster Types
15
Total No. of Cluster Tokens
19
1             3             1         instituciones deben
2             2             1         instituciones de
3             2             2         instituciones del
4             1             1         instituciones * lo
5             1             1         instituciones como
6             1             1         instituciones con
7             1             1         instituciones educativas     
8             1             1         instituciones han
9             1             1         instituciones intermediadoras
10           1             1         instituciones se
11           1             1         instituciones y
12           1             1         instituciones, cambiar
13           1             1         instituciones, en
14           1             1         instituciones. as
15           1             1         instituciones. m


Amb l'aplicació Concordance podrem veure llistats d'aparició d'una paraula específica acompanyada del text o co-text. La paraula està destacada per poder analitzar i detectar les seves col·locacions o paraules que apareixen en el seu entorn per poder analitzar els patrons lingüístics que surten amb una determinada freqüència i que reflexa el comportament real en context d'una paraula.

En aquest cas he usat la paraula "instituciones":

1       los partidos y otras                     instituciones de la democracia no representan fide                blog uoc politic I SOCIETAT.txt 
2       distintos estratos de                    instituciones intermediadoras. No en vano, en el s               blog uoc politic I SOCIETAT.txt
3       seguir confiando en las                instituciones como \xFAltimo (o primer) recurso. *             blog uoc politic I SOCIETAT.txt    
4       participaci\xF3n, repensar las        instituciones * Lo que la tecnolog\xEDa nos permit            blog uoc politic I SOCIETAT.txt
5       decisiones. * Las                        instituciones se han convertido, con los a\xF1os,                blog uoc politic I SOCIETAT.txt  
6       facilitaci\xF3n de las                   instituciones. M\xE1s que nunca. Las instituciones             blog uoc politic I  SOCIETAT.txt 
7       M\xE1s que nunca. Las               instituciones deben aportar el contexto\xA0que nos              blog uoc politic I SOCIETAT.txt  
8       toma de decisiones. Las               instituciones deben facilitar la creaci\xF3n de es                  blog uoc politic I SOCIETAT.txt 
9       informada y de consenso. Las       instituciones deben contribuir a fomentar la toma                 blog uoc politic I SOCIETAT.txt 
10      modernas\x97 de las                   instituciones. As\xED, las instituciones han contr                blog uoc politic I SOCIETAT.txt       
11      las instituciones. As\xED, las      instituciones han contribuido a la creaci\xF3n y                   blog uoc politic I SOCIETAT.txt 
12      Del mismo modo las                 instituciones, en beneficio de los ciudadanos y en                 blog uoc politic I SOCIETAT.txt       
13      de ra\xEDz. Las personas e          instituciones de esta sociedad est\xE1n viendo en                 blog uoc politic I SOCIETAT.txt 
14      sistema educativo\x94 o              instituciones educativas\x94. Y es leg\xEDtimo. Es             blog uoc politic I SOCIETAT.txt 
15      \xF1as que destruyen las             instituciones del Estado Espa\xF1ol.  En cualqu                  lista de casos de corrupción del PP.txt
16      destrucci\xF3n de las                  instituciones y del pa\xEDs, nos lleva su falta                     lista de casos de corrupción del PP.
17      posici\xF3n pol\xEDtica en las    instituciones, cambiar el lenguaje y hasta las ves                  seis años de lucha.txt 
18      que han llegado a las                  instituciones con nuestros votos es que no les hem               seis años de lucha.txt
19      un peligro real de que las            instituciones del sistema los coopten, pero ser\xE                 seis años de lucha.txt 


[1] Borja Navarro. Guía rápìda de análisis de corpus (con AntConc). Universidad de Aliucante, 2014

viernes, 26 de mayo de 2017

Periodisme digital


Amb els blogs ha nascut un nou perfil de participació i ús de la premsa i els mitjans d'informació que suposa un periodisme interactiu i més proper, però sense reglaments ètics ni legals. Segons Meritxell Martí "els blogs són una forma de trencar amb el monopoli informatiu: donen accés a converses més públiques, dins i fora dels mitjans de comunicació, i esdevenen ells mateixos els nous mitjans."[1]La  diversificació de les fonts fa que es diversifiquin també els temes: s'eixamplen els horitzons de la comunicació. Els blogs presenten noves temàtiques des d'un punt de vista personal, i tot i que alguns analitzen les notícies d'actualitat, moltes vegades no coincideixen amb l'índex temàtic dels diaris.

Els blogs permeten les veus individuals i el creixement de l'esfera pública en una nova forma de periodisme més democràtic. L'enfocament i la cobertura de les notícies són diverses, amb milers de punts de vista sobre un mateix tema, per la qual cosa ajuden a la dissolució de les estructures d'autoritat i de les relacions de poder. La no existència de filtres o censura permet la modificació de l'estructura dominant: publicador-lector. Ara el lector pot publicar, generar o matissar les notícies. Els blogs han desencadenat el trencament de les barreres que separaven els consumidors dels productors de la informació, l'art o la cultura. El lector és un usuari amb capacitat d'exercir el control sobre la informació. Però això no implica que les forces dominants que configuren el discurs hegemònic en els mitjans informatius no actuïn o en generin els continguts. A més, la gran quantitat d'informació que trobem als blogs no implica una interpretació crítica, una descodificació ideològica o la independència de la informació alternativa.


Segons l'Enric Bruguera, els potents mitjans de comunicació de masses han actuat durant dècades com a emissors de la informació de forma unidireccional, mentre que els consumidors d'aquests continguts no tenien opcions de resposta o expressió pròpies. Ara, però, qualsevol usuari connectat a Internet té la possibilitat de publicar qualsevol informació o contingut per una audiència mundial.[2] De fet, les campanyes electorals als EU o fenòmens com el tsunami del 2005 o la invasió d'Iraq del 2003, han consolidat els blogs en dos nivells contraposats i complementaris: com a canal per fer circular continguts alternatius als dels grans conglomerats mediàtics convencionals donant veu i visibilitat a altres fonts informatives o com a elements d'informació complementària dels grans medis, els quals han creat i promogut blogs vinculats a les seves estructures empresarials com a eina per a informar i estendre la seva ideologia econòmica, social o política més enllà de les seves audiències tradicionals. Com denuncia Lakoff en el seu article No pienses en un elefante, els blogs són un mitjà de transmissió ideològica on s'escull el "llenguatge que  encaixa amb la teva visió del món. Però no sols té a veure amb el llenguatge. Primer són les idees. I el llenguatge transmet aquestes idees, evoca aquestes idees."[3]




1-Martí, Meritxell. Weblogs. Diaris personals digitals . UOC p 46
2-Bruguera, Enric. Los blogs. Editorial UOC. Barcelona, 2007. p 5
3-Lakoff, George. No pienses en un elefante. Ed.Complutense. Madrid. 2004. p.7

jueves, 18 de mayo de 2017

Blogrolling



Veient la dificultat per tenir comentaris d'altres blogaires, m'ha fet gràcia llegir al Mòdul 2 "Weblogs. Diaris personals digitals"( pàgina 35)  uns tips per fer sortir el blog i el blogaire de l'aïllament:

1-mimar els lectors, respondre als seus comentaris, visitrar els seus blogs.
2-escruire apunts deixant la porta oberta a una opinió contrària.
3-compartir experiències i reflexions personals en les entrades.
4-escriure amb sinceritat
5-referir-se a temes polèmics, participatius o fer preguntes al final de l'article.
6-tenir un bloc de "els que més comenten".
7-redactar guies sobre la temàtica del teu blog.
8-escriure sobre temes genèrics i no tant tècnics o particulars.
9-penjar articles que tinguin a veure amb com augmentar el nombre de comentaris al teu blog.
10- treure el tag "no hi ha comentaris".


lunes, 8 de mayo de 2017

Llenguatge hipertextual



El filòsof Johann Gottfried von Herder afirmà l'any 1770 al seu llibre Sobre l'origen del llenguatge que aquest no solament era l'instrument del pensament, sinó que també n'era la forma: "no solament pensem en una llengua, sinó que pensem per mitjà de la llengua. Des del punt de vista de Herder, el llenguatge forma el pensament i, en cert sentit, el limita".[1] També els filòsofs estructuralistes com Vygotsky (1896-1934) o Sapir (1881-1939) investigaren la relació entre llenguatge i pensament i fins a quin punt el fet que el llenguatge reflecteixi unes condicions socials i culturals determinades i unes estructures mentals influeix en la manera com les persones percebem el món que ens envolta. Benjamin Lee Whorf (1897-1941) va postular que el llenguatge influeix en el comportament individual de les persones, ja que la concepció del món inclosa en cada llengua determina la manera com s'aprehèn la realitat.

De la mateixa forma que els antics estaven formats i condicionats per la seva utilització del llenguatge oral o l'escriptura condicionà i formà les ments del que sabien escriure i llegir, conclueixo que la meva utilització del llenguatge hipertextual condiciona el meu pensament i, al mateix temps, el meu pensament es transmet de forma hipertextual, amb múltiples canvis, reorganitzacions, relacions i possibilitats, inclús quan no es reflecteix en un text o mitjançant els suports digitals.

Som hipertextuals en el moment en què la revolució digital modifica la manera en què generem i transmetem la informació, els nous suports digitals condicionen i interactuen amb el nostre pensament, el coneixement hipertextual modifica el caràcter lineal i seqüencial de la nostra visió del món i l'escriptura hipertextual construeix un model de subjectivitat diferent: la meva ment, jo i la societat som hipertextuals. El món és hipertextual.



[1] Vila Mendiburu, Ignasi. LLenguatge i pensament. Material docent de la UOC. pàg. 26

lunes, 1 de mayo de 2017

Esquemes digitals


A partir de l'article "Tot fent núvols" al blog Els límits del meu hipertext he estat fent proves amb l'aplicació bubbl.us
Molt bona per fer esquemes visuals. De fet el de la imatge l'he fet a partir d'alguns conceptes sobre l'hipertext.

Teoria del caos



Els inicis de la teoria del caos se situen cap al 1900, en els estudis d'Henri Poincaré sobre el problema de moviment de tres cossos sotmesos a la seva atracció gravitatòria mútua, l'anomenat problema dels tres cossos. Poincaré trobà que pot haver-hi òrbites no periòdiques i que, nogensmenys, no s'apropen o s'allunyen indefinidament d'un punt. G. D. Birkhoff, A. N. Kolmogórov, M. L. Cartwright, J. E. Littlewood i Stephen Smale realitzaren estudis posteriors, més centrats en la teoria d'equacions diferencials no lineals, però inspirats en problemes físics: el problema dels tres cossos en el cas de Birkhoff, el flux turbulent en el cas de Kolmogórov i qüestions d'enginyeria electrònica en el cas de Cartwright i Littlewood. Tot i que el caos no s'havia observat en el moviment planetari, sí que s'havia observat turbulència en el moviment dels fluids (que cal no confondre, però, amb el caos) i oscil·lacions no periòdiques en circuits electrònics, sense que cap teoria expliqués què hi estava passant.

La teoria del caos avançà més ràpidament a partir de mitjan segle XX, quan es van començar a poder utilitzar ordinadors electrònics. Bona part de la matemàtica del caos implica la repetició indefinida de fórmules matemàtiques simples (evident en el cas dels sistemes discrets; per als sistemes continus, però, les equacions diferencials sempre es poden integrar finalment per un procediment iteratiu). Aquesta repetició indefinida és ideal per a introduir-la en un ordinador.

Un pioner de la teoria fou Edward Lorenz, l'interès del qual en el caos s'inicià accidentalment amb la seva recerca en predicció meteorològica. El 1961, Lorenz estava utilitzant un ordinador senzill, un Royal McBee LGP-30, per a executar una simulació d'un model simplificat de convecció atmosfèrica. Per estalviar temps, inicià una repetició d'una llarga simulació no des de les condicions inicials de la primera simulació, sinó a partir d'un punt intermedi calculat amb la primera simulació. Sorprenentment, el resultat de la repetició començà a divergir exponencialment respecte a la simulació original. Lorenz deduí correctament que la diferència es devia al fet que, en introduir les condicions inicials, havia utilitzat només tres xifres decimals en lloc de les 6 utilitzades inicialment per l'ordinador; la petita diferència provocà un resultat totalment diferent i fou la primera observació de comportament caòtic en una simulació matemàtica.


https://ca.wikipedia.org/wiki/Teoria_del_caos#Caos_i_sistemes_complexos

martes, 25 de abril de 2017

La revolució digital



La revolució digital porta a preguntar-nos sobre les diferents modificacions dels modes de formació de coneixement al llarg de la història i la generació i transmissió d'informació en la societat actual, la construcció de diferents models de subjectivitat del llenguatge oral, l'escriptura lineal i la hipertextual, els condicionants i la interactuació amb el nostre pensament dels formats i suports sobre els quals projectem els propis pensaments i la modificació del caràcter lineal i seqüencial de la nostra visió dels món gràcies al coneixement hipertextual. El nostre pensament, el nostre món o la nostra societat són hipertextuals?

L'era digital, que en un principi es pensava que afectaria tan sols als camps científics i tècnics, canvia la manera de crear, emmagatzemar i transmetre el coneixement, transformant el mateix text, l'eina amb la qual els humans hem construït el saber i hem elaborat la imatge de nosaltres mateixos i del món, comportant nous modes de textualitat.

La revolució digital, representada per l'hipertext connectat a la xarxa, s'ha instal·lat en la nostra realitat quotidiana fent primordial la mirada comparativa "a les grans etapes, unànimement reconegudes, de l'evolució del coneixement humà: la cultura oral, l'escrita i la tipogràfica."[1]


Amb l'internet contribuïm a la globalització, la deslocalització de les institucions, empreses i persones i multipliquem els contactes interlingüístics i interculturals, provocant múltiples interaccions i agrupacions. L'hipertext permet noves possibilitats semiòtiques, noves relacions socials i comunicatives, noves estratègies textuals i escripturals pròpies de cada usuari. El llenguatge hipertextual, com la nostra ment o el nostre pensament, requereix un ritme de producció molt alt, té la capacitat de transmetre la màxima quantitat d'informació amb el menor nombre possible d'elements i en el menor temps, porta a una escriptura concisa i amb reduccions característiques, amb gèneres interaccionals, aspectes lúdics i emocionals, i la possible col.loquialitat pròpia d'una conversa espontània entre amics amb neologismes i l'absència bastant generalitzada de puntuació. 


[1] Campàs i Montaner, Joan. De l'oralitat a l'escriptura digital. Material docent de la UOC. pàg. 5