Onsdag d 11. marts 2020 indledtes et pressemøde om corona-virus i Statsministeriet. Pressemødet blev indledt af en godt 16 minutter lang tale af Statsminister Mette Frederiksen. Denne historiske tale blev begyndelse på den såkaldte ”nedlukning” af Danmark.
Denne artikel er et kunstnerisk forsøg på en visuel patafysisk analyse af statsministerens tale.
METODER
Denne analyse er baseret på Statsministeriets skriftlige referat af talen. Teksten er hentet fra regeringens hjemmeside den 20 marts 2020.
Hjemmesiden blev tilgået med browseren Google Chrome browseren Version 81.0.4044.129 (64-bit) intstalleret under Microsoft Windows 10 Version 1909 (10.0.18363).
Hardware bestod af en Gigabyte P57V6 laptop-computer med en Intel i7-6700HQ CPU med 16 GB RAM.
Teksten blev klippet fra hjemmesiden, kopieret ind i et tomt tekst-dokument og gemt som en ren UTF-8 tekstfil.
Til de efterfølgende analyser blev der anvendt egne programmer skrevet i Python 3.6.8. Enkelte analyser har benyttet biblioteket Natural Language Toolkit (NLTK) version 3.5.
Endvidere har forfatteren anvendt Center for Sprogteknologis hjælpemidler[3].
Visualiseringerne i denne dokument er fremstillet ved hjælp af Javascript biblioteket "Chart.js" version 2.8.0.
RESULTAT
Oversigt over talen
Talen bestod af 249 linier tekst, 1.791 ord, 8.846 tegn (mellemrum ikke medregnet).
Længste sætning (30 ord/156 bogstaver)
Jeg vil igen understrege, at vi har en meget stor forpligtelse til især at hjælpe de svageste i vores samfund, de mest sårbare, mennesker med kroniske sygdomme, kræftpatienter, de ældre.
De tyve hyppigst gentagne ord ud fra grundsform (Lemma)
Datagrundlag
67 vi (4 os|63 vi), 63 i (60 i|3 jer), 62 at (62 at), 58 være (44 er|2 var|10 være|2 været), 50 det (50 det), 34 for (34 for), 34 og (34 og), 34 til (34 til), 31 al (1 al|27 alle|3 alt), 31 den (19 de|12 den), 31 ikke (31 ikke), 31 på (31 på), 31 ville (29 vil|2 ville), 30 jeg (30 jeg), 29 der (29 der), 27 en (19 en|8 et), 23 have (21 har|2 have), 21 kunne (20 kan|1 kunne), 20 skulle (20 skal), 15 med (15 med)
De ti hyppigst gentagne ord med flere bogstaver end gennemsnittet ( > 4,94 bogstaver pr ord)
De fem hyppigst gentagne ords optræden og sætningslængde hvori de optræder
Sætninger med lige og ulige antal ord
Forfatterens tak
Dette projekt er delvist støttet af et arbejdslegat fra Statens Kunstfonds. Endvidere har Center for Sprogteknologi (CST), Institut for Nordiske Studier og Sprogvidenskab være behjælpelige med software-bistand. Endeligt vil forfatteren takke AIRlab, IT Universitetet i København for morals støtte.
REFERENCER
Regeringen (2020). Statsminister Mette Frederiksens indledning på pressemøde i Statsministeriet om corona-virus den 11. marts 2020. Tilgået den 20. april 2020 på https://www.regeringen.dk/nyheder/2020/statsminister-mette-frederiksens-indledning-paa-pressemoede-i-statsministeriet-om-corona-virus-den-11-marts-2020/
Kenneth W. Church and Robert L. Mercer. 1993. Introduction to the special issue on computational linguistics using large corpora. Comput. Linguist. 19, 1 (March 1993), 1–24.
Hodges, S.,2004. Revealing code: What can language teach software?, Master’s thesis, Georgia Institute of Technology.
Center for Sprogteknologi - Lemmatiser: https://cst.dk/online/lemmatiser/ .
Natural Language Toolkit: https://www.nltk.org/ .
Chart.js: https://www.chartjs.org/
[1] Denne sætning er en reference til teksten "Tentative d'épuisement d'un lieu parisien" [”Forsøg på at udtømme et sted i Paris”] af George Perec, 1975.
[2] Person der beskæftiger sig med at skabe kunst fx en maler, billedhugger, komponist eller forfatter iflg. Den Danske Ordbog.
[3] Ordenes grundformerne og verbernes former er fundet ved hjælp af CST's online Lemmatiser og POS-tagger.