Progetto Patrimonio Linguistico o delle Parole Mancanti

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Progetto Patrimonio Linguistico o delle Parole Mancanti"

Transcript

1 Progetto Patrimonio Linguistico o delle Parole Mancanti Relazione tecnica preliminare Parte 2 dott. andrea pammolli statistico dott. giuseppe montefrancesco responsabile U.O. Prevenzione Dipendenze Patologiche ASL 7- Siena - Italy 18/08/2014 1

2 Il questionario è composto da 31 domande strutturate (anche dette domande a risposta chiusa, ossia con un numero finito di scelte possibili) e da 79 domande non strutturate (anche dette domande a risposta aperta). I metodi di analisi utilizzati per le domande strutturate sono quelli classici dell analisi quantitativa (test t di Student per il confronto tra medie, test z o chi-quadro per il confronto tra proporzioni). Per l analisi delle domande non strutturate abbiamo utilizzato metodi di analisi lessicometrica (text mining). La prima fase è stata quella di normalizzazione e costituzione della collezione di testi a disposizione, costituita dalle risposte alle singole domande (detto corpus) alla scopo di eliminare errori di battitura, accenti sbagliati, uniformare le forme grafiche presenti correggendo anche la presenza di maiuscole o minuscole. Tale operazione è stata resa possibile grazie al controllo ortografico di Excel, utilizzando il dizionario in esso contenuto. A questo punto, il corpus, in formato.csv, è stato importato nel package RcmdrPlugin.temis, interfaccia grafica del sottostante package tm di R. E stata impostata come prima colonna, quella contenente le risposte alle singole domande e, dalla seconda colonna in poi sono state inserite le variabili categoriali, tra le quali quella relativa al numero progressivo di domanda posta al soggetto (seconda colonna). Il corpus così ottenuto è stato suddiviso e analizzato sia nel suo complesso che nelle sue parti (dette subcorpus), questi ultimi creati sulla base di un criterio oggettivo di raggruppamento dipendente dalla struttura del questionario stesso. Prima di descrivere il corpus, è stato utilizzato uno strumento di tagging grammaticale, al fine di poter individuare la categoria di appartenenza delle varie forme grammaticali e quindi uniformarle (aggettivi, sostantivi e verbi). Lo strumento che ha reso possibile tale operazione è stato TreeTagger. Siamo quindi passati all analisi vera e propria. Tale fase è stata preceduta anche dall'eliminazione delle cosiddette "parole vuote" (anche stop word) ossia i termini come articoli, preposizioni, etc.. al fine di poter individuare i termini maggiormente frequenti, quelli cosiddetti specifici ed infine quelli peculiari sia all interno del corpus e che nei subcorpus. Tali valutazioni sono state effettuate sia a livello descrittivo (in termini di percentuali) sia a livello inferenziale applicando i test di significatività adeguati. Per termini specifici si intendono quelli caratteristici di una parte del corpus (subcorpus) rispetto all'intero corpus, valutato in base al loro sovra/sotto utilizzo nella parte rispetto al tutto. Nel primo caso si diranno frequenti, nel secondo caso si diranno rari. Non si esclude la possibilità di trovare un termine specifico "comune" a più subcorpus. In caso contrario il termine verrà detto "esclu1sivo o originale". Per termini peculiari si intendono le unità lessicali che risultano avere all'interno del corpus un forte sovra/sotto utilizzo rispetto ad un modello di riferimento, tipicamente costituito da un lessico di frequenza, ossia un corpus di grandi dimensioni (circa occorrenze), specifico per un determinato argomento. Tali unità vengono spesso dette "parole chiave". Al fine di poter rendere confrontabili le frequenze del corpus con quelle del lessico è stata preventivamente svolta una normalizzazione, ossia esprimere con un comun denominatore ciascuna frequenza relativa nel corpus e nel lessico. 2

3 Un corpus viene generalmente descritto attraverso indici in grado di caratterizzarne il tipo e l'eventuale possibilità di attuare metodi statistici di analisi, oppure, solamente darne una descrizione riassuntiva. Per dimensione di un corpus, si intende il totale delle occorrenze in esso contenute, dove per occorrenza (anche token) intendiamo ogni singola apparizione di una parola nel testo. Tipicamente, la dimensione minima per poter essere analizzata con tecniche statistiche risulta pari a occorrenze. Nell'insieme di un corpus sono di notevole importanza le forme grafiche (catena di caratteri) distinte. Infatti la percentuale di tali termini in un corpus (o subcorpus) non deve essere al di sotto del 20% se vogliamo utilizzare metodi statistici. Allo stesso modo deve essere al di sotto del 50% la percentuale dei termini con una sola occorrenza, ossia presenti una sola volta (detti anche hapax). E' necessario e doveroso sottolineare che nell'analisi sono stati volutamente tralasciati eventuali possibili raggruppamenti di termini considerati simili (es. marijuana, cannabis, canna) perché l'obiettivo principale, almeno in questa prima fase è stato quello di individuare i singoli termini "caratteristici" del linguaggio indipendentemente dal loro significato intrinseco. Alcuni acronimi utilizzati nelle tabelle: Global freq. Global freq % Level frequenza assoluta nel corpus frequenza relativa percentuale nel corpus frequenza assoluta nel subcorpus analizzato % Term/Level frequenza relativa percentuale del termine nel subcorpus analizzato % Level/Term frequenza relativa percentuale del termine nel subcorpus rispetto al corpus T Prob Statistica t di Student p-value 3

4 Analisi stratificata per Genere Caratteristiche socio-demografiche Il campione è costituto da 261 (55.7%) soggetti di sesso maschile e 208 (44.3%) soggetti di sesso femminile. L età media dei soggetti di sesso femminile (18.3, SD=6.8) è significativamente superiore a quella dei soggetti di sesso maschile (16.8, SD=4.0) (p=0.002). Il 93.8% dei soggetti di sesso maschile è uno studente delle scuole superiori, mentre il 76.4% è di sesso femminile lo è (p<0.05). Il 20.2% degli studenti di sesso femminile è uno studente universitario, mentre solo il 3.9% dei soggetti di sesso maschile lo è (p<0.05). L 89.9% dei soggetti di sesso maschile è in possesso di un titolo di studio medio inferiore, mentre il 71.8% è di sesso femminile lo è (p<0.05). Il 22.3% dei soggetti di sesso femminile è in possesso di un titolo di studio medio superiore mentre solo il 7.4% dei soggetti di sesso maschile lo è (p<0.05). Competenza-Esperienza del fenomeno Non viene rilevata nessuna differenza di genere statisticamente significativa relativamente al livello di competenza che si attesta, indipendentemente dal genere, intorno al 50% come sufficiente e intorno al 40% come buono. Il 28.2% dei soggetti di sesso maschile è venuto a contatto con soggetti che facevano uso di sostanze, mentre il 19.7% dei soggetti di sesso femminile lo è (p<0.05). Il 23.4% dei soggetti di sesso maschile ha fatto almeno una volta uso di sostanze, mentre il 13.0% dei soggetti di sesso femminile lo è (p<0.05). Solo 6 soggetti (9.8%) dei soggetti di sesso maschile di coloro che hanno dichiarato di aver provato almeno una volta una sostanza, dichiara di essere dipendente e 2, il 7.4% dei soggetti di sesso femminile (p>0.05). Di quest ultimi solamente 2, equamente ripartiti per genere, dichiara di aver ricevuto cure. Compulsive e Sostanze d Abuso Circa il 70% dichiara indipendentemente dal genere di conoscere il significato di Dipendenza Patologica. Circa la metà dei soggetti, il 43.8% dei soggetti di sesso maschile ed il 56.1% dei soggetti di sesso femminile hanno dichiarato di sapere se vi è una qualche relazione tra compulsive dipendenza patologica (p<0.05). Tra coloro che hanno risposto Si (115 soggetti di sesso femminile e 113 soggetti di sesso maschile), 80 soggetti, il 70.8%, dei soggetti di sesso maschile, dichiara la compulsione come un desiderio irrefrenabile di comportarsi in un certo modo, mentre il 68.7% si registra nei soggetti di sesso femminile (p>0.05). Circa il 65% indipendentemente dal genere, dichiara che il processo di consumo di sostanze stupefacenti 4

5 ha a che fare con bisogno e/o piacere. Circa il 66%dei soggetti, indipendentemente dal genere, dichiara che una sostanza d abuso è qualsiasi sostanza di cui si può abusare. Sentito Parlare In questo caso riportiamo solamente i risultati ritenuti statisticamente significativi, tralasciando il resto. Riportiamo in tabella sottostante i risultati ottenuti 5

6 Analisi delle domande non strutturate L Analisi precedentemente svolta sarà stratificata per genere e zona di residenza, in modo da andare ad individuare il linguaggio specifico, peculiare e rilevante separatamente per maschi, femmine e per soggetti residenti nelle seguenti quattro aree: Siena, Amiata, Colle di Val d'elsa e Val di Chiana. Inoltre sarà eseguito un test sulla significatività della differenza di proporzione d uso fra i due sessi. Sesso Maschile Il corpus: dimensione e caratteristiche La dimensione del corpus (totale delle occorrenze) è (considerato piccolo), di cui 3916 forme grafiche distinte (Word type). La percentuale di termini unici (Type/Token Ratio, TTR) è pari al 10.5% (essendo <20%, questo permette di procede con l analisi). La percentuale di hapax (termini presenti una sola volta) è il 46.5% (essendo <50%, anche questo permette di procedere). Infine ogni forma grafica si presenta in media 9.56 volte. Tab. 8 Caratteristiche corpus iniziale Da quanto riportato in Tab. 8, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 6

7 Da quanto osservato, si evince che i risultati saranno attendibili solo per il subcorpus 2, i risultati che otterremo dagli altri, dovranno essere presi con molta cautela. Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 9 Caratteristiche del nuovo corpus 7

8 Tab. 10 Termini più frequenti nel corpus 8

9 Tab. 11 Termini più frequenti subcorpus 1 9

10 Tab. 12 Termini più frequenti subcorpus 2 10

11 Tab. 13 Termini più frequenti subcorpus 3 11

12 Tab. 14 Termini più frequenti subcorpus 4 12

13 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 13

14 14

15 Competenze del partecipante 15

16 Patrimonio Linguistico 16

17 Esperienza diretta/indiretta 17

18 Linguaggio da strada 18

19 Sesso Femminile Il corpus: dimensione e caratteristiche La dimensione del corpus (totale delle occorrenze) è (considerato piccolo), di cui 3012 forme grafiche distinte (Word type). La percentuale di termini unici (Type/Token Ratio, TTR) è pari al 10.4% (essendo <20%, questo permette di procede con l analisi). La percentuale di hapax (termini presenti una sola volta) è il 43.03% (essendo <50%, anche questo permette di procedere). Infine ogni forma grafica si presenta in media 9.60 volte. Tab. 15 Caratteristiche corpus iniziale Da quanto riportato in Tab. 15, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 19

20 Da quanto osservato, si evince che i risultati saranno attendibili solo per il subcorpus 2, i risultati che otterremo dagli altri, dovranno essere presi con molta cautela. Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 16 Caratteristiche del nuovo corpus 20

21 Tab. 17 Termini più frequenti nel corpus 21

22 Tab. 18 Termini più frequenti subcorpus 1 22

23 Tab. 19 Termini più frequenti subcorpus 2 23

24 Tab. 20 Termini più frequenti subcorpus 3 24

25 Tab. 21 Termini più frequenti subcorpus 4 25

26 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 26

27 Competenze del partecipante 27

28 Patrimonio Linguistico 28

29 Esperienza diretta/indiretta 29

30 Linguaggio da strada 30

31 Analisi stratificata per Area di Residenza Caratteristiche socio-demografiche Il campione è costituto da 490 soggetti di cui 19 (3.9%) missing. La proporzione tra maschi e femmine è pressochè identica (50%) per Siena e Colle, mentre vi è una netta dominanza dei soggetti di sesso maschile per Amiata (76%) e Val di Chiana (69%). (p<0.05). Gli studenti delle scuole superiori sono tra l'80% ed il 96% con un valore significativamente superiore di Colle (96%) rispetto a Siena (81%), (p<0.05), mentre gli studenti universitari sono significativamente superiori a Siena (16.1%) rispetto a Colle (1.6%), (p<0.05). Stesso trend si osserva per i soggetti che hanno conseguito un diploma di scuola media inferiore e superiore: gli studenti con un diploma di scuola media inferiore sono in percentuale significativamente superiori a Colle (92.6%) rispetto a Siena (76%), (p<0.05), mentre gli studenti con un diploma di scuola media superiore sono in percentuale significativamente superiori a Siena (19.6%) rispetto a Colle (4.1 %), (p<0.05). Non vi è una significativa differenza tra l'età media dei soggetti (p>0.05) che si attesta intorno ai 17 anni. Competenza-Esperienza del fenomeno Non viene rilevata nessuna differenza di area statisticamente significativa relativamente al livello di competenza che si attesta, indipendentemente dall'area, intorno al 40% come buono e intorno al 50% come sufficiente per tutte le aree tranne l'amiata (28%). Si rileva una significativa superiore competenza dichiarata come "ottima" per i soggetti dell'amiata (20%) rispetto ai soggetti di Siena (3.9) e Colle (7.3), (p<0.05). Il 32.8% dei soggetti di Colle è venuto a contatto con soggetti che facevano uso di sostanze, mentre ciò avviene nel 6.9% dei soggetti della Val di Chiana (p<0.05). Nelle altre aree tale conoscenza si attesta intorno al 20%. Circa il 20% dei soggetti, indipendentemente dall'area di interesse ha fatto almeno una volta uso di sostanze. Solo 5 soggetti (14.3%) dei soggetti di Siena di coloro che hanno dichiarato di aver provato almeno una volta una sostanza, dichiara di essere dipendente e 2, l' 8.0% dei soggetti di Colle ed infine 1, il 9.1% dei soggetti della Val di Chiana (p>0.05). Di quest ultimi solamente un soggetto a Siena ed uno in Val di Chiana, dichiara di aver ricevuto cure. 31

32 Compulsive e Sostanze d Abuso Circa il 75% dichiara indipendentemente dalla zona di residenza di conoscere il significato di Dipendenza Patologica. Circa la metà dei soggetti, il 45% dei soggetti, indipendentemente dalla zona di residenza, ha dichiarato di sapere se vi è una qualche relazione tra compulsive dipendenza patologica. Tra coloro che hanno risposto Si", circa il 70%, dei soggetti di Siena e Val di Chiana, circa il 60% dei soggetti di Colle ed 44% dei soggetti dell'amiata dichiara la compulsione come un desiderio irrefrenabile di comportarsi in un certo modo. Circa il 60% indipendentemente dalla zona di residenza, dichiara che il processo di consumo di sostanze stupefacenti ha a che fare con bisogno e/o piacere. Tra il 70% e l'80% dei soggetti, indipendentemente dalla zona di residenza, dichiara che una sostanza d abuso è qualsiasi sostanza di cui si può abusare. Sentito Parlare In questo caso riportiamo solamente i risultati ritenuti statisticamente significativi, tralasciando il resto. Riportiamo in tabella sottostante i risultati ottenuti 32

33 Analisi per area di residenza Amiata Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 22 Caratteristiche corpus iniziale Da quanto riportato in Tab. 22, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 33

34 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 23 Caratteristiche del nuovo corpus 34

35 Tab. 24 Termini più frequenti nel corpus 35

36 Tab. 25 Termini più frequenti subcorpus 1 36

37 Tab. 26 Termini più frequenti subcorpus 2 37

38 Tab. 27 Termini più frequenti subcorpus 3 38

39 Tab. 28 Termini più frequenti subcorpus 4 39

40 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 40

41 Competenze del partecipante 41

42 Patrimonio Linguistico 42

43 Esperienza diretta/indiretta 43

44 Linguaggio da strada 44

45 Colle di Val d Elsa Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 29 Caratteristiche corpus iniziale Da quanto riportato in Tab. 29, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 45

46 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 30 Caratteristiche del nuovo corpus 46

47 Tab. 31 Termini più frequenti nel corpus 47

48 Tab. 32 Termini più frequenti subcorpus 1 48

49 Tab. 33 Termini più frequenti subcorpus 2 49

50 Tab. 34 Termini più frequenti subcorpus 3 50

51 Tab. 35 Termini più frequenti subcorpus 4 51

52 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 52

53 Competenze del partecipante 53

54 Patrimonio Linguistico 54

55 Esperienza diretta/indiretta 55

56 Linguaggio da strada 56

57 Val di Chiana Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 36 Caratteristiche corpus iniziale Da quanto riportato in Tab. 36, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 57

58 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 37 Caratteristiche del nuovo corpus 58

59 Tab. 38 Termini più frequenti nel corpus 59

60 Tab. 39 Termini più frequenti subcorpus 1 60

61 Tab. 40 Termini più frequenti subcorpus 2 61

62 Tab. 41 Termini più frequenti subcorpus 3 62

63 Tab. 42 Termini più frequenti subcorpus 4 63

64 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 64

65 Competenze del partecipante 65

66 Patrimonio Linguistico 66

67 Esperienza diretta/indiretta 67

68 Linguaggio da strada 68

69 Siena Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 43 Caratteristiche corpus iniziale Da quanto riportato in Tab. 43, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 69

70 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 44 Caratteristiche del nuovo corpus 70

71 Tab. 45 Termini più frequenti nel corpus 71

72 Tab. 46 Termini più frequenti subcorpus 1 72

73 Tab. 47 Termini più frequenti subcorpus 2 73

74 Tab. 48 Termini più frequenti subcorpus 3 74

75 Tab. 49 Termini più frequenti subcorpus 4 75

76 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 76

77 Competenze del partecipante 77

78 Patrimonio Linguistico 78

79 Esperienza diretta/indiretta 79

80 Linguaggio da strada 80

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Frequenze di parole 7 ottobre 2014 Statistica terminologia di base Popolazione (collettivo) l insieme delle entità (oggetti, individui, eventi, ecc.) che rappresentano il dominio

Dettagli

Progetto Unico Ser.T.

Progetto Unico Ser.T. Progetto Unico Ser.T. Relazione tecnica preliminare dott. andrea pammolli statistico dott. giuseppe montefrancesco responsabile U.O. Prevenzione Dipendenze Patologiche ASL 7- Siena - Italy 1 Relazione

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

Osservatorio per le Politiche Sociali - Terzo Rapporto

Osservatorio per le Politiche Sociali - Terzo Rapporto 1 STRUTTURA E DINAMICA DEMOGRAFICA Il capitolo si articola in due paragrafi. Nel primo sono riportati i dati e i commenti riguardanti la struttura demografica della popolazione della Valle d Aosta. Nel

Dettagli

Test di orientamento della Facoltà di Scienze MM.FF.NN. A.A. 2007/2008

Test di orientamento della Facoltà di Scienze MM.FF.NN. A.A. 2007/2008 Università degli Studi di Cagliari PROGRAMMA OPERATIVO NAZIONALE PER LE REGIONI DELL OBIETTIVO 1 Campania, Puglia, Basilicata, Calabria, Sicilia, Sardegna RICERCA SCIENTIFICA, SVILUPPO TECNOLOGICO, ALTA

Dettagli

OGGETTO: Ricoveri ospedalieri per patologie respiratorie nella popolazione nata in Italia, residente a S. Polo e nel resto del comune di Brescia.

OGGETTO: Ricoveri ospedalieri per patologie respiratorie nella popolazione nata in Italia, residente a S. Polo e nel resto del comune di Brescia. OGGETTO: Ricoveri ospedalieri per patologie respiratorie nella popolazione nata in Italia, residente a S. Polo e nel resto del comune di Brescia. Introduzione I risultati ottenuti dall indagine precedente

Dettagli

La matrice dati. La matrice dati

La matrice dati. La matrice dati La matrice dati Matrice casi per variabili - Stessa unità di analisi (es. individui, nazioni, etc ) - Stesse informazioni per ogni caso CODIFICA Traduzione del materiale grezzo in matrice dati Tracciato

Dettagli

INCIDENTI DOMESTICI OVER 65. Anni 2010 e 2011

INCIDENTI DOMESTICI OVER 65. Anni 2010 e 2011 INCIDENTI DOMESTICI OVER 65 Anni 2010 e 2011 Dall'analisi delle SDO relative agli anni 2010 e 2011 è emerso che nell ASL di Brescia sono stati effettuati rispettivamente 2.004 e 2.255 ricoveri ordinari

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Esempi di Analisi Univariata

Metodi Quantitativi per Economia, Finanza e Management. Esempi di Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esempi di Analisi Univariata GRUPPO QUATTRO RUOTE Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894 Gruppo Quattro

Dettagli

ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo

ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo Indice delle tavole Note sintetiche a commento dei principali fenomeni osservati...

Dettagli

Figura 1. Obiettivi di studio che i ragazzi intendono raggiungere (%)

Figura 1. Obiettivi di studio che i ragazzi intendono raggiungere (%) Università Commerciale Luigi Bocconi, Milano Progetto Orientamento scolastico e percorsi di studio al termine delle scuole medie SCUOLA SECONDARIA DI I GRADO VIOTTI, TORINO La scelta della scuola superiore

Dettagli

Titolo della lezione. Introduzione

Titolo della lezione. Introduzione Titolo della lezione Introduzione Informazioni sul corso - 1 Obiettivi Nel corso verranno approfonditi gli argomenti relativi alla statistica descittiva di base e alla statistica inferenziale; particolare

Dettagli

bambini di cinque anni in provincia di Bergamo

bambini di cinque anni in provincia di Bergamo Obesità nei bambini di cinque anni in provincia di Bergamo Dati demografici provincia di Bergamo a cura di L.Siccardo, G.Sampietro, L.Perego 2 1 Bambini di cinque anni residenti in provincia di Bergamo

Dettagli

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare

Dettagli

OGGETTO: Ricoveri ospedalieri per diverse patologie nel quartiere S. Polo e nel resto del comune di Brescia nel periodo

OGGETTO: Ricoveri ospedalieri per diverse patologie nel quartiere S. Polo e nel resto del comune di Brescia nel periodo OGGETTO: Ricoveri ospedalieri per diverse patologie nel quartiere S. Polo e nel resto del comune di Brescia nel periodo 2004-2008. Introduzione L analisi dei ricoveri nel quartiere S. Polo del comune di

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Esercitazione: indici statistici del testo e misure di associazione Calcolare la lunghezza di un corpus C : Calcolare la lunghezza di un corpus C : output sys.argv[0] sys.argv[1]

Dettagli

Noi e l ambiente. Prof.ssa Paola Carroccia, Prof.ssa Filippa Latella ITET A. de Viti de Marco Triggiano

Noi e l ambiente. Prof.ssa Paola Carroccia, Prof.ssa Filippa Latella ITET A. de Viti de Marco Triggiano Noi e l ambiente Prof.ssa Paola Carroccia, Prof.ssa Filippa Latella ITET A. de Viti de Marco Triggiano Tabella 1.Mutabile sconnessa: Percentuale degli intervistati in base al sesso. Sesso Frequenze assolute

Dettagli

PERCORSI ED ESITI DELLA GRAVIDANZA

PERCORSI ED ESITI DELLA GRAVIDANZA REGIONE PIEMONTE - A.S.L. NO PERCORSI ED ESITI DELLA GRAVIDANZA Informazioni dai Certificati di Assistenza al Parto (CeDAP) A cura di Maria Chiara Antoniotti ASL NO Servizio Sovrazonale di Epidemiologia

Dettagli

Masterplan Città di Castello smart Scheda: demografia Versione 1.1 (maggio 2014)

Masterplan Città di Castello smart Scheda: demografia Versione 1.1 (maggio 2014) Masterplan Città di Castello smart Scheda: demografia Versione 1.1 (maggio 2014) La situazione demografica Il comune di Città di Castello ha la sua popolazione al 1/01/2013 pari a 40.016 abitanti residenti

Dettagli

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari Effettuazione di un TEST D IPOTESI 1. Formulazione H 0 e H 1 2. Scelta del test statistico 3. Calcolo del test statistico ˆ 0 test ES[ˆ] dove ˆ = stima del parametro di interesse calcolata sui dati campionari

Dettagli

Tutta la scienza è fondata sulle misure (Helmholtz)

Tutta la scienza è fondata sulle misure (Helmholtz) Tutta la scienza è fondata sulle misure (Helmholtz) L acquisizione di una osservazione come DATO SCIENTIFICO richiede che : osserviamo un fenomeno lo quantifichiamo correttamente lo confrontiamo con altri

Dettagli

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE IL TEST DEL CHI 2 (2) Consente di verificare ipotesi su: a) relazioni tra variabili nella popolazione b) differenze tra popolazioni relative a: distribuzioni di frequenza Livello di misura dei dati: scala

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it Orario lezioni obiettivi formativi programma laboratorio e modalita di esame Orario lezioni obiettivi formativi programma laboratorio e modalita

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI

LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI - GRUPPO Codari Stefano (19492) Ferrigno Chiara (19853) De Agostini Karin (19507) Giraldo Andrea (19723) Analisi Bivariate

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 1 1. Si considerino i seguenti caratteri

Dettagli

Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.

Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e. Domanda 1 Una misura di sintesi di una distribuzione si dice robusta se... a. Risulta particolarmente sensibile ai valori anomali (valori molto piccoli o molto grandi) c. Non risulta particolarmente sensibile

Dettagli

11. Il lessico dei testi

11. Il lessico dei testi Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta

Dettagli

LA PARTECIPAZIONE DEI GIOVANI

LA PARTECIPAZIONE DEI GIOVANI Ragioneria Generale Direzione Sistemi informativi di pianificazione e controllo finanziario U.O. Statistica LA PARTECIPAZIONE DEI GIOVANI AL SISTEMA UNIVERSITARIO ROMANO Anno accademico 2014-2015 Indice

Dettagli

SINTESI DELL INDAGINE INVALSI 2017 (II classe delle superiori, riformata)

SINTESI DELL INDAGINE INVALSI 2017 (II classe delle superiori, riformata) SINTESI DELL INDAGINE INVALSI 2017 (II classe delle superiori, riformata) L indagine INVALSI del 2016/2017 ha coinvolto quattordici classi del, compresa la sede associata; nessuna classe è stata scelta

Dettagli

Le medie. Antonello Maruotti

Le medie. Antonello Maruotti Le medie Antonello Maruotti Outline 1 Medie di posizione 2 Definizione Moda La moda di un collettivo, distributio secondo un carattere qualsiasi, è la modalità prevalente del carattere ossia quella a cui

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel

Dettagli

Le sezione del questionario relativa alla corretta alimentazione viene qui riportata:

Le sezione del questionario relativa alla corretta alimentazione viene qui riportata: RISULTATI DELL INDAGINE CONOSCITIVA SULLE ABITUDINI di VITA DEGLI ASSISTITI E SULL ATTIVITA di PROMOZIONE DEGLI STILI di VITA da PARTE DEGLI OPERATORI SANITARI NELL ASL di BRESCIA 2 parte: ALIMENTAZIONE

Dettagli

OBIETTIVI DI APPRENDIMENTO

OBIETTIVI DI APPRENDIMENTO CURRICOLO DI FRANCESE SPAGNOLO CLASSE PRIMA TRAGUARDI DI COMPETENZA Comprendere il significato globale di un breve e semplice messaggio orale e riconoscere in esso informazioni utili. NUCLEI TEMATICI ASCOLTO

Dettagli

RELAZIONE RISULTATI PROVE INVALSI 2018

RELAZIONE RISULTATI PROVE INVALSI 2018 Istituto Comprensivo G. MARCONI Terni Scuole Primarie Le Grazie Matteotti RELAZIONE RISULTATI PROVE INVALSI 2018 CLASSI SECONDE Per le classi seconde le prove si sono svolte regolarmente, secondo le modalità

Dettagli

CERTIFICATI ISO 9001:2008

CERTIFICATI ISO 9001:2008 e Pag. 1 6 Il presente lavoro riporta i risultati della indagine sulla soddisfazione dei clienti-pazienti delle strutture ospedaliere dell Azienda Ospedaliera Sant Antonio Abate di Gallarate, attraverso

Dettagli

Indagine pilota TECO-2017

Indagine pilota TECO-2017 La rilevazione TECO-2017 ha coinvolto 5 Atenei e 1.460 studenti del primo e del terzo anno con l obiettivo di verificare le prove di e, in seguito alla indagine pilota del 2016. Sommario 1. Introduzione...

Dettagli

Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp)

Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Malvina Nissim malvina.nissim@unibo.it 1 Aprile 2009 1 ssh gollum.sitlec.unibo.it login passwd cqp 1 Cercare e contare 1.1 Contare

Dettagli

Obiettivi del corso. Analisi dei dati

Obiettivi del corso. Analisi dei dati Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di

Dettagli

Ma quali fenomeni sono da intendersi per fenomeni collettivi?

Ma quali fenomeni sono da intendersi per fenomeni collettivi? La statistica è la scienza che studia i fenomeni collettivi di vario genere. Essa raccoglie, analizza e interpreta, utilizzando metodi e strumenti matematici, le informazioni riguardanti il particolare

Dettagli

Servizio Sviluppo Economico, studi e statistica. Analisi dei redditi dei cittadini di Trento anno d imposta 2014

Servizio Sviluppo Economico, studi e statistica. Analisi dei redditi dei cittadini di Trento anno d imposta 2014 Servizio Sviluppo Economico, studi e statistica Analisi dei redditi dei cittadini di Trento anno d imposta 214 Analisi dei redditi dei cittadini di Trento Anno d imposta 214 - ottobre 216 - Servizio Sviluppo

Dettagli

Stefania Taralli Anno Accademico 2017/2018 1

Stefania Taralli Anno Accademico 2017/2018 1 DEFINIZIONE CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI I rapporti statistici AA 2017/2018 Un rapporto statistico è un quoziente tra due termini di cui almeno uno è di natura

Dettagli

Analisi customer sul servizio di Call Center dell URP del Comune di Bari. (periodo di rilascio dal 18/11/2017 al 22/11/2017)

Analisi customer sul servizio di Call Center dell URP del Comune di Bari. (periodo di rilascio dal 18/11/2017 al 22/11/2017) Analisi customer sul servizio di Call Center dell URP del Comune di Bari (periodo di rilascio dal 18/11/2017 al 22/11/2017) 1. ANALISI DESCRITTIVE DEL CAMPIONE Il campione dei rispondenti (N=157) al questionario

Dettagli

VISIONE DEL FUTURO ALLEGATO STATISTICO

VISIONE DEL FUTURO ALLEGATO STATISTICO C E N S I S VISIONE DEL FUTURO ALLEGATO STATISTICO Roma, 31 luglio 2010 Tab. 1 - Maggiori problemi sul futuro dell' Italia, per sesso (val.%) Quali pensa siano i due maggiori problemi che pesano sul futuro

Dettagli

INDAGINE CONOSCITIVA SUI BISOGNI FORMATIVI

INDAGINE CONOSCITIVA SUI BISOGNI FORMATIVI INDAGINE CONOSCITIVA SUI BISOGNI FORMATIVI 1. Obiettivo generale Oggetto della ricerca sono stati tre Dipartimenti e una Struttura Complessa pilota, più precisamente: - Dipartimento Salute Mentale e Dipendenze

Dettagli

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE AIP Seminario residenziale Psicologia del discorso e analisi dei discorsi L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE Silvia Gattino e Stefano Tartaglia Dipartimento di Psicologia Università

Dettagli

COMUNE di SAN COLOMBANO AL LAMBRO BORGO INSIGNE (Titolo Araldico) Provincia di MILANO. Servizio Gestione Sistema Qualità

COMUNE di SAN COLOMBANO AL LAMBRO BORGO INSIGNE (Titolo Araldico) Provincia di MILANO. Servizio Gestione Sistema Qualità COMUNE di SAN COLOMBANO AL LAMBRO BORGO INSIGNE (Titolo Araldico) Provincia di MILANO 2^ Indagine di Customer Satisfaction sui Servizi Demografici Presentazione dei risultati Sintesi INDICE PREMESSA pag.

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 prof. Federico Plazzi 28 Giugno 2019 Nome: Cognome: Matricola: Alcune indicazioni: La prova è costituita da cinque esercizi; dopo

Dettagli

Informazioni introduttive Le prove Invalsi sono state somministrate: al 71,8% degli alunni nella prova italiano e al 70% degli alunni nella prova

Informazioni introduttive Le prove Invalsi sono state somministrate: al 71,8% degli alunni nella prova italiano e al 70% degli alunni nella prova Informazioni introduttive Le prove Invalsi sono state somministrate: al 71,8% degli alunni nella prova italiano e al 70% degli alunni nella prova matematica delle classi seconde; all 87% degli alunni nella

Dettagli

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della

Dettagli

I codici miscellanei nel basso medioevo

I codici miscellanei nel basso medioevo Convegno internazionale Il Codice Miscellaneo - Tipologia e Funzioni Cassino - Aula Magna Facoltà di Ingegneria - 15/5/23 I codici miscellanei nel basso medioevo Antonio Cartelli, Marco Palma, Silvia Ruggiero

Dettagli

Esercitazione. 24 Aprile 2012

Esercitazione. 24 Aprile 2012 Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Tabella per l'analisi dei risultati

Tabella per l'analisi dei risultati Vai a... UniCh Test IV_Statistica_Eliminatorie Quiz IV_Statistica_Eliminatorie Aggiorna Quiz Gruppi visibili Tutti i partecipanti Info Anteprima Modifica Risultati Riepilogo Rivalutazione Valutazione manuale

Dettagli

Profilo socio-demografico

Profilo socio-demografico PROFILO SOCIODEMOGRAFIXCO PROFILO SOCIO-DEMOGRAFICO 2012 In Piemonte, la popolazione in studio è costituita da circa 3 milioni di residenti di 18-69 anni di età iscritti al 31/12/2011 nelle liste delle

Dettagli

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,

Dettagli

A proposito di valutazione scolastica

A proposito di valutazione scolastica A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,

Dettagli

POPOLAZIONE: INDICI DI STRUTTURA E DINAMICA. Anno Anticipazione

POPOLAZIONE: INDICI DI STRUTTURA E DINAMICA. Anno Anticipazione Ragioneria Generale I Direzione Sistemi informativi di pianificazione e controllo finanziario U.O. Statistica POPOLAZIONE: INDICI DI STRUTTURA E DINAMICA Anno 2016 Anticipazione Indice La popolazione a

Dettagli

ESERCITAZIONE ANCOVA

ESERCITAZIONE ANCOVA ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono

Dettagli

PROVINCIA DI ROVIGO Assessorato alle Politiche Giovanili

PROVINCIA DI ROVIGO Assessorato alle Politiche Giovanili PROVINCIA DI ROVIGO Assessorato alle Politiche Giovanili OSSERVATORIO SUL DISAGIO GIOVANILE Ser.T. e Associazioni Aggiornamento dei dati - Anno 2008 Si ringraziano per i dati forniti e la cortese collaborazione:

Dettagli

Introduzione alla statistica con Excel

Introduzione alla statistica con Excel Introduzione alla statistica con Excel Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Servizio Sociale A.A. 2017/2018 Variabili quantitative e qualitative

Dettagli

ATTEGGIAMENTI PSICOSOCIALI SUGLI USI DEI MEZZI TECNOLOGICI

ATTEGGIAMENTI PSICOSOCIALI SUGLI USI DEI MEZZI TECNOLOGICI Laboratorio di Statistica per l informazione e la conoscenza 2017-2018 Liceo Polivalente «Don Q. Punzi» ATTEGGIAMENTI PSICOSOCIALI SUGLI USI DEI MEZZI TECNOLOGICI Docenti partecipanti: Prof.ssa Floriana

Dettagli

Analisi bivariata. Il caso di caratteri qualitativi

Analisi bivariata. Il caso di caratteri qualitativi Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano

Dettagli

ANALISI EPIDEMIOLOGICA SULLA FREQUENZA DEI TUMORI NELLA ZONA SOCIO-SANITARIA VALDARNO ARETINA Eta anni

ANALISI EPIDEMIOLOGICA SULLA FREQUENZA DEI TUMORI NELLA ZONA SOCIO-SANITARIA VALDARNO ARETINA Eta anni ANALISI EPIDEMIOLOGICA SULLA FREQUENZA DEI TUMORI NELLA ZONA SOCIO-SANITARIA VALDARNO ARETINA Eta 30-49 anni SINTESI DEI DATI PRESENTATI Con una metodologia analoga a quella utilizzata per l analisi della

Dettagli

Il consumo di alcol nel 2011: risultati della sorveglianza PASSI

Il consumo di alcol nel 2011: risultati della sorveglianza PASSI Il consumo di alcol nel 11: risultati della sorveglianza PASSI a cura di M. Chiara Antoniotti, Fabio Contarino, Andrea Nucera Servizio Sovrazonale di Epidemiologia (SSEPI) ASL NO PASSI (Progressi delle

Dettagli

Facoltà di Medicina e Chirurgia

Facoltà di Medicina e Chirurgia Facoltà di Medicina e Chirurgia METODOLOGIE STATISTICHE UTILIZZATE PER L ANALISI DELLA SODDISFAZIONE DEGLI STUDENTI FREQUENTANTI A.A. 2011-2012 NUCLEO DI VALUTAZIONE DI ATENEO MILANO PIACENZA - CREMONA

Dettagli

Segnalazioni alle prefetture

Segnalazioni alle prefetture Segnalazioni alle prefetture Segnalazioni alle prefetture SEGNALAZIONI ALLE PREFETTURE Le segnalazioni alle Prefetture (ai sensi degli art. 75 e 121 del DPR 309/90), per utilizzo o possesso di sostanze

Dettagli

Infermieristica e Medicina di Genere:

Infermieristica e Medicina di Genere: Infermieristica e Medicina di Genere: Indagine conoscitiva sul fabbisogno formativo Studente: Benedetta Cutolo Relatore: Prof. Marcello Fedi Correlatore: Dott. Eufrasio Girardi Pistoia 4 Dicembre 2015

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in FISICA Classe: L-30 Scienze e tecnologie fisiche Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione riporta i risultati

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione per caratteri quantitativi discreti e continui Il seguente data set riporta la rilevazione

Dettagli

Informazioni Statistiche N 2/2005

Informazioni Statistiche N 2/2005 Città di Palermo Ufficio Statistica Sistema Statistico Nazionale Censimento 2001: il grado di istruzione Girolamo D Anneo Informazioni Statistiche N 2/2005 AGOSTO 2005 Ufficio Statistica Sistema Statistico

Dettagli

Le statistiche sui redditi dei cittadini

Le statistiche sui redditi dei cittadini Comune di Trieste Le statistiche sui redditi dei cittadini Convegno nazionale USCI Messina, 26 e 27 settembre 2013 Antonella Primi Comune di Trieste I dati utilizzati per le elaborazioni statistiche presentate

Dettagli

Risultati relativi al Primo Trimestre 2009

Risultati relativi al Primo Trimestre 2009 Comune di Livorno Comune di Collesalvetti INDAGINE CAMPIONARIA SULLE FORZE DI LAVORO NEL SISTEMA ECONOMICO LOCALE DELL AREA LIVORNESE Risultati relativi al Primo Trimestre 2009 Da Ottobre 2003 nel Sistema

Dettagli

RESTITUZIONE DATI INVALSI 2018ANNO SCOLASTICO 2018/19. a cura delle FF.SS. Massa Stefania e Canargiu Giovanni

RESTITUZIONE DATI INVALSI 2018ANNO SCOLASTICO 2018/19. a cura delle FF.SS. Massa Stefania e Canargiu Giovanni RESTITUZIONE DATI INVALSI 2018ANNO SCOLASTICO 2018/19 a cura delle FF.SS. Massa Stefania e Canargiu Giovanni STRUTTURA DELLE PROVE Classe II - Scuola Primaria 1.Prova preliminare di lettura( svolta esclusivamente

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA AZIENDALE Classe: L-18 Scienze dell'economia e della gestione aziendale Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La

Dettagli

Report. Alunni diplomati presso l'istituto San Giovanni Bosco e Cennino Cennini di Colle di Val d'elsa nel quinquennio :

Report. Alunni diplomati presso l'istituto San Giovanni Bosco e Cennino Cennini di Colle di Val d'elsa nel quinquennio : Report Alunni diplomati presso l'istituto San Giovanni Bosco e Cennino Cennini di Colle di Val d'elsa nel quinquennio 213-217: quale occupazione dopo il diploma? Come è stata condotta l'indagine Innanzitutto

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in MATEMATICA Classe: L-35 Scienze matematiche Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione riporta i risultati

Dettagli

Laboratorio di Chimica Fisica. Analisi Statistica

Laboratorio di Chimica Fisica. Analisi Statistica Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

Statistiche per l analisi dei trend Capitolo 6

Statistiche per l analisi dei trend Capitolo 6 Statistiche per l analisi dei trend Capitolo 6 l analisi dei trend Secondo Keppel, Saufley e Tokunaga (2001) è il procedimento statistico che consente di valutare la probabile esistenza di una relazione

Dettagli

Distribuzione di frequenza relativa e percentuale: esempio

Distribuzione di frequenza relativa e percentuale: esempio Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA AZIENDALE Classe: L-18 Scienze dell'economia e della gestione aziendale Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La

Dettagli

ALLA FINE DELLA CLASSE QUARTA L ALUNNO È IN GRADO DI Competenza Abilità Conoscenze. Quando ascolta l alunno è in grado di:

ALLA FINE DELLA CLASSE QUARTA L ALUNNO È IN GRADO DI Competenza Abilità Conoscenze. Quando ascolta l alunno è in grado di: ISTITUTO COMPRENSIVO BASSA ANAUNIA - DENNO PIANO DI STUDIO DI ITALIANO CLASSE QUARTA Competenza 1: Interagire e comunicare verbalmente in contesti di diversa natura ALLA FINE DELLA CLASSE QUARTA L ALUNNO

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in SCIENZE DELLA COMUNICAZIONE Classe: L-20 Scienze della comunicazione Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione

Dettagli

Obiettivi del corso. Analisi dei dati

Obiettivi del corso. Analisi dei dati Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di

Dettagli

Mortalità e Incidenza patologie cardiovascolari e respiratorie nei comuni di Rodengo Saiano, Gussago, Castegnato e Ospitaletto - Settembre

Mortalità e Incidenza patologie cardiovascolari e respiratorie nei comuni di Rodengo Saiano, Gussago, Castegnato e Ospitaletto - Settembre Mortalità e Incidenza patologie cardiovascolari e respiratorie nei comuni di Rodengo Saiano, Gussago, Castegnato e Ospitaletto - Settembre 2012 - A cura dell Osservatorio Epidemiologico, ASL di Brescia

Dettagli

Un anno dopo risultati di una scelta

Un anno dopo risultati di una scelta Piano Nazionale Lauree Scientifiche 15/16-Statistica L università edgli studi di Bari Aldo Moro dipartimento di Scienze Economiche e Metodo Matematici in collaborazione con IISS Majorana-Laterza presenta

Dettagli

LE PRESTAZIONI DI PRONTO SOCCORSO DELL ANNO 2012 NELL ASL DELLA PROVINCIA DI VARESE. Direzione Generale U.O.C. Osservatorio Epidemiologico

LE PRESTAZIONI DI PRONTO SOCCORSO DELL ANNO 2012 NELL ASL DELLA PROVINCIA DI VARESE. Direzione Generale U.O.C. Osservatorio Epidemiologico LE PRESTAZIONI DI PRONTO SOCCORSO DELL ANNO 2012 NELL ASL DELLA PROVINCIA DI VARESE Direzione Generale U.O.C. Osservatorio Epidemiologico Introduzione Le prestazioni di pronto soccorso (specialistica ambulatoriale

Dettagli

materiale didattico II incontro

materiale didattico II incontro Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale

Dettagli

U.O. Epidemiologia Registro Tumori ASL Lecce. Dati di incidenza e Mortalità

U.O. Epidemiologia Registro Tumori ASL Lecce. Dati di incidenza e Mortalità U.O. Epidemiologia Registro Tumori ASL Lecce Dati di incidenza e Mortalità Popolazione Provincia di Lecce Popolazione: 806.412 (ISTAT: 1/1/2014) Superficie: 2.759 km 2 Densità: 293 abitanti/km 2 Numero

Dettagli

UNIVERSITA DEGLI STUDI DI SALERNO

UNIVERSITA DEGLI STUDI DI SALERNO UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA, VALORIZZAZIONE, GESTIONE DEL PATRIMONIO TURISTICO Classe: L-15 Scienze del turismo Triennale Quadro C1 - Dati di ingresso, di percorso e di

Dettagli