Progetto Patrimonio Linguistico o delle Parole Mancanti
|
|
- Dorotea Papi
- 4 anni fa
- Visualizzazioni
Transcript
1 Progetto Patrimonio Linguistico o delle Parole Mancanti Relazione tecnica preliminare Parte 2 dott. andrea pammolli statistico dott. giuseppe montefrancesco responsabile U.O. Prevenzione Dipendenze Patologiche ASL 7- Siena - Italy 18/08/2014 1
2 Il questionario è composto da 31 domande strutturate (anche dette domande a risposta chiusa, ossia con un numero finito di scelte possibili) e da 79 domande non strutturate (anche dette domande a risposta aperta). I metodi di analisi utilizzati per le domande strutturate sono quelli classici dell analisi quantitativa (test t di Student per il confronto tra medie, test z o chi-quadro per il confronto tra proporzioni). Per l analisi delle domande non strutturate abbiamo utilizzato metodi di analisi lessicometrica (text mining). La prima fase è stata quella di normalizzazione e costituzione della collezione di testi a disposizione, costituita dalle risposte alle singole domande (detto corpus) alla scopo di eliminare errori di battitura, accenti sbagliati, uniformare le forme grafiche presenti correggendo anche la presenza di maiuscole o minuscole. Tale operazione è stata resa possibile grazie al controllo ortografico di Excel, utilizzando il dizionario in esso contenuto. A questo punto, il corpus, in formato.csv, è stato importato nel package RcmdrPlugin.temis, interfaccia grafica del sottostante package tm di R. E stata impostata come prima colonna, quella contenente le risposte alle singole domande e, dalla seconda colonna in poi sono state inserite le variabili categoriali, tra le quali quella relativa al numero progressivo di domanda posta al soggetto (seconda colonna). Il corpus così ottenuto è stato suddiviso e analizzato sia nel suo complesso che nelle sue parti (dette subcorpus), questi ultimi creati sulla base di un criterio oggettivo di raggruppamento dipendente dalla struttura del questionario stesso. Prima di descrivere il corpus, è stato utilizzato uno strumento di tagging grammaticale, al fine di poter individuare la categoria di appartenenza delle varie forme grammaticali e quindi uniformarle (aggettivi, sostantivi e verbi). Lo strumento che ha reso possibile tale operazione è stato TreeTagger. Siamo quindi passati all analisi vera e propria. Tale fase è stata preceduta anche dall'eliminazione delle cosiddette "parole vuote" (anche stop word) ossia i termini come articoli, preposizioni, etc.. al fine di poter individuare i termini maggiormente frequenti, quelli cosiddetti specifici ed infine quelli peculiari sia all interno del corpus e che nei subcorpus. Tali valutazioni sono state effettuate sia a livello descrittivo (in termini di percentuali) sia a livello inferenziale applicando i test di significatività adeguati. Per termini specifici si intendono quelli caratteristici di una parte del corpus (subcorpus) rispetto all'intero corpus, valutato in base al loro sovra/sotto utilizzo nella parte rispetto al tutto. Nel primo caso si diranno frequenti, nel secondo caso si diranno rari. Non si esclude la possibilità di trovare un termine specifico "comune" a più subcorpus. In caso contrario il termine verrà detto "esclu1sivo o originale". Per termini peculiari si intendono le unità lessicali che risultano avere all'interno del corpus un forte sovra/sotto utilizzo rispetto ad un modello di riferimento, tipicamente costituito da un lessico di frequenza, ossia un corpus di grandi dimensioni (circa occorrenze), specifico per un determinato argomento. Tali unità vengono spesso dette "parole chiave". Al fine di poter rendere confrontabili le frequenze del corpus con quelle del lessico è stata preventivamente svolta una normalizzazione, ossia esprimere con un comun denominatore ciascuna frequenza relativa nel corpus e nel lessico. 2
3 Un corpus viene generalmente descritto attraverso indici in grado di caratterizzarne il tipo e l'eventuale possibilità di attuare metodi statistici di analisi, oppure, solamente darne una descrizione riassuntiva. Per dimensione di un corpus, si intende il totale delle occorrenze in esso contenute, dove per occorrenza (anche token) intendiamo ogni singola apparizione di una parola nel testo. Tipicamente, la dimensione minima per poter essere analizzata con tecniche statistiche risulta pari a occorrenze. Nell'insieme di un corpus sono di notevole importanza le forme grafiche (catena di caratteri) distinte. Infatti la percentuale di tali termini in un corpus (o subcorpus) non deve essere al di sotto del 20% se vogliamo utilizzare metodi statistici. Allo stesso modo deve essere al di sotto del 50% la percentuale dei termini con una sola occorrenza, ossia presenti una sola volta (detti anche hapax). E' necessario e doveroso sottolineare che nell'analisi sono stati volutamente tralasciati eventuali possibili raggruppamenti di termini considerati simili (es. marijuana, cannabis, canna) perché l'obiettivo principale, almeno in questa prima fase è stato quello di individuare i singoli termini "caratteristici" del linguaggio indipendentemente dal loro significato intrinseco. Alcuni acronimi utilizzati nelle tabelle: Global freq. Global freq % Level frequenza assoluta nel corpus frequenza relativa percentuale nel corpus frequenza assoluta nel subcorpus analizzato % Term/Level frequenza relativa percentuale del termine nel subcorpus analizzato % Level/Term frequenza relativa percentuale del termine nel subcorpus rispetto al corpus T Prob Statistica t di Student p-value 3
4 Analisi stratificata per Genere Caratteristiche socio-demografiche Il campione è costituto da 261 (55.7%) soggetti di sesso maschile e 208 (44.3%) soggetti di sesso femminile. L età media dei soggetti di sesso femminile (18.3, SD=6.8) è significativamente superiore a quella dei soggetti di sesso maschile (16.8, SD=4.0) (p=0.002). Il 93.8% dei soggetti di sesso maschile è uno studente delle scuole superiori, mentre il 76.4% è di sesso femminile lo è (p<0.05). Il 20.2% degli studenti di sesso femminile è uno studente universitario, mentre solo il 3.9% dei soggetti di sesso maschile lo è (p<0.05). L 89.9% dei soggetti di sesso maschile è in possesso di un titolo di studio medio inferiore, mentre il 71.8% è di sesso femminile lo è (p<0.05). Il 22.3% dei soggetti di sesso femminile è in possesso di un titolo di studio medio superiore mentre solo il 7.4% dei soggetti di sesso maschile lo è (p<0.05). Competenza-Esperienza del fenomeno Non viene rilevata nessuna differenza di genere statisticamente significativa relativamente al livello di competenza che si attesta, indipendentemente dal genere, intorno al 50% come sufficiente e intorno al 40% come buono. Il 28.2% dei soggetti di sesso maschile è venuto a contatto con soggetti che facevano uso di sostanze, mentre il 19.7% dei soggetti di sesso femminile lo è (p<0.05). Il 23.4% dei soggetti di sesso maschile ha fatto almeno una volta uso di sostanze, mentre il 13.0% dei soggetti di sesso femminile lo è (p<0.05). Solo 6 soggetti (9.8%) dei soggetti di sesso maschile di coloro che hanno dichiarato di aver provato almeno una volta una sostanza, dichiara di essere dipendente e 2, il 7.4% dei soggetti di sesso femminile (p>0.05). Di quest ultimi solamente 2, equamente ripartiti per genere, dichiara di aver ricevuto cure. Compulsive e Sostanze d Abuso Circa il 70% dichiara indipendentemente dal genere di conoscere il significato di Dipendenza Patologica. Circa la metà dei soggetti, il 43.8% dei soggetti di sesso maschile ed il 56.1% dei soggetti di sesso femminile hanno dichiarato di sapere se vi è una qualche relazione tra compulsive dipendenza patologica (p<0.05). Tra coloro che hanno risposto Si (115 soggetti di sesso femminile e 113 soggetti di sesso maschile), 80 soggetti, il 70.8%, dei soggetti di sesso maschile, dichiara la compulsione come un desiderio irrefrenabile di comportarsi in un certo modo, mentre il 68.7% si registra nei soggetti di sesso femminile (p>0.05). Circa il 65% indipendentemente dal genere, dichiara che il processo di consumo di sostanze stupefacenti 4
5 ha a che fare con bisogno e/o piacere. Circa il 66%dei soggetti, indipendentemente dal genere, dichiara che una sostanza d abuso è qualsiasi sostanza di cui si può abusare. Sentito Parlare In questo caso riportiamo solamente i risultati ritenuti statisticamente significativi, tralasciando il resto. Riportiamo in tabella sottostante i risultati ottenuti 5
6 Analisi delle domande non strutturate L Analisi precedentemente svolta sarà stratificata per genere e zona di residenza, in modo da andare ad individuare il linguaggio specifico, peculiare e rilevante separatamente per maschi, femmine e per soggetti residenti nelle seguenti quattro aree: Siena, Amiata, Colle di Val d'elsa e Val di Chiana. Inoltre sarà eseguito un test sulla significatività della differenza di proporzione d uso fra i due sessi. Sesso Maschile Il corpus: dimensione e caratteristiche La dimensione del corpus (totale delle occorrenze) è (considerato piccolo), di cui 3916 forme grafiche distinte (Word type). La percentuale di termini unici (Type/Token Ratio, TTR) è pari al 10.5% (essendo <20%, questo permette di procede con l analisi). La percentuale di hapax (termini presenti una sola volta) è il 46.5% (essendo <50%, anche questo permette di procedere). Infine ogni forma grafica si presenta in media 9.56 volte. Tab. 8 Caratteristiche corpus iniziale Da quanto riportato in Tab. 8, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 6
7 Da quanto osservato, si evince che i risultati saranno attendibili solo per il subcorpus 2, i risultati che otterremo dagli altri, dovranno essere presi con molta cautela. Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 9 Caratteristiche del nuovo corpus 7
8 Tab. 10 Termini più frequenti nel corpus 8
9 Tab. 11 Termini più frequenti subcorpus 1 9
10 Tab. 12 Termini più frequenti subcorpus 2 10
11 Tab. 13 Termini più frequenti subcorpus 3 11
12 Tab. 14 Termini più frequenti subcorpus 4 12
13 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 13
14 14
15 Competenze del partecipante 15
16 Patrimonio Linguistico 16
17 Esperienza diretta/indiretta 17
18 Linguaggio da strada 18
19 Sesso Femminile Il corpus: dimensione e caratteristiche La dimensione del corpus (totale delle occorrenze) è (considerato piccolo), di cui 3012 forme grafiche distinte (Word type). La percentuale di termini unici (Type/Token Ratio, TTR) è pari al 10.4% (essendo <20%, questo permette di procede con l analisi). La percentuale di hapax (termini presenti una sola volta) è il 43.03% (essendo <50%, anche questo permette di procedere). Infine ogni forma grafica si presenta in media 9.60 volte. Tab. 15 Caratteristiche corpus iniziale Da quanto riportato in Tab. 15, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 19
20 Da quanto osservato, si evince che i risultati saranno attendibili solo per il subcorpus 2, i risultati che otterremo dagli altri, dovranno essere presi con molta cautela. Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 16 Caratteristiche del nuovo corpus 20
21 Tab. 17 Termini più frequenti nel corpus 21
22 Tab. 18 Termini più frequenti subcorpus 1 22
23 Tab. 19 Termini più frequenti subcorpus 2 23
24 Tab. 20 Termini più frequenti subcorpus 3 24
25 Tab. 21 Termini più frequenti subcorpus 4 25
26 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 26
27 Competenze del partecipante 27
28 Patrimonio Linguistico 28
29 Esperienza diretta/indiretta 29
30 Linguaggio da strada 30
31 Analisi stratificata per Area di Residenza Caratteristiche socio-demografiche Il campione è costituto da 490 soggetti di cui 19 (3.9%) missing. La proporzione tra maschi e femmine è pressochè identica (50%) per Siena e Colle, mentre vi è una netta dominanza dei soggetti di sesso maschile per Amiata (76%) e Val di Chiana (69%). (p<0.05). Gli studenti delle scuole superiori sono tra l'80% ed il 96% con un valore significativamente superiore di Colle (96%) rispetto a Siena (81%), (p<0.05), mentre gli studenti universitari sono significativamente superiori a Siena (16.1%) rispetto a Colle (1.6%), (p<0.05). Stesso trend si osserva per i soggetti che hanno conseguito un diploma di scuola media inferiore e superiore: gli studenti con un diploma di scuola media inferiore sono in percentuale significativamente superiori a Colle (92.6%) rispetto a Siena (76%), (p<0.05), mentre gli studenti con un diploma di scuola media superiore sono in percentuale significativamente superiori a Siena (19.6%) rispetto a Colle (4.1 %), (p<0.05). Non vi è una significativa differenza tra l'età media dei soggetti (p>0.05) che si attesta intorno ai 17 anni. Competenza-Esperienza del fenomeno Non viene rilevata nessuna differenza di area statisticamente significativa relativamente al livello di competenza che si attesta, indipendentemente dall'area, intorno al 40% come buono e intorno al 50% come sufficiente per tutte le aree tranne l'amiata (28%). Si rileva una significativa superiore competenza dichiarata come "ottima" per i soggetti dell'amiata (20%) rispetto ai soggetti di Siena (3.9) e Colle (7.3), (p<0.05). Il 32.8% dei soggetti di Colle è venuto a contatto con soggetti che facevano uso di sostanze, mentre ciò avviene nel 6.9% dei soggetti della Val di Chiana (p<0.05). Nelle altre aree tale conoscenza si attesta intorno al 20%. Circa il 20% dei soggetti, indipendentemente dall'area di interesse ha fatto almeno una volta uso di sostanze. Solo 5 soggetti (14.3%) dei soggetti di Siena di coloro che hanno dichiarato di aver provato almeno una volta una sostanza, dichiara di essere dipendente e 2, l' 8.0% dei soggetti di Colle ed infine 1, il 9.1% dei soggetti della Val di Chiana (p>0.05). Di quest ultimi solamente un soggetto a Siena ed uno in Val di Chiana, dichiara di aver ricevuto cure. 31
32 Compulsive e Sostanze d Abuso Circa il 75% dichiara indipendentemente dalla zona di residenza di conoscere il significato di Dipendenza Patologica. Circa la metà dei soggetti, il 45% dei soggetti, indipendentemente dalla zona di residenza, ha dichiarato di sapere se vi è una qualche relazione tra compulsive dipendenza patologica. Tra coloro che hanno risposto Si", circa il 70%, dei soggetti di Siena e Val di Chiana, circa il 60% dei soggetti di Colle ed 44% dei soggetti dell'amiata dichiara la compulsione come un desiderio irrefrenabile di comportarsi in un certo modo. Circa il 60% indipendentemente dalla zona di residenza, dichiara che il processo di consumo di sostanze stupefacenti ha a che fare con bisogno e/o piacere. Tra il 70% e l'80% dei soggetti, indipendentemente dalla zona di residenza, dichiara che una sostanza d abuso è qualsiasi sostanza di cui si può abusare. Sentito Parlare In questo caso riportiamo solamente i risultati ritenuti statisticamente significativi, tralasciando il resto. Riportiamo in tabella sottostante i risultati ottenuti 32
33 Analisi per area di residenza Amiata Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 22 Caratteristiche corpus iniziale Da quanto riportato in Tab. 22, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 33
34 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 23 Caratteristiche del nuovo corpus 34
35 Tab. 24 Termini più frequenti nel corpus 35
36 Tab. 25 Termini più frequenti subcorpus 1 36
37 Tab. 26 Termini più frequenti subcorpus 2 37
38 Tab. 27 Termini più frequenti subcorpus 3 38
39 Tab. 28 Termini più frequenti subcorpus 4 39
40 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 40
41 Competenze del partecipante 41
42 Patrimonio Linguistico 42
43 Esperienza diretta/indiretta 43
44 Linguaggio da strada 44
45 Colle di Val d Elsa Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 29 Caratteristiche corpus iniziale Da quanto riportato in Tab. 29, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 45
46 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 30 Caratteristiche del nuovo corpus 46
47 Tab. 31 Termini più frequenti nel corpus 47
48 Tab. 32 Termini più frequenti subcorpus 1 48
49 Tab. 33 Termini più frequenti subcorpus 2 49
50 Tab. 34 Termini più frequenti subcorpus 3 50
51 Tab. 35 Termini più frequenti subcorpus 4 51
52 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 52
53 Competenze del partecipante 53
54 Patrimonio Linguistico 54
55 Esperienza diretta/indiretta 55
56 Linguaggio da strada 56
57 Val di Chiana Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 36 Caratteristiche corpus iniziale Da quanto riportato in Tab. 36, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 57
58 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 37 Caratteristiche del nuovo corpus 58
59 Tab. 38 Termini più frequenti nel corpus 59
60 Tab. 39 Termini più frequenti subcorpus 1 60
61 Tab. 40 Termini più frequenti subcorpus 2 61
62 Tab. 41 Termini più frequenti subcorpus 3 62
63 Tab. 42 Termini più frequenti subcorpus 4 63
64 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 64
65 Competenze del partecipante 65
66 Patrimonio Linguistico 66
67 Esperienza diretta/indiretta 67
68 Linguaggio da strada 68
69 Siena Il corpus: dimensione e caratteristiche Il corpus ha tutti i parametri al di sotto dei valori soglia per poter eseguire un analisi statistica testuale. Nonostante questo riportiamo i risultati ottenuti, almeno a livello esplorativo-descrittivo. Tab. 43 Caratteristiche corpus iniziale Da quanto riportato in Tab. 43, possiamo osservare i principali indicatori lessicometrici per il corpus ed i relativi subcorpus. 69
70 Analisi dei termini maggiormenti frequenti nel corpus e nei quattro subcorpus Andiamo adesso ad analizzare i termini pieni maggiormente frequenti nel corpus dapprima e, successivamente nei quattro sub corpus, considerandone un massimo di 25 e ordinati in maniera decrescente per numero di occorrenze. Quindi, da questa fase, abbiamo eliminato dal vocabolario, tutti gli stop word ossia quelle forme grafiche non aventi nessun significato come articoli, preposizioni, etc.. I termini rimasti, daranno un idea del linguaggio utilizzato, restringendo così il raggio d azione, ma non necessariamente non rappresenterà né il più specifico né il peculiare (casi trattati successivamente). Il corpus risulta essere così costituito: Tab. 44 Caratteristiche del nuovo corpus 70
71 Tab. 45 Termini più frequenti nel corpus 71
72 Tab. 46 Termini più frequenti subcorpus 1 72
73 Tab. 47 Termini più frequenti subcorpus 2 73
74 Tab. 48 Termini più frequenti subcorpus 3 74
75 Tab. 49 Termini più frequenti subcorpus 4 75
76 Analisi delle specificità Con questa analisi andiamo ad individuare i termini che nelle singole domande presentano un significativo sovra-sotto uso rispetto all intero corpus (in neretto, corsivo e sottolineato). Ciò non esclude la possibilità che esistano termini comuni a più domande. Se ciò non fosse vero, tali termini verrebbero detti esclusivi (o originali ). Tra i termini significativi il cui valore della statistica test t risulta positivo sono detti specifici, quelli con termine negativo sono detti rari. Abbiamo considerato come significativi da un punto di vista linguistico, quelli associati ad un p<0.05, tra quelli che presentavano un numero di occorrenze superiore al numero delle categorie di domande non strutturate (4) + 1). Di questi abbiamo considerato il massimo dei termini significativi. Il test fa riferimento alla distribuzione di una variabile aleatoria ipergeometrica. 76
77 Competenze del partecipante 77
78 Patrimonio Linguistico 78
79 Esperienza diretta/indiretta 79
80 Linguaggio da strada 80
Linguistica Computazionale
Linguistica Computazionale Frequenze di parole 7 ottobre 2014 Statistica terminologia di base Popolazione (collettivo) l insieme delle entità (oggetti, individui, eventi, ecc.) che rappresentano il dominio
DettagliProgetto Unico Ser.T.
Progetto Unico Ser.T. Relazione tecnica preliminare dott. andrea pammolli statistico dott. giuseppe montefrancesco responsabile U.O. Prevenzione Dipendenze Patologiche ASL 7- Siena - Italy 1 Relazione
DettagliMODELLI QUANTITATIVI. f x r = c
MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico
DettagliOsservatorio per le Politiche Sociali - Terzo Rapporto
1 STRUTTURA E DINAMICA DEMOGRAFICA Il capitolo si articola in due paragrafi. Nel primo sono riportati i dati e i commenti riguardanti la struttura demografica della popolazione della Valle d Aosta. Nel
DettagliTest di orientamento della Facoltà di Scienze MM.FF.NN. A.A. 2007/2008
Università degli Studi di Cagliari PROGRAMMA OPERATIVO NAZIONALE PER LE REGIONI DELL OBIETTIVO 1 Campania, Puglia, Basilicata, Calabria, Sicilia, Sardegna RICERCA SCIENTIFICA, SVILUPPO TECNOLOGICO, ALTA
DettagliOGGETTO: Ricoveri ospedalieri per patologie respiratorie nella popolazione nata in Italia, residente a S. Polo e nel resto del comune di Brescia.
OGGETTO: Ricoveri ospedalieri per patologie respiratorie nella popolazione nata in Italia, residente a S. Polo e nel resto del comune di Brescia. Introduzione I risultati ottenuti dall indagine precedente
DettagliLa matrice dati. La matrice dati
La matrice dati Matrice casi per variabili - Stessa unità di analisi (es. individui, nazioni, etc ) - Stesse informazioni per ogni caso CODIFICA Traduzione del materiale grezzo in matrice dati Tracciato
DettagliINCIDENTI DOMESTICI OVER 65. Anni 2010 e 2011
INCIDENTI DOMESTICI OVER 65 Anni 2010 e 2011 Dall'analisi delle SDO relative agli anni 2010 e 2011 è emerso che nell ASL di Brescia sono stati effettuati rispettivamente 2.004 e 2.255 ricoveri ordinari
DettagliCompiti tematici dai capitoli 2,3,4
Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica
DettagliTitolo della lezione Corso di Statistica Prof. Andrea CICCARELLI
Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della
DettagliStatistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
DettagliLivello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale
Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la
DettagliFonti e strumenti statistici per la comunicazione
Fonti e strumenti statistici per la comunicazione Introduzione all analisi bivariata: il caso di caratteri qualitativi Prof.ssa Isabella Mingo A.A. 016-017 Che cosa è l analisi bivariata? E lo studio congiunto
DettagliMetodi Quantitativi per Economia, Finanza e Management. Esempi di Analisi Univariata
Metodi Quantitativi per Economia, Finanza e Management Esempi di Analisi Univariata GRUPPO QUATTRO RUOTE Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894 Gruppo Quattro
DettagliANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO. A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo
ANALISI DEL QUADRO DEMOGRAFICO DELL ASL DI BERGAMO A cura dell Osservatorio Socio-Sanitario Direzione Sociale ASL di Bergamo Indice delle tavole Note sintetiche a commento dei principali fenomeni osservati...
DettagliFigura 1. Obiettivi di studio che i ragazzi intendono raggiungere (%)
Università Commerciale Luigi Bocconi, Milano Progetto Orientamento scolastico e percorsi di studio al termine delle scuole medie SCUOLA SECONDARIA DI I GRADO VIOTTI, TORINO La scelta della scuola superiore
DettagliTitolo della lezione. Introduzione
Titolo della lezione Introduzione Informazioni sul corso - 1 Obiettivi Nel corso verranno approfonditi gli argomenti relativi alla statistica descittiva di base e alla statistica inferenziale; particolare
Dettaglibambini di cinque anni in provincia di Bergamo
Obesità nei bambini di cinque anni in provincia di Bergamo Dati demografici provincia di Bergamo a cura di L.Siccardo, G.Sampietro, L.Perego 2 1 Bambini di cinque anni residenti in provincia di Bergamo
DettagliRappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica
Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare
DettagliOGGETTO: Ricoveri ospedalieri per diverse patologie nel quartiere S. Polo e nel resto del comune di Brescia nel periodo
OGGETTO: Ricoveri ospedalieri per diverse patologie nel quartiere S. Polo e nel resto del comune di Brescia nel periodo 2004-2008. Introduzione L analisi dei ricoveri nel quartiere S. Polo del comune di
DettagliElementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
DettagliLinguistica Computazionale
Linguistica Computazionale Esercitazione: indici statistici del testo e misure di associazione Calcolare la lunghezza di un corpus C : Calcolare la lunghezza di un corpus C : output sys.argv[0] sys.argv[1]
DettagliNoi e l ambiente. Prof.ssa Paola Carroccia, Prof.ssa Filippa Latella ITET A. de Viti de Marco Triggiano
Noi e l ambiente Prof.ssa Paola Carroccia, Prof.ssa Filippa Latella ITET A. de Viti de Marco Triggiano Tabella 1.Mutabile sconnessa: Percentuale degli intervistati in base al sesso. Sesso Frequenze assolute
DettagliPERCORSI ED ESITI DELLA GRAVIDANZA
REGIONE PIEMONTE - A.S.L. NO PERCORSI ED ESITI DELLA GRAVIDANZA Informazioni dai Certificati di Assistenza al Parto (CeDAP) A cura di Maria Chiara Antoniotti ASL NO Servizio Sovrazonale di Epidemiologia
DettagliMasterplan Città di Castello smart Scheda: demografia Versione 1.1 (maggio 2014)
Masterplan Città di Castello smart Scheda: demografia Versione 1.1 (maggio 2014) La situazione demografica Il comune di Città di Castello ha la sua popolazione al 1/01/2013 pari a 40.016 abitanti residenti
DettagliEffettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari
Effettuazione di un TEST D IPOTESI 1. Formulazione H 0 e H 1 2. Scelta del test statistico 3. Calcolo del test statistico ˆ 0 test ES[ˆ] dove ˆ = stima del parametro di interesse calcolata sui dati campionari
DettagliTutta la scienza è fondata sulle misure (Helmholtz)
Tutta la scienza è fondata sulle misure (Helmholtz) L acquisizione di una osservazione come DATO SCIENTIFICO richiede che : osserviamo un fenomeno lo quantifichiamo correttamente lo confrontiamo con altri
Dettagli(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE
IL TEST DEL CHI 2 (2) Consente di verificare ipotesi su: a) relazioni tra variabili nella popolazione b) differenze tra popolazioni relative a: distribuzioni di frequenza Livello di misura dei dati: scala
DettagliStatistica Sociale - modulo A
Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it Orario lezioni obiettivi formativi programma laboratorio e modalita di esame Orario lezioni obiettivi formativi programma laboratorio e modalita
DettagliTipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
DettagliLE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI
LE OPINIONI DEI CONSUMATORI CIRCA LE NUOVE TIPOLOGIE DI ALIMENTAZIONE PER AUTOMOBILI - GRUPPO Codari Stefano (19492) Ferrigno Chiara (19853) De Agostini Karin (19507) Giraldo Andrea (19723) Analisi Bivariate
DettagliSTATISTICA: esercizi svolti sulla MEDIA ARITMETICA
STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997
DettagliDipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli
Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 1 1. Si considerino i seguenti caratteri
DettagliTra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.
Domanda 1 Una misura di sintesi di una distribuzione si dice robusta se... a. Risulta particolarmente sensibile ai valori anomali (valori molto piccoli o molto grandi) c. Non risulta particolarmente sensibile
Dettagli11. Il lessico dei testi
Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta
DettagliLA PARTECIPAZIONE DEI GIOVANI
Ragioneria Generale Direzione Sistemi informativi di pianificazione e controllo finanziario U.O. Statistica LA PARTECIPAZIONE DEI GIOVANI AL SISTEMA UNIVERSITARIO ROMANO Anno accademico 2014-2015 Indice
DettagliSINTESI DELL INDAGINE INVALSI 2017 (II classe delle superiori, riformata)
SINTESI DELL INDAGINE INVALSI 2017 (II classe delle superiori, riformata) L indagine INVALSI del 2016/2017 ha coinvolto quattordici classi del, compresa la sede associata; nessuna classe è stata scelta
DettagliLe medie. Antonello Maruotti
Le medie Antonello Maruotti Outline 1 Medie di posizione 2 Definizione Moda La moda di un collettivo, distributio secondo un carattere qualsiasi, è la modalità prevalente del carattere ossia quella a cui
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Esercizio In una prova sul carico di rottura di due tipi di corda si dispone di 2 campioni di ampiezza 26 e 35 rispettivamente. Nel
DettagliLe sezione del questionario relativa alla corretta alimentazione viene qui riportata:
RISULTATI DELL INDAGINE CONOSCITIVA SULLE ABITUDINI di VITA DEGLI ASSISTITI E SULL ATTIVITA di PROMOZIONE DEGLI STILI di VITA da PARTE DEGLI OPERATORI SANITARI NELL ASL di BRESCIA 2 parte: ALIMENTAZIONE
DettagliOBIETTIVI DI APPRENDIMENTO
CURRICOLO DI FRANCESE SPAGNOLO CLASSE PRIMA TRAGUARDI DI COMPETENZA Comprendere il significato globale di un breve e semplice messaggio orale e riconoscere in esso informazioni utili. NUCLEI TEMATICI ASCOLTO
DettagliRELAZIONE RISULTATI PROVE INVALSI 2018
Istituto Comprensivo G. MARCONI Terni Scuole Primarie Le Grazie Matteotti RELAZIONE RISULTATI PROVE INVALSI 2018 CLASSI SECONDE Per le classi seconde le prove si sono svolte regolarmente, secondo le modalità
DettagliCERTIFICATI ISO 9001:2008
e Pag. 1 6 Il presente lavoro riporta i risultati della indagine sulla soddisfazione dei clienti-pazienti delle strutture ospedaliere dell Azienda Ospedaliera Sant Antonio Abate di Gallarate, attraverso
DettagliIndagine pilota TECO-2017
La rilevazione TECO-2017 ha coinvolto 5 Atenei e 1.460 studenti del primo e del terzo anno con l obiettivo di verificare le prove di e, in seguito alla indagine pilota del 2016. Sommario 1. Introduzione...
DettagliLinguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp)
Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Malvina Nissim malvina.nissim@unibo.it 1 Aprile 2009 1 ssh gollum.sitlec.unibo.it login passwd cqp 1 Cercare e contare 1.1 Contare
DettagliObiettivi del corso. Analisi dei dati
Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di
DettagliMa quali fenomeni sono da intendersi per fenomeni collettivi?
La statistica è la scienza che studia i fenomeni collettivi di vario genere. Essa raccoglie, analizza e interpreta, utilizzando metodi e strumenti matematici, le informazioni riguardanti il particolare
DettagliServizio Sviluppo Economico, studi e statistica. Analisi dei redditi dei cittadini di Trento anno d imposta 2014
Servizio Sviluppo Economico, studi e statistica Analisi dei redditi dei cittadini di Trento anno d imposta 214 Analisi dei redditi dei cittadini di Trento Anno d imposta 214 - ottobre 216 - Servizio Sviluppo
DettagliStefania Taralli Anno Accademico 2017/2018 1
DEFINIZIONE CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI I rapporti statistici AA 2017/2018 Un rapporto statistico è un quoziente tra due termini di cui almeno uno è di natura
DettagliAnalisi customer sul servizio di Call Center dell URP del Comune di Bari. (periodo di rilascio dal 18/11/2017 al 22/11/2017)
Analisi customer sul servizio di Call Center dell URP del Comune di Bari (periodo di rilascio dal 18/11/2017 al 22/11/2017) 1. ANALISI DESCRITTIVE DEL CAMPIONE Il campione dei rispondenti (N=157) al questionario
DettagliVISIONE DEL FUTURO ALLEGATO STATISTICO
C E N S I S VISIONE DEL FUTURO ALLEGATO STATISTICO Roma, 31 luglio 2010 Tab. 1 - Maggiori problemi sul futuro dell' Italia, per sesso (val.%) Quali pensa siano i due maggiori problemi che pesano sul futuro
DettagliINDAGINE CONOSCITIVA SUI BISOGNI FORMATIVI
INDAGINE CONOSCITIVA SUI BISOGNI FORMATIVI 1. Obiettivo generale Oggetto della ricerca sono stati tre Dipartimenti e una Struttura Complessa pilota, più precisamente: - Dipartimento Salute Mentale e Dipendenze
DettagliAIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE
AIP Seminario residenziale Psicologia del discorso e analisi dei discorsi L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE Silvia Gattino e Stefano Tartaglia Dipartimento di Psicologia Università
DettagliCOMUNE di SAN COLOMBANO AL LAMBRO BORGO INSIGNE (Titolo Araldico) Provincia di MILANO. Servizio Gestione Sistema Qualità
COMUNE di SAN COLOMBANO AL LAMBRO BORGO INSIGNE (Titolo Araldico) Provincia di MILANO 2^ Indagine di Customer Satisfaction sui Servizi Demografici Presentazione dei risultati Sintesi INDICE PREMESSA pag.
DettagliStatistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019
Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 prof. Federico Plazzi 28 Giugno 2019 Nome: Cognome: Matricola: Alcune indicazioni: La prova è costituita da cinque esercizi; dopo
DettagliInformazioni introduttive Le prove Invalsi sono state somministrate: al 71,8% degli alunni nella prova italiano e al 70% degli alunni nella prova
Informazioni introduttive Le prove Invalsi sono state somministrate: al 71,8% degli alunni nella prova italiano e al 70% degli alunni nella prova matematica delle classi seconde; all 87% degli alunni nella
DettagliTitolo della lezione Corso di Statistica Prof. Andrea CICCARELLI
Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della
DettagliI codici miscellanei nel basso medioevo
Convegno internazionale Il Codice Miscellaneo - Tipologia e Funzioni Cassino - Aula Magna Facoltà di Ingegneria - 15/5/23 I codici miscellanei nel basso medioevo Antonio Cartelli, Marco Palma, Silvia Ruggiero
DettagliEsercitazione. 24 Aprile 2012
Esercitazione 24 Aprile 2012 Il modello di regressione logistica viene utilizzato quando si è interessati a studiare o analizzare la relazione causale tra una variabile dipendente dicotomica e una o più
DettagliLa statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
DettagliTabella per l'analisi dei risultati
Vai a... UniCh Test IV_Statistica_Eliminatorie Quiz IV_Statistica_Eliminatorie Aggiorna Quiz Gruppi visibili Tutti i partecipanti Info Anteprima Modifica Risultati Riepilogo Rivalutazione Valutazione manuale
DettagliProfilo socio-demografico
PROFILO SOCIODEMOGRAFIXCO PROFILO SOCIO-DEMOGRAFICO 2012 In Piemonte, la popolazione in studio è costituita da circa 3 milioni di residenti di 18-69 anni di età iscritti al 31/12/2011 nelle liste delle
DettagliData set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio
ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,
DettagliA proposito di valutazione scolastica
A proposito di valutazione scolastica Livello scolare: 2 biennio Abilità interessate Identificare situazioni che richiedono di rilevare lo stesso carattere su una unità statistica formata da 2 elementi,
DettagliPOPOLAZIONE: INDICI DI STRUTTURA E DINAMICA. Anno Anticipazione
Ragioneria Generale I Direzione Sistemi informativi di pianificazione e controllo finanziario U.O. Statistica POPOLAZIONE: INDICI DI STRUTTURA E DINAMICA Anno 2016 Anticipazione Indice La popolazione a
DettagliESERCITAZIONE ANCOVA
ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono
DettagliPROVINCIA DI ROVIGO Assessorato alle Politiche Giovanili
PROVINCIA DI ROVIGO Assessorato alle Politiche Giovanili OSSERVATORIO SUL DISAGIO GIOVANILE Ser.T. e Associazioni Aggiornamento dei dati - Anno 2008 Si ringraziano per i dati forniti e la cortese collaborazione:
DettagliIntroduzione alla statistica con Excel
Introduzione alla statistica con Excel Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Servizio Sociale A.A. 2017/2018 Variabili quantitative e qualitative
DettagliATTEGGIAMENTI PSICOSOCIALI SUGLI USI DEI MEZZI TECNOLOGICI
Laboratorio di Statistica per l informazione e la conoscenza 2017-2018 Liceo Polivalente «Don Q. Punzi» ATTEGGIAMENTI PSICOSOCIALI SUGLI USI DEI MEZZI TECNOLOGICI Docenti partecipanti: Prof.ssa Floriana
DettagliAnalisi bivariata. Il caso di caratteri qualitativi
Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano
DettagliANALISI EPIDEMIOLOGICA SULLA FREQUENZA DEI TUMORI NELLA ZONA SOCIO-SANITARIA VALDARNO ARETINA Eta anni
ANALISI EPIDEMIOLOGICA SULLA FREQUENZA DEI TUMORI NELLA ZONA SOCIO-SANITARIA VALDARNO ARETINA Eta 30-49 anni SINTESI DEI DATI PRESENTATI Con una metodologia analoga a quella utilizzata per l analisi della
DettagliIl consumo di alcol nel 2011: risultati della sorveglianza PASSI
Il consumo di alcol nel 11: risultati della sorveglianza PASSI a cura di M. Chiara Antoniotti, Fabio Contarino, Andrea Nucera Servizio Sovrazonale di Epidemiologia (SSEPI) ASL NO PASSI (Progressi delle
DettagliFacoltà di Medicina e Chirurgia
Facoltà di Medicina e Chirurgia METODOLOGIE STATISTICHE UTILIZZATE PER L ANALISI DELLA SODDISFAZIONE DEGLI STUDENTI FREQUENTANTI A.A. 2011-2012 NUCLEO DI VALUTAZIONE DI ATENEO MILANO PIACENZA - CREMONA
DettagliSegnalazioni alle prefetture
Segnalazioni alle prefetture Segnalazioni alle prefetture SEGNALAZIONI ALLE PREFETTURE Le segnalazioni alle Prefetture (ai sensi degli art. 75 e 121 del DPR 309/90), per utilizzo o possesso di sostanze
DettagliInfermieristica e Medicina di Genere:
Infermieristica e Medicina di Genere: Indagine conoscitiva sul fabbisogno formativo Studente: Benedetta Cutolo Relatore: Prof. Marcello Fedi Correlatore: Dott. Eufrasio Girardi Pistoia 4 Dicembre 2015
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in FISICA Classe: L-30 Scienze e tecnologie fisiche Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione riporta i risultati
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione per caratteri quantitativi discreti e continui Il seguente data set riporta la rilevazione
DettagliInformazioni Statistiche N 2/2005
Città di Palermo Ufficio Statistica Sistema Statistico Nazionale Censimento 2001: il grado di istruzione Girolamo D Anneo Informazioni Statistiche N 2/2005 AGOSTO 2005 Ufficio Statistica Sistema Statistico
DettagliLe statistiche sui redditi dei cittadini
Comune di Trieste Le statistiche sui redditi dei cittadini Convegno nazionale USCI Messina, 26 e 27 settembre 2013 Antonella Primi Comune di Trieste I dati utilizzati per le elaborazioni statistiche presentate
DettagliRisultati relativi al Primo Trimestre 2009
Comune di Livorno Comune di Collesalvetti INDAGINE CAMPIONARIA SULLE FORZE DI LAVORO NEL SISTEMA ECONOMICO LOCALE DELL AREA LIVORNESE Risultati relativi al Primo Trimestre 2009 Da Ottobre 2003 nel Sistema
DettagliRESTITUZIONE DATI INVALSI 2018ANNO SCOLASTICO 2018/19. a cura delle FF.SS. Massa Stefania e Canargiu Giovanni
RESTITUZIONE DATI INVALSI 2018ANNO SCOLASTICO 2018/19 a cura delle FF.SS. Massa Stefania e Canargiu Giovanni STRUTTURA DELLE PROVE Classe II - Scuola Primaria 1.Prova preliminare di lettura( svolta esclusivamente
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA AZIENDALE Classe: L-18 Scienze dell'economia e della gestione aziendale Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La
DettagliReport. Alunni diplomati presso l'istituto San Giovanni Bosco e Cennino Cennini di Colle di Val d'elsa nel quinquennio :
Report Alunni diplomati presso l'istituto San Giovanni Bosco e Cennino Cennini di Colle di Val d'elsa nel quinquennio 213-217: quale occupazione dopo il diploma? Come è stata condotta l'indagine Innanzitutto
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in MATEMATICA Classe: L-35 Scienze matematiche Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione riporta i risultati
DettagliLaboratorio di Chimica Fisica. Analisi Statistica
Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica
DettagliDispense Associazione PRELIMINARY DRAFT
Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di
DettagliStatistiche per l analisi dei trend Capitolo 6
Statistiche per l analisi dei trend Capitolo 6 l analisi dei trend Secondo Keppel, Saufley e Tokunaga (2001) è il procedimento statistico che consente di valutare la probabile esistenza di una relazione
DettagliDistribuzione di frequenza relativa e percentuale: esempio
Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA AZIENDALE Classe: L-18 Scienze dell'economia e della gestione aziendale Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La
DettagliALLA FINE DELLA CLASSE QUARTA L ALUNNO È IN GRADO DI Competenza Abilità Conoscenze. Quando ascolta l alunno è in grado di:
ISTITUTO COMPRENSIVO BASSA ANAUNIA - DENNO PIANO DI STUDIO DI ITALIANO CLASSE QUARTA Competenza 1: Interagire e comunicare verbalmente in contesti di diversa natura ALLA FINE DELLA CLASSE QUARTA L ALUNNO
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in SCIENZE DELLA COMUNICAZIONE Classe: L-20 Scienze della comunicazione Triennale Quadro C1 - Dati di ingresso, di percorso e di uscita La seguente relazione
DettagliObiettivi del corso. Analisi dei dati
Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di
DettagliMortalità e Incidenza patologie cardiovascolari e respiratorie nei comuni di Rodengo Saiano, Gussago, Castegnato e Ospitaletto - Settembre
Mortalità e Incidenza patologie cardiovascolari e respiratorie nei comuni di Rodengo Saiano, Gussago, Castegnato e Ospitaletto - Settembre 2012 - A cura dell Osservatorio Epidemiologico, ASL di Brescia
DettagliUn anno dopo risultati di una scelta
Piano Nazionale Lauree Scientifiche 15/16-Statistica L università edgli studi di Bari Aldo Moro dipartimento di Scienze Economiche e Metodo Matematici in collaborazione con IISS Majorana-Laterza presenta
DettagliLE PRESTAZIONI DI PRONTO SOCCORSO DELL ANNO 2012 NELL ASL DELLA PROVINCIA DI VARESE. Direzione Generale U.O.C. Osservatorio Epidemiologico
LE PRESTAZIONI DI PRONTO SOCCORSO DELL ANNO 2012 NELL ASL DELLA PROVINCIA DI VARESE Direzione Generale U.O.C. Osservatorio Epidemiologico Introduzione Le prestazioni di pronto soccorso (specialistica ambulatoriale
Dettaglimateriale didattico II incontro
Piano Nazionale Lauree Scientifiche (PLS 016-017) Statistica Laboratorio di Statistica Le relazioni tra variabili. L indipendenza prof.ssa Angela Maria D'Uggento angelamaria.duggento@uniba.it materiale
DettagliU.O. Epidemiologia Registro Tumori ASL Lecce. Dati di incidenza e Mortalità
U.O. Epidemiologia Registro Tumori ASL Lecce Dati di incidenza e Mortalità Popolazione Provincia di Lecce Popolazione: 806.412 (ISTAT: 1/1/2014) Superficie: 2.759 km 2 Densità: 293 abitanti/km 2 Numero
DettagliUNIVERSITA DEGLI STUDI DI SALERNO
UNIVERSITA DEGLI STUDI DI SALERNO Corso di Studio in ECONOMIA, VALORIZZAZIONE, GESTIONE DEL PATRIMONIO TURISTICO Classe: L-15 Scienze del turismo Triennale Quadro C1 - Dati di ingresso, di percorso e di
Dettagli