Linguistica Computazionale

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Linguistica Computazionale"

Transcript

1 Linguistica Computazionale Frequenze di parole 7 ottobre 2014

2 Statistica terminologia di base Popolazione (collettivo) l insieme delle entità (oggetti, individui, eventi, ecc.) che rappresentano il dominio di interesse e di ricerca, su cui vogliamo acquisire conoscenza l Università, ecc. Unità statistiche gli elementi che compongono la popolazione gli studenti universitari (ma anche le facoltà, i dipartimenti, ecc.) Variabili attributi delle unità statistiche, che vengono misurate e/o rilevate età, reddito, provenienza, sesso, ecc. i valori che possono assumere le variabili si dicono modalità sesso = {M, F} età = {20, 25, ecc.} 2

3 Statistica terminologia di base Le variabili sono di tipo diverso a seconda del tipo di valori che ammettono nominali (o categoriali) hanno un numero finito di valori che definiscono classi a cui appartengono le unità statistiche (sesso, provenienza, categoria grammaticale, ecc.) non esistono relazioni di ordinamento tra le unità, ma solo di appartenenza o meno alla stessa classe ordinali hanno valori (gradi) che permettono di confrontare le unità statistiche ordinandole lungo una scala (voti degli esami, ecc.) differenze tra i gradi della scala non sono comparabili intervallo (o ratio) hanno valori che permettono di stabilire non solo relazioni di ordinamento, ma anche di comparare le differenze e i rapporti tra i valori (es. altezza, lunghezza in caratteri di una parola, ecc.) 3

4 Statistica terminologia di base Le unità statistiche differiscono per uno o più valori nelle variabili gli studenti hanno diversa provenienza, diversa età, ecc. La rilevazione del valore delle variabili delle unità statistiche fornisce i dati a partire dai quali si cerca di acquisire conoscenza sul comportamento della popolazione dati statistica descrittiva statistica inferenziale conoscenza 4

5 Statistica terminologia di base In generale i dati vengono acquisiti su un sottoinsieme della variabili popolazione (campione) unità statistiche studente sesso provenienza età M Pisa F Lucca 22 I dati raccolti vengono riassunti attraverso le distribuzioni di frequenza per ogni modalità x viene specificato quante unità nel campione hanno x (frequenza di x) provenienza F modalità della variabile Pisa 45 Lucca 72 Viareggio 29 5

6 Statistica distribuzione di frequenze Provenienza Frequenze Provenienza Pisa Lucca Viareggio Livorno Firenze Bologna Roma Milano Modalità della variabile 6

7 Statistica e testo Popolazione linguistica linguaggio oggetto di studio Campione corpus di testi della popolazione linguistica Unità statistiche parole altre unità linguistiche possono essere scelte come unità statistiche morfemi, sintagmi, frasi, ecc. 7

8 (Word) Tokens <t n="1">non</t><t n="2">era</t><t n="3">un</t><t n="4">legno</t><t n="5">di</t><t n="6">lusso</ t><t n="7">ma</t><t n="8">un</t><t n="9">semplice</t><t n="10">pezzo</t><t n="11">da</t><t n="12">catasta</t><t n="13">di</t><t n="14">quelli</t><t n="15">che</t><t n="16">d </t><t n="17">inverno</t><t n="18">si</t><t n= 19">mettono</t><t n="20">nelle</t><t n="21">stufe</t><t n="22">e</t><t n="23">nei</t><t n="24">caminetti</t><t n="25">per</t><t n="26">accendere</t><t n="27">il</t><t n="28">fuoco</t><t n= 29">e</t><t n="30">per</t><t n="31">riscaldare</t><t n="32">le</t><t n="33">stanze</t> Frammento 1 Ogni (word) token (o parola unità) rappresenta una distinta occorrenza di parola nel testo NB: le parole sono un sottoinsieme dei token di un testo Le parole token sono le unità statistiche 8

9 Attributi delle parole Gli attributi di una parola unità sono le dimensioni che la caratterizzano e possono essere operazionalizzate come variabili (tipicamente di natura categoriale) tipo, lemma, categoria grammaticale, lunghezza in caratteri, ecc. attributi parole unità ATTRIBUTO CATEGORIA (PAROLA) TIPO LEMMA LUN parola unità GRAMMATICAL E Non 1 non NON 3 AVVERBIO era 2 era ESSERE 3 VERBO un 3 un UN 2 ARTICOLO legno 4 legno LEGNO 5 NOME di 5 di DI 2 PREPOSIZIONE lusso 6 lusso LUSSO 5 NOME ma 7 ma MA 2 CONGIUNZIONE un 8 un UN 2 ARTICOLO semplice 9 semplice SEMPLICE 8 AGGETTIVO pezzo 10 pezzo PEZZ O 5 NOME da 11 da DA 2 PREPOSIZIONE catasta 12 catasta CATASTA 7 NOME valori degli attributi

10 Statistica e testo Gli attributi delle parole unità formano le variabili statistiche da rilevare Dato un attributo, contare quante parole unità ricorrono con un certo valore v dell attributo significa calcolare la frequenza (assoluta) di v quanti tokens sono nomi? = frequenza dei nomi quanti tokens appartengono al lemma CANE? = frequenza di CANE (Word) type (parola tipo) classe di tutti i tokens che contengono la stessa sequenza di caratteri due parole unità appartengono allo stesso tipo se sono formalmente indistinguibili a prescindere dalla posizione che occupano nel testo l individuazione del tipo di parola non tiene conto di ulteriori analisi linguistiche (es. lemmatizzazione, ecc.) 10

11 Tokens e types La porta è chiusa. La strada porta al mare. tokens porta type PORTA PORTARE lemmi 11

12 Distribuzione di frequenze di parole Frequenza (assoluta) di una parola tipo v i (v i ) numero delle occorrenze (tokens) della parola tipo v i in un testo esempio: nel Frammento 1, di = 2 frequenze parola tipo 12

13 Frequenze di parole Lunghezza del corpus (C) numero di tokens nel testo Se v 1,, v n sono i types del testo vale che v + 1 v + 2 v v = n C In generale, le frequenze assolute di due distribuzioni, non sono confrontabili, in quanto si riferiscono a un diverso numero totale di unità Frequenza relativa di una parola (f(v i )) f ( vi ) = v i C v normalizzata come i 100 percentuale C 13

14 Il vocabolario Vocabolario del corpus (V C ) numero delle parole tipo distinte (type) nel corpus esempio Nel Frammento 1, V C = 29 Alcune distinzioni importanti Vocabolario del corpus insieme dei type distinti che ricorrono nel corpus Lessico repertorio di tutte le parole possibili di quella lingua (oppure di tutte le parole conosciute da quel parlante) insieme potenzialmente infinito di parole Dizionario repertorio di lemmi e forme flesse di una lingua selezionato per qualche scopo 14

15 Distribuzioni di frequenze ad ogni individuo spettano tutti i diritti e tutte le libertà enunciate nella presente dichiarazione, senza distinzione alcuna, per ragioni di razza, di colore, di sesso, di lingua, di religione, di opinione politica o di altro genere, di origine nazionale o sociale, di ricchezza, di nascita o di altra condizione. nessuna distinzione sarà inoltre stabilita sulla base dello statuto politico, giuridico o internazionale del paese o del territorio cui una persona appartiene, sia indipendente, o sottoposto ad amministrazione fiduciaria o non autonomo, o soggetto a qualsiasi limitazione di sovranità. C = 105 tokens V C = 70 types parola freq. freq. rel., di o distinzione del ad una tutti tutte

16 Il vocabolario Classe di frequenza (V i ) l insieme dei type che hanno come frequenza i V 4 = l insieme dei type che hanno frequenza 4 V 1 = l insieme dei type che ricorrono una volta sola (hapax legomena) V 1 + V2 + V V f max = Vc La ripetizione di una stessa parola tipo v determina il passaggio di v da una classe V i alla classe V i+1 non cambia però il valore complessivo di V c perché non viene inserito un nuovo tipo in V c Con le classi di frequenza è possibile ricostituire la lunghezza del corpus: max V1 1+ V2 2+ V V f max = C 16

17 Classi di frequenza ad ogni individuo spettano tutti i diritti e tutte le libertà enunciate nella presente dichiarazione, senza distinzione alcuna, per ragioni di razza, di colore, di sesso, di lingua, di religione, di opinione politica o di altro genere, di origine nazionale o sociale, di ricchezza, di nascita o di altra condizione. nessuna distinzione sarà inoltre stabilita sulla base dello statuto politico, giuridico o internazionale del paese o del territorio cui una persona appartiene, sia indipendente, o sottoposto ad amministrazione fiduciaria o non autonomo, o soggetto a qualsiasi limitazione di sovranità. parola freq. freq. rel., di o distinzione del ad una tutti tutte V 1 = 63 V 2 = 4 V 8 = 1 V 12 = 1 V 14 = 1 17

18 Il vocabolario Spettro di frequenze permette di analizzare la distribuzione delle parole tipo in classi di frequenza grafico che si ottiene mettendo in ascissa valori crescenti di classi di frequenza i da 1 a max; sulle ordinate, riportiamo quante parole tipo hanno frequenza i Gli hapax formano la classe più numerosa: 3270 membri. Le classi di frequenza i > 10 contengono ciascuna fino a un massimo di 40 parole tipo circa parole tipo spettro di frequenze in Pinocchio classi di frequenza riportate in scala logaritmica classe frequenza 18

19 Indici statistici del testo ricchezza lessicale Rapporto tipo-unità (Type Token Ratio o TTR) la ricchezza lessicale come funzione del numero di parole diverse esempio Frammento 1, TTR = 29/33 = 0,87 Distribuzione degli hapax V 0 C V C 1 Square TTR C C Frammento 1 V1 25 hapax C 25/33= 0,75 19

20 Frequenze cumulate Frequenze cumulate di parole unità per ogni classe di frequenza i, f ci è il numero di parole unità che ricorrono da 1 a i volte f i c = V 1+ V V 1 2 i i se dividiamo f ci per C, otteniamo la frequenza relativa cumulata la percentuale di testo coperta dal numero di parole unità corrispondente a f ci 20

21 Frequenze cumulate Frequenze cumulate di parole tipo per ogni classe i, V ci è uguale al numero di parole tipo che appaiono nel testo da 1 a i volte V c = V + V i V 1 2 i se dividiamo V ci per V C, otteniamo la frequenza relativa cumulata di parole tipo la percentuale di vocabolario coperta dal numero di parole tipo corrispondente a V ci 21

22 Frequenze cumulate in Pinocchio Il 90% del vocabolario di Pinocchio copre poco più del 28% della lunghezza complessiva del libro la maggior parte delle parole tipo sono parole rare (riccorrono poche volte nel testo) % 99.20% % 60.91% 28.18% % classe di frequenza percentuale lessico percentuale testo 22

23 Frequenze cumulate Due testi possono presentare fino al 70% di parole unità in comune anche quando i loro rispettivi vocabolari non si sovrappongono per più del 10% bastano poche differenze testuali per far parlare due documenti di cose completamente diverse Due categorie di parole parole grammaticali (congiunzioni, articoli, preposizioni, ecc.) formano il tessuto connettivo grammaticale del testo sempre molto frequenti, indipendentemente dall argomento del testo poco informative lista chiusa e ristretta parole lessicalmente piene (nomi, aggettivi, verbi, ecc.) sono i portatori del vero contenuto informativo meno frequenti e i tipi di parola dipendono dall argomento del testo lista aperta e potenzialmente infinita 23

Linguistica Computazionale. 17 ottobre 2017

Linguistica Computazionale. 17 ottobre 2017 Linguistica Computazionae 17 ottobre 2017 Statistica terminoogia di base Le unità statistiche differiscono per uno o più vaori nee variabii gi studenti hanno diversa provenienza, diversa età, ecc. La rievazione

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia sesta lezione: la dinamica del testo vito

Dettagli

Parole e frequenze. Alessandro Lenci

Parole e frequenze. Alessandro Lenci Parole e frequenze Alessandro Lenci Università di Pisa, Dipartimento di Linguistica Via Santa Maria, 36, 5600 Pisa, Italy alessandro.lenci@ilc.cnr.it Linguaggio e comunicazione - LO042 Rango di una parola

Dettagli

Linguistica Computazionale. 11 ottobre 2016

Linguistica Computazionale. 11 ottobre 2016 Linguistica Computazionae 11 ottobre 2016 I testo ne computer Organizzazione ogica di un testo ettere paroe frasi paragrafi Organizzazione fisica di un testo in formato machine-readabe caratteri sequenze

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La Legge di Zipf 13 ottobre 2014 Distribuzione della frequenza delle parole Rango di una parola (r v ) posizione occupata da una parola in un ordinamento di frequenza discendente

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Esercitazione: indici statistici del testo e misure di associazione Calcolare la lunghezza di un corpus C : Calcolare la lunghezza di un corpus C : output sys.argv[0] sys.argv[1]

Dettagli

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Rappresentazioni Tabellari e Grafiche Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Vocabolario Essenziale Unità Statistica Unità elementare

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia sesta lezione: la dinamica del testo vito

Dettagli

Progetto Patrimonio Linguistico o delle Parole Mancanti

Progetto Patrimonio Linguistico o delle Parole Mancanti Progetto Patrimonio Linguistico o delle Parole Mancanti Relazione tecnica preliminare Parte 2 dott. andrea pammolli statistico dott. giuseppe montefrancesco responsabile U.O. Prevenzione Dipendenze Patologiche

Dettagli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli Dipartimento di Sociologia e Ricerca Sociale Corso di Laurea in Sociologia Insegnamento di Statistica (a.a. 2018-2019) dott.ssa Gaia Bertarelli Esercitazione n. 1 1. Si considerino i seguenti caratteri

Dettagli

La Statistica: introduzione e approfondimenti

La Statistica: introduzione e approfondimenti La Statistica: introduzione e approfondimenti Definizione di statistica Che cosa è la statistica? La statistica è una disciplina scientifica che trae i suoi risultati dalla raccolta, dall elaborazione

Dettagli

Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp)

Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Malvina Nissim malvina.nissim@unibo.it 1 Aprile 2009 1 ssh gollum.sitlec.unibo.it login passwd cqp 1 Cercare e contare 1.1 Contare

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Cernusco S.N., mercoledì 22 febbraio 2017 (9.00/13.00)

Dettagli

Concetti base - Classificazione dei caratteri. Antonello Maruotti

Concetti base - Classificazione dei caratteri. Antonello Maruotti Concetti base - Classificazione dei caratteri Antonello Maruotti Outline 1 Introduzione 2 Concetti base 3 Distribuzioni statistiche La Statistica Una citazione: Giuseppe Leti La mente umana non sa sintetizzare

Dettagli

LA STATISTICA

LA STATISTICA http://www.biostatistica.unich.it LA STATISTICA E l insieme dei metodi che consentono di raccogliere, ordinare, riassumere, presentare ed analizzare dati e informazioni, trarne valide conclusioni e prendere

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

11. Il lessico dei testi

11. Il lessico dei testi Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta

Dettagli

Classificazione dei caratteri

Classificazione dei caratteri Caratteri statistici Osservare i caratteri sulle u.s. significa attribuire a tali u.s. una modalità secondo determinate regole e con certi contenuti u x rappresenta la modalità del carattere X associata

Dettagli

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Lodi, giovedì

Dettagli

Pedagogia sperimentale

Pedagogia sperimentale Pedagogia sperimentale Prof. Giovanni Arduini LEZION E N. 7 A.A. 2015/ 1 6 Solo a partire dalla fine del XVII secolo (Inghilterra) e nel XVIII (Francia), si può iniziare a parlare di Statistica. La Statistica

Dettagli

Classificazione dei caratteri

Classificazione dei caratteri Classificazione dei caratteri Carattere Qualitativo (utabile Statistica): modalità espresse da attributi Genere, Stato civile, Sett. di attività econ., Titolo di studio, Grado militare Carattere Quantitativo

Dettagli

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni. Definizione di STATISTICA: La statistica si può definire come un insieme di metodi scientifici finalizzati alla conoscenza quantitativa e qualitativa dei fenomeni collettivi mediante la raccolta, l'ordinamento,

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia ottava lezione: la dinamica del testo vito

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 2 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia ottava lezione: la dinamica del testo vito

Dettagli

Distribuzioni e rappresentazioni grafiche

Distribuzioni e rappresentazioni grafiche Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Distribuzione unitaria [1/2] Data

Dettagli

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,

Dettagli

Metodologia Statistica

Metodologia Statistica Metodologia Statistica La metodologia statistica viene suddivisa tradizionalmente in due branche, strettamente collegate Statistica descrittiva indicatori statistici per riassumere realtà complesse Statistica

Dettagli

La struttura dei dati

La struttura dei dati La struttura dei dati Carattere Qualitativo 1 (mutabile statistica) Unità statistica Osservazione di uno o più caratteri Collettivo statistico Carattere Quantitativo 2 (variabile statistica) Pagina 14

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Statistica descrittiva in una variabile

Statistica descrittiva in una variabile Statistica descrittiva in una variabile Dott. Nicola Pintus A.a. 2018-2019 Cosa è la statistica? La statistica è la scienza che studia con metodi matematici fenomeni collettivi. La statistica descrittiva

Dettagli

Unità Carattere Modalità

Unità Carattere Modalità Unità Carattere Modalità Unità statistica: unità elementare del collettivo oggetto di studio Carattere: è ogni aspetto del fenomeno oggetto di studio osservabile su un insieme di unità statistiche Modalità:

Dettagli

Classificazione dei caratteri

Classificazione dei caratteri Classificazione dei caratteri Carattere Qualitativo (Mutabile Statistica): modalità espresse da attributi Genere, Stato civile, Sett. di attività econ., Titolo di studio, Grado militare Carattere Quantitativo

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it in Excel in Excel e un evento (soggetto, entita, accadimento, caratteristica) osservato e registrato che si differenzia dall evento stesso,

Dettagli

Lez. 9. Gli spogli lessicali. Parte seconda 02/11/09

Lez. 9. Gli spogli lessicali. Parte seconda 02/11/09 Lez. 9 Gli spogli lessicali Parte seconda 02/11/09 LE CONCORDANZE È l elenco delle parole contenute in un testo, ordinate alfabeticamente e accompagnate da alcuni riferimenti che ne rendono possibile il

Dettagli

CURRICOLO DI ITALIANO CLASSE PRIMA

CURRICOLO DI ITALIANO CLASSE PRIMA CURRICOLO DI ITALIANO CLASSE PRIMA Conoscere l ordine alfabetico; Riconoscere le vocali dal punto di vista grafico e fonico; Riconoscere e isolare le vocali nelle parole che le contengono; Riconoscere

Dettagli

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Campionamento 29/4/2005

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Campionamento 29/4/2005 Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Campionamento 29/4/2005 Importanza del campionamento Trarre conclusioni o fare previsioni limitando l'osservazione solo a un gruppo dei soggetti che

Dettagli

Capitolo 1 La rilevazione dei fenomeni statistici

Capitolo 1 La rilevazione dei fenomeni statistici Capitolo 1 La rilevazione dei fenomeni statistici 2/1 Capitolo 1 Caratteri, unità statistiche e collettivo Classificazione dei caratteri statistici Suddivisione in classi di un carattere quantitativo I

Dettagli

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere

Dettagli

CORSO DI STATISTICA MEDICA Prof. Enzo Ballone

CORSO DI STATISTICA MEDICA Prof. Enzo Ballone CORSO DI STATISTICA MEDICA Prof. Enzo Ballone eballone@unich.it 0871/3554004-4007 www.biostatistica.unich.it Nell analisi statistica si può individuare una: FUNZIONE DESCRITTIVA, in quanto offre il metodo

Dettagli

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano. Università degli Studi di Cassino Corso di Laurea in Economia Aziendale Corso di Statistica Docente: Simona Balzano s.balzano@unicas.it a.a. 2013-14 Statistica = Scienza delle decisioni in condizioni di

Dettagli

Statistica. (Dr. Elvira Di Nardo)

Statistica. (Dr. Elvira Di Nardo) Statistica (Dr. Elvira Di Nardo) 80 ore = 10 crediti Orario: lun, mar,mer 9.30-11.30 Sede: AULA MAGNA (ex Fac. SMFN) Ricevimento: mer. 11.30-13.30 Esame: prova scritta (+ eventuale prova orale) Materiale

Dettagli

ESERCITAZIONI N. 1 Corso di Statistica

ESERCITAZIONI N. 1 Corso di Statistica ESERCITAZIONI N. 1Corso di Statistica p. 1/33 ESERCITAZIONI N. 1 Corso di Statistica Marco Picone Università Roma Tre ESERCITAZIONI N. 1Corso di Statistica p. 2/33 Introduzione sito: http://scienzepolitiche.uniroma3.it/flagona/

Dettagli

Statistica Descrittiva - Lezione 1

Statistica Descrittiva - Lezione 1 Statistica Descrittiva - Lezione 1 Gianluca Bande Università degli Studi di Cagliari December 13, 2007 G. Bande (Univ. Cagliari) Statistica Descrittiva December 13, 2007 1 / 23 Statistica descrittiva La

Dettagli

Matematica per psicologi

Matematica per psicologi Matematica per psicologi Docente: prof. Gabriella Caristi, E-mail: caristi@units.it http://www.dsm.univ.trieste.it/~caristi Tel.: 040 558 2605 Testo: Statistical methods for the social sciences, A. Agresti-B.

Dettagli

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti Laurea in Scienze dell Educazione Insegnamento di Pedagogia Sperimentale (Prof. Paolo Frignani) Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti giorgio.poletti@unife.it) Cos è la Statistica caratterizzato

Dettagli

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE IL TEST DEL CHI 2 (2) Consente di verificare ipotesi su: a) relazioni tra variabili nella popolazione b) differenze tra popolazioni relative a: distribuzioni di frequenza Livello di misura dei dati: scala

Dettagli

1 Modulo operativo: Le abilità linguistiche: ascoltare. 2 Modulo operativo: Le abilità linguistiche: parlare

1 Modulo operativo: Le abilità linguistiche: ascoltare. 2 Modulo operativo: Le abilità linguistiche: parlare 1 Modulo operativo: Le abilità linguistiche: ascoltare 2 Modulo operativo: Le abilità linguistiche: parlare 3 Modulo operativo: Le abilità linguistiche: leggere 4 Modulo operativo: Le abilità linguistiche:

Dettagli

Unità Carattere Modalità

Unità Carattere Modalità Unità Carattere Modalità Unità statistica: unità elementare del collettivo oggetto di studio Carattere: è ogni aspetto del fenomeno oggetto di studio osservabile su un insieme di unità statistiche Modalità:

Dettagli

PROGETTAZIONE DISCIPLINARE. LINGUA ITALIANA classe 5^

PROGETTAZIONE DISCIPLINARE. LINGUA ITALIANA classe 5^ PROGETTAZIONE DISCIPLINARE LINGUA ITALIANA classe 5^ PER ASCOLTARE, COMPRENDERE E COMUNICARE ORALMENTE 1a) Intuizione del significato globale di un messaggio orale ( serie di parole, comunicazioni brevi,

Dettagli

Dott.ssa Marta Di Nicola

Dott.ssa Marta Di Nicola Perché la Statistica Medica è necessaria? - per leggere, comprendere ed analizzare criticamente relazioni e documenti scientifici; -per avere la possibilità di effettuare in proprio ricerche che comportino

Dettagli

RILEVAZIONI STATISTICHE

RILEVAZIONI STATISTICHE RILEVAZIONI STATISTICHE Per poter entrare nel merito dell argomento occorre, in primo luogo, riportare alcune definizioni dei termini statistici maggiormente utilizzati nel seguito, molti dei quali coincidono

Dettagli

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005 Dipartimento di Fisica a.a. 23/24 Fisica Medica 2 Indici statistici 22/4/25 Ricerca statistica La ricerca può essere deduttiva (data una legge teorica nota cerco verifica tramite più misure) ovvero induttiva

Dettagli

ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO

ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO via XXV Aprile,52 VALSAMOGGIA 40050 loc. Castello di Serravalle (BO) C.F:91171010373 - Tel. 051 670 48 24 Sito internet www.icccastellodiserravalle.gov.it

Dettagli

Definizioni preliminari:

Definizioni preliminari: VII ANALISI DEL CONTENUTO: UNA TIPOLOGIA AIP / VII - AdC 1 tipo 1 Definizioni preliminari: significante = il piano dell espressione; è complementare al significato (= contenuto). Entrambi, congiunti, compongono

Dettagli

Stefania Taralli Anno Accademico 2017/2018 1

Stefania Taralli Anno Accademico 2017/2018 1 L unità statistica Caratteri e modalità CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Introduzione al corso Lezione 2: L'analisi quantitativa dei dati per la sintesi dei fenomeni

Dettagli

Misurazione dei caratteri quantitativi

Misurazione dei caratteri quantitativi isurazione dei caratteri quantitativi Caratteri quantitativi: esiste un unità di misura delle modalità numeriche Variabile a scala di intervalli non esiste uno zero assoluto, naturale e non arbitrario

Dettagli

Distribuzione di frequenza relativa e percentuale: esempio

Distribuzione di frequenza relativa e percentuale: esempio Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:

Dettagli

Gli strumenti statistici

Gli strumenti statistici Lez. 9 Gli strumenti statistici I metodi di elaborazione statistica e il calcolo dello stile /parte prima 21/03/13 John McHardy Sinclair 1933 2007 Professore di lingua inglese moderna presso la università

Dettagli

Introduzione alla statistica descrittiva

Introduzione alla statistica descrittiva Dipartimento di Statistica Regione Toscana Comune di Firenze Progetto di diffusione della cultura Statistica Introduzione alla statistica descrittiva Carla Rampichini Dipartimento di Statistica G. Parenti

Dettagli

LE CONCORDANZE. Gli spogli lessicali CONCORDANZE - 2. I caratteri jolly. Il formato KWIC 27/03/14. Parte seconda

LE CONCORDANZE. Gli spogli lessicali CONCORDANZE - 2. I caratteri jolly. Il formato KWIC 27/03/14. Parte seconda Lez. 8 Gli spogli lessicali Parte seconda 19/03/14 LE CONCORDANZE È l elenco delle parole contenute in un testo, ordinate alfabeticamente e accompagnate da alcuni riferimenti che ne rendono possibile il

Dettagli

Concordanze e collocazioni. Analisi del testo letterario 1 Isabella Chiari

Concordanze e collocazioni. Analisi del testo letterario 1 Isabella Chiari Concordanze e collocazioni Analisi del testo letterario 1 Isabella Chiari 1 Analisi degli usi con le concordanze Il cotesto estrazione di informazioni linguistiche essenziali sugli usi della parola individuazione

Dettagli

-Validità di un test diagnostico: Sensibilità e Specificità

-Validità di un test diagnostico: Sensibilità e Specificità SLIDES DEL CORSO DI STATISTICA Prof. R. Di Mascio Programma svolto a.a. 2005/06 - Il metodo statistico - Dati e informazioni di tipo statistico - Archiviazione dei dati - Sintesi dei dati in tabelle -

Dettagli

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine 10/1 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

Statistica. Lezioni: 3, 4. Statistica Descrittiva Univariata 2

Statistica. Lezioni: 3, 4. Statistica Descrittiva Univariata 2 Corsi di Laurea: a.a. 2018-19 Diritto per le Imprese e le istituzioni Sienze Internazionali dello Sviluppo e della Cooperazione Statistica Statistica Descrittiva Univariata 2 Lezioni: 3, 4 Contenuti La

Dettagli

Statistica. Lezione 1

Statistica. Lezione 1 Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 1 a.a 2011-2012 Dott.ssa Daniela

Dettagli

Criteri per la validazione dei termini dell estrazione automatica. (Versione 2) Elisa Bianchi

Criteri per la validazione dei termini dell estrazione automatica. (Versione 2) Elisa Bianchi 15 novembre 2010 Criteri per la validazione dei termini dell estrazione automatica 1. Obiettivo (Versione 2) Elisa Bianchi Con "validazione" si intende il lavoro di selezione e valutazione delle liste

Dettagli

Corso di laurea in Comunicazione pubblica e d'impresa. Docente: Mariangela Zenga Ricevimento: mercoledì

Corso di laurea in Comunicazione pubblica e d'impresa. Docente: Mariangela Zenga   Ricevimento: mercoledì Corso di laurea in Comunicazione pubblica e d'impresa Docente: Mariangela Zenga Email: mariangela.zenga@unimib.it Ricevimento: mercoledì 10.30-12.30 Organizzazione corso Lezioni Mercoledì ore 12.30-14.30

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Lezione 1. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 1. A. Iodice.

Lezione 1. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 1. A. Iodice. Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 29 Comunicazioni di servizio Indirizzi utili indirizzo web di riferimento: http://www.docente.unicas.it/alfonso_iodicedenza

Dettagli

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli Esercizio 1 Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di amici. La seguente

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno a.a. 2007-2008 Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno Dott.ssa Daniela Alessi daniela.alessi@med.unipmn.it 1 Argomenti:

Dettagli

LA MISURA IN PSICOLOGIA

LA MISURA IN PSICOLOGIA Per conoscere la posizione che un valore occupa all interno di una distribuzione di frequenza si utilizzano VENGONO DETTI QUANTILI Questi indicatori richiedono che sia possibile operare su una distribuzione

Dettagli

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 39 Outline 1 2 3 4 5 6 7 8 () Statistica 2 / 39 La distribuzione unitaria semplice di un carattere

Dettagli

Concetti Introduttivi Lezione 1

Concetti Introduttivi Lezione 1 Last updated April 19, 2016 Concetti Introduttivi Lezione 1 G. Bacaro II anno, II semestre 1 Concetti Introduttivi La statistica è una disciplina che ha come fne lo studio quanttatvo e qualitatvo di un

Dettagli

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Statistica Descrittiva La Variabilità V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 5 Ottobre 2009 Pier Francesco

Dettagli

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi Statistica La Statistica è una metodologia per l analisi quantitativa dei fenomeni collettivi, cioè fenomeni il cui studio richiede l osservazione di un insieme di manifestazioni individuali Analizzare

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione

Campionamento La statistica media campionaria e la sua distribuzione Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

Suggerimento a proposito di decimali

Suggerimento a proposito di decimali Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 017-018 Suggerimento a proposito di decimali Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi: DIAGNOSTICA PSICOLOGICA lezione! Paola Magnano paola.magnano@unikore.it si basano su tre elementi: le scale di misura sistema empirico: un insieme di entità non numeriche (es. insieme di persone; insieme

Dettagli

Prof.ssa M. Di Nicola

Prof.ssa M. Di Nicola http://www.biostatistica.unich.it Perché la Statistica Medica è necessaria? - per leggere, comprendere ed analizzare criticamente relazioni e documenti scientifici; - per avere la possibilità di effettuare

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 018-019 Indici Medi Sintesi della distribuzione: gli indici medi Le distribuzioni delle variabili possono essere sintetizzate

Dettagli

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA Misure di posizione INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA 1 MODA E la scelta fatta dalla maggioranza della popolazione, lo stile che tutti seguono in

Dettagli

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della

Dettagli

Statistica: la scienza dei dati. Prof. Stefano Bonnini

Statistica: la scienza dei dati. Prof. Stefano Bonnini Statistica: la scienza dei dati Prof. Stefano Bonnini COSA E LA STATISTICA?? La statistica è un insieme di metodologie e tecniche finalizzate alla: RILEVAZIONE, ELABORAZIONE, PRESENTAZIONE e INTERPRETAZIONE

Dettagli

NOZIONE DI VARIABILE. Varie accezioni

NOZIONE DI VARIABILE. Varie accezioni NOZIONE DI VARIABILE Varie accezioni - espediente fisico mediante il quale si rileva e si registra lo stato o modalità secondo il/la quale una determinata proprietà (grandezza o attributo) si presenta

Dettagli

PROGETTAZIONE DISCIPLINARE

PROGETTAZIONE DISCIPLINARE PROGETTAZIONE DISCIPLINARE ITALIANO classe 4^ PER ASCOLTARE, COMPRENDERE E COMUNICARE ORALMENTE 1a) Ascolto del contenuto di una conversazione o di un testo letto. 1b) Intuizione in un messaggio orale

Dettagli

PROGETTARE E CONDURRE UN INDAGINE STATISTICA. Qualche richiamo per cominciare

PROGETTARE E CONDURRE UN INDAGINE STATISTICA. Qualche richiamo per cominciare PROGETTARE E CONDURRE UN INDAGINE STATISTICA Qualche richiamo per cominciare 1 COSA È LA STATISTICA NEL LINGUAGGIO COMUNE? In senso più ampio In senso più ristretto raccolta di dati finalizzata a dare

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

APPUNTI DI STATISTICA

APPUNTI DI STATISTICA APPUNTI DI STATISTICA Diana Giacobbi 4 dicembre 01 DEFINIZIONE LA STATISTICA è la scienza che studia i fenomeni collettivi e di massa attraverso la raccolta e l analisi di dati. Viene utilizzata dai governi

Dettagli

Statistica e informatica

Statistica e informatica Statistica e informatica Statistica descrittiva Francesco Pauli & Nicola Torelli a.a. 2017/2018 Francesco Pauli & Nicola Torelli Descrittiva 1 / 1 Indice Francesco Pauli & Nicola Torelli Descrittiva 2

Dettagli

Lo spazio lessicale della poesia antico inglese

Lo spazio lessicale della poesia antico inglese Lo spazio lessicale della poesia antico inglese Giuseppe Brunetti Abbreviazioni testi and = Andreas beo = Beowulf best = Bestiary dream = Dream of the Rood eleg = Elegies elen = Elene gena = Genesis A

Dettagli

Psicometria con Laboratorio di SPSS 1

Psicometria con Laboratorio di SPSS 1 Psicometria con Laboratorio di SPSS 1 1-Panoramica delle tecniche: Spiegazione intuitiva vers. 1.1 (vers. 1.1, 14 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli