Linguistica Computazionale. 18 ottobre 2016

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Linguistica Computazionale. 18 ottobre 2016"

Transcript

1 Linguistica Computazionae 18 ottobre 2016

2 Intepretare a Legge di Zipf Secondo Zipf a distribuzione dee paroe nei testi rifette un principio di economia nea comunicazione parante e ascotatore cercano entrambi di minimizzare i oro sforzi o sforzo de parante è ridotto avendo un piccoo vocaboario di paroe moto comuni (= frequenti) o sforzo de ascotatore è ridotto avendo un grande vocaboario di paroe più rare (e meno ambigue) a Legge di Zipf rappresenterebbe i compromesso migiore (= più economico) tra queste due opposte tendenze 2

3 La Legge di Zips e conseguenze per a inguistica computazionae Ci sono sempre poche paroe moto frequenti corrispondono soitamente a paroe appartenenti a cassi chiuse (articoi, preposizioni, congiunzioni, ecc.) Ci sono sempre motissime paroe a bassa frequenza e hapax (LNRE, Large Number of Rare Events) sono paroe piene (nomi, verbi, ecc.), soitamente estremamente informative su contenuto di un documento i vocaboario è aperto nuovi temi e concetti portano a introdurre nuove paroe produttività essicae nuovi termini derivati morfoogici, ecc. I dati inguistici sono rari (data sparseness) 3

4 La dinamica de vocaboario Studiamo andamento dea crescita essicae a aumentare de testo come aumenta V C a aumentare di C I testo come fusso di paroe I testo può essere visto come una sequenza v 1, v 2,,v i, v C di paroe indicizzate per posizione i può essere interpretato come associato a un dato istante temporae, v i è a paroa che troviamo eggendo sequenziamente i testo a istante i V C(i) è i vocaboario dee prime i paroe di C (i C ) V C(i) è a grandezza de vocaboario usato nee prime i paroe de testo fornisce i tasso di crescita de vocaboario a aumentare de corpus 4

5 La dinamica de vocaboario 7000 V C (i) grandezza vocaboario y = x La crescita de vocaboario in PInocchio unghezza testo con punteggiatura senza punteggiatura Potenza (con punteggiatura) numero di hapax La crescita degi hapax in Pinocchio media hapax hapax osservati 5

6 La dinamica de vocaboario Forte correazione tra aumento dea unghezza de corpus e aumento de vocaboario I vocaboario V C di un corpus cresce in maniera non ineare rispetto a C V C(i) non cresce sempre, poiché esistono paroe che devono ripetersi più o meno regoarmente paroe grammaticai, principi di coerenza essicae andamento narrativo, ecc. a curva di V C(i) non ha mai un asintoto orizzontae i vocaboario non smette mai di crescere aumenta sempre più entamente rispetto a crescere dee dimensioni 6 de corpus

7 Indicatori di tendenza centrae Media aritmetica Mediana x x1 + x x n n i = = = 1 a modaità di un osservazione che divide a distribuzione in due parti uguai me(x) = n +1 2 La media è un indicatore moto sensibie ai vaori estremi 1,2,3,4,5 --> media = 3; mediana =3 1,2,3,4,70 --> media = 16; mediana =3 n n x i 7

8 Indicatori di dispersione Deviazione standard (σ, scarto quadratico medio) indice statistico di dispersione che misura a variabiità dei dati di una distribuzione (quanto i singoi dati differiscono rispetto aa media) σ 2 è a varianza dea variabie σ n i = = 1 media ( x i n x) 2 scarti scarti 8

9 Distribuzione normae vaori frequenza freq. reativa % Misurazione de atezza di un campione di 27 soggetti media = 1.68 mediana = 1.68

10 Distribuzione normae istogramma dea distribuzione de atezza dei soggetti

11 Distribuzione normae (Gaussiana) Famigia di distribuzioni dee frequenze reative (probabiità) dei vaori di una variabie (continua) x = vaori dea variabie y = frequenza reativa (probabiità) di ciascun vaore 11

12 Distribuzioni statistiche distribuzione normae (Gaussiana) Distribuzioni simmetriche rispetto aa media e con forma a campana ha i massimo in corrispondenza dea media i vaori dea distribuzione si addensano intorno a vaor medio ogni distribuzione è competamente definita da due parametri: media e σ σ = definisce ampiezza dea campana area sottesa daa curva è uguae a 1 Pochi vaori estremi : a maggior parte dei vaori tende a raggrupparsi intorno a vaor medio 68% dei vaori dea variabie cade ne intervao µ±σ 95% dei vaori dea variabie cade ne intervao µ±2σ 99,7% dei vaori dea variabie cade ne intervao µ±3σ 12

13 Distribuzioni statistiche distribuzione normae (Gaussiana) Distribuzione tipica di moti variabii reative a fenomeni naturai e comportamentai (es. peso, atezza, ecc.) e sociai i vaori si concentrano intorno aa media, mentre i vaori estremi sono estremamente improbabii gi errori di misura (errori accidentai) si distribuiscono normamente distribuzione normae degi errori di misura 0,15 0,12 0,09 0,06 0,03 n=40 0,15 0,12 0,09 0,06 0,03 n=160 0,15 0,12 0,09 0,06 0,03 n=

14 Distribuzioni di paroe a frequenza media Frequenza media dee paroe in C _ f ( C ) = C V C deriva daa definizione di media aritmetica sommiamo a frequenza dee paroe tipo e a dividiamo per i numero di paroe tipo _ f = f v 1 + f v n f v n = C V C indicatore inverso di ricchezza essicae 14

15 Distribuzioni di paroe a frequenza media L andamento tendenziae dea frequenza media a crescere dei campioni di testo è queo di una funzione non decrescente: _ f ( k) _ f ( k + 1) si possono registrare temporanee inversioni di tendenza, se si registra un aumento de ritmo di crescita de vocaboario segno di discontinuità ne contenuto de testo densità rapporto tra i numero di paroe nuove introdotte in ciascun capitoo e a unghezza de capitoo densità frequenza media ,1 0, unghezza testo Crescita dea frequenza media in PInocchio 15

16 Distribuzioni di paroe acune concusioni La frequenza media di paroa non è un vaore convergente a frequenza media di paroa tende ad avere un andamento strettamente crescente (a differenza di quanto accade per a media di atre variabii) vari indicatori statistici (es. media, frequenze reative) sono sensibii aa grandezza de corpus a frequenza media di paroa in un corpus (comunque grande) non può essere usato per stimare a frequenza media reae Le frequenze degi eventi inguistici hanno una distribuzione zipfiana gran numero di paroe rare (Large Number of Rare Events) i numero dee paroe tipo continua a crescere con aumentare de corpus non finiamo mai di esporare i vocaboario de inguaggio In tutti i corpora ci sono mote paroe non viste, ovvero che rimangono fuori da campione 16

17 Probabiità e cognizione The argument for a probabiistic approach to cognition is that we ive in a word fied with uncertainty and incompete information. To be abe to interact successfuy with the word, we need to be abe to dea with this type of information. Manning & Schütze (1999), Foundations of Statistica Natura Language Processing, MIT Press: 15 Esempio sto partendo per un viaggio e devo decidere se mettere in vaigia un ombreo oppure no Per prendere questa decisione devo stimare a probabiità che piova, integrando diversi tipi di informazione sue condizioni atmosferiche temperatura, stagione, meta de viaggio, previsioni de tempo a destinazione, ecc. se è autunno, è probabie che piova (perché spesso piove in autunno) se è agosto e vado in Tunisia è moto poco probabie che piova (perché è raro che in agosto piova in Tunisia) se è agosto e vado in Scozia, è moto probabie che piova (perché e piogge in 17 estate in Scozia sono frequenti)

18 Probabiità e inguaggio The cognitive processes used for anguage are identica or at east very simiar to those used for processing other forms of sensory input and other forms of knowedge. These processes are best formaized as probabiistic processes or at east by means of some quantitative framework that can hande uncertainty and incompete information. Manning & Schütze (1999), Foundations of Statistica Natura Language Processing, MIT Press: 15 Esempio decidere come segmentare una sequenza di suoni in paroe discrete amacchinaeraparcheggiatadavantiaaporta stimare a probabiità che tra due suoni esista un confine di paroa decidere a categoria di morfosintattica (part of speech) di una paroa a macchina a aspettava davanti aa porta stimare a probabiità che a sia un articoo o un pronome citico decidere come tradurre un espressione inguistica L aquia ha perso una penna voando 18 stimare a probabiità che penna si traduca pen o feather in ingese

Linguistica Computazionale. 24 ottobre 2017

Linguistica Computazionale. 24 ottobre 2017 Linguistica Computazionae 24 ottobre 2017 I Teorema de Limite Centrae Data una variabie x e una popoazione P in cui x ha media μ x e deviazione standard σ x - indipendentemente daa distribuzione di x nea

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La Legge di Zipf 13 ottobre 2014 Distribuzione della frequenza delle parole Rango di una parola (r v ) posizione occupata da una parola in un ordinamento di frequenza discendente

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Linguaggio e probabilità 14 ottobre 2014 Probabilità e cognizione The argument for a probabilistic approach to cognition is that we live in a world filled with uncertainty and

Dettagli

Linguistica Computazionale. 12 ottobre 2016

Linguistica Computazionale. 12 ottobre 2016 Linguistica Computazionae 12 ottobre 2016 Anaisi statistica con a she di Linux Input: fie tokenizzato, un token per riga Frequenza dee paroe sort input_fie uniq c 2 Anaisi statistica con a she di Linux

Dettagli

Parole e frequenze. Alessandro Lenci

Parole e frequenze. Alessandro Lenci Parole e frequenze Alessandro Lenci Università di Pisa, Dipartimento di Linguistica Via Santa Maria, 36, 5600 Pisa, Italy alessandro.lenci@ilc.cnr.it Linguaggio e comunicazione - LO042 Rango di una parola

Dettagli

Linguistica Computazionale. 17 ottobre 2017

Linguistica Computazionale. 17 ottobre 2017 Linguistica Computazionae 17 ottobre 2017 Statistica terminoogia di base Le unità statistiche differiscono per uno o più vaori nee variabii gi studenti hanno diversa provenienza, diversa età, ecc. La rievazione

Dettagli

Linguistica Computazionale. 19 ottobre 2016

Linguistica Computazionale. 19 ottobre 2016 Linguistica Computazionae 19 ottobre 2016 Probabiità e inguaggio Per stimare queste probabiità inguistiche devo integrare informazioni su modo in cui si distribuiscono e strutture de inguaggio decidere

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionae 14 novembre 2017 Incertezza e informazione Le probabiità servono per modeare fenomeni e sistemi i cui esito è incerto (fenomeni aeatori) L entropia è una misura de incertezza

Dettagli

Introduzione alla fisica. Grandezze fisiche Misura ed errori di misura. Unità di misura

Introduzione alla fisica. Grandezze fisiche Misura ed errori di misura. Unità di misura Introduzione aa fisica Grandezze fisiche Misura ed errori di misura. Unità di misura La fisica come scienza sperimentae Studio di un fenomeno OSSERVAZIONI SPERIMENTALI MISURA DI GRANDEZZE FISICHE IPOTESI

Dettagli

Linguistica Computazionale. 30 novembre 2016

Linguistica Computazionale. 30 novembre 2016 Linguistica Computazionae 30 novembre 2016 Part-of-Speech Tagging Feature utiizzate: feature ocai: forma, unghezza de token, presenza di punteggiatura a interno de token (es. Acronimi C.N.R.), prefisso,

Dettagli

Obiettivi dell unità didattica

Obiettivi dell unità didattica Indici di posizione Corso di STATISTICA Prof. Roberta Siciiano Ordinario di Statistica, Università di apoi Federico II Professore suppente, Università dea Basiicata a.a. 2011/2012 Prof. Roberta Siciiano

Dettagli

Linguistica Computazionale. 11 ottobre 2016

Linguistica Computazionale. 11 ottobre 2016 Linguistica Computazionae 11 ottobre 2016 I testo ne computer Organizzazione ogica di un testo ettere paroe frasi paragrafi Organizzazione fisica di un testo in formato machine-readabe caratteri sequenze

Dettagli

Linguistica Computazionale. 25 ottobre 2016

Linguistica Computazionale. 25 ottobre 2016 Linguistica Computazionae 25 ottobre 2016 Probabiità congiunte sequenze di paroe Esperimento estrarre 2 paroe consecutive da un testo bigramma = sequenza di 2 paroe n-gramma = sequenza di n paroe Qua è

Dettagli

Esercitazione 7 del corso di Statistica 2

Esercitazione 7 del corso di Statistica 2 Esercitazione 7 de corso di Statistica Dott.ssa Paoa Costantini 0 Marzo 009 Esercizio a distribuzione dei pesi dei pesi pacchetti per confezionare per confezionare e caramee, in grammi, prodotti da un

Dettagli

La statistica descrittiva

La statistica descrittiva MATEMATICAperTUTTI Dee seguenti indagine statistiche individua a popoazione, i carattere oggetto di studio e e possibii modaità di tae carattere. 1 ESERCIZIO SVOLTO Indagine: utiizzo de tempo ibero da

Dettagli

Esercitazione 7 del corso di Statistica 2

Esercitazione 7 del corso di Statistica 2 Esercitazione 7 de corso di Statistica Prof. Domenico Vistocco Dott.ssa Paoa Costantini 9 Giugno 008 Esercizio La distribuzione dei pesi dei pesi pacchetti per confezionare per confezionare e caramee,

Dettagli

Rappresentazione e codifica dell informazione

Rappresentazione e codifica dell informazione Rappresentazione e codifica de informazione Premessa I cacoatore è una macchina digitae - I suo inguaggio è composto da due soi simboi Gi esseri umani sono abituati a comunicare utizzando più simboi Come

Dettagli

Rappresentazione e codifica dell informazione

Rappresentazione e codifica dell informazione Rappresentazione e codifica de informazione Premessa I cacoatore è una macchina digitae - I suo inguaggio è composto da due soi simboi Gi esseri umani sono abituati a comunicare utizzando più simboi Come

Dettagli

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia sesta lezione: la dinamica del testo vito

Dettagli

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2 p. 1/1 INFORMAZIONI Prossime lezioni Giorno Ora Dove 10/02 14:30 P50 11/02 14:30 Laboratorio (via Loredan) 17/02 14:30 P50 23/02 14:30 P50 25/02 14:30 Aula informatica (6-7 gruppi) 02/03 14:30 P50 04/03

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia ottava lezione: la dinamica del testo vito

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati 1 CONCETTI DI BASE DI STATISTICA ELEMENTARE 2 Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Per la presenza di errori casuali,

Dettagli

( ) ( ) ESEMPI. lim. Attribuendo ad x dei valori minori di x 0 (ad es. 0,999,...,0,5) si nota che la

( ) ( ) ESEMPI. lim. Attribuendo ad x dei valori minori di x 0 (ad es. 0,999,...,0,5) si nota che la . Limiti di una funzione LIMITI DI UNA FUNZIONE Per ottenere un informazione competa su di una funzione occorrerebbe cacoare tutti i vaori dea funzione per ogni vaore di, ma ciò è impossibie perché tai

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia ottava lezione: la dinamica del testo vito

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionae 6 dicembre 2017 Agoritmo di Apprendimento Supervisionato: anaisi 2) Fase di anaisi: Modeo dea Lingua Testo non annotato features extractor Agoritmo basato su ML Anaisi Funzione

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi

Dettagli

IL PENDOLO REVERSIBILE DI KATER

IL PENDOLO REVERSIBILE DI KATER IL PENDOLO REVERSIBILE DI KATER I periodo dee osciazioni de pendoo sempice è dato daa formua: T 0 = π g Questa reazione è vaida per e piccoe osciazioni, quando, cioè, si può assimiare i seno de'angoo massimo

Dettagli

Lezione 4 a - Misure di dispersione o di variabilità

Lezione 4 a - Misure di dispersione o di variabilità Lezione 4 a - Misure di dispersione o di variabilità Abbiamo visto che la media è una misura della localizzazione centrale della distribuzione (il centro di gravità). Popolazioni con la stessa media possono

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Statistica descrittiva in una variabile

Statistica descrittiva in una variabile Statistica descrittiva in una variabile Dott. Nicola Pintus A.a. 2018-2019 Cosa è la statistica? La statistica è la scienza che studia con metodi matematici fenomeni collettivi. La statistica descrittiva

Dettagli

BIN = 15 um l [um] Minimum um. Data_31misure_ l [um] Maximum Points 102, , um 1.3 um

BIN = 15 um l [um] Minimum um. Data_31misure_ l [um] Maximum Points 102, , um 1.3 um 1 2 Data_31misure_070318 BIN = 15 um Minimum 80 Maximum Sum 120 3176,7 Points Mean Median 31 102,47419 102,9 102.5 um RMS Std Deviation Variance Std Error 102,7225 7,2559846 52,649312 1,3032133 7.3 um

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia sesta lezione: la dinamica del testo vito

Dettagli

Probabilità e statistica

Probabilità e statistica Probabilità e statistica The formulation of a problem is often more essential than its solution which may be merely a matter of mathematical or experimental skill. Albert Einstein Farsi la domanda giusta

Dettagli

Due incognite ipertstatiche con cedimento elastico lineare sul vincolo

Due incognite ipertstatiche con cedimento elastico lineare sul vincolo Dott. Ing aoo Serafini Cic per tutti gi appunti (AUTOAZIONE TRATTAENTI TERICI ACCIAIO SCIENZA dee COSTRUZIONI ) e-mai per suggerimenti Due incognite ipertstatiche con cedimento eastico ineare su vincoo

Dettagli

Tipi di variabili. Indici di tendenza centrale e di dispersione

Tipi di variabili. Indici di tendenza centrale e di dispersione Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)

Dettagli

Sfruttando le considerazioni appena fatte come misureresti il coefficiente di attrito statico μ s?

Sfruttando le considerazioni appena fatte come misureresti il coefficiente di attrito statico μ s? MISURA DEL COEFFICIENTE DI ATTRITO STATICO Materiae occorrente: piano incinato monete Nota a unghezza de piano, qua è a reazione che sussiste fra i coefficiente di attrito statico μ s e a configurazione

Dettagli

FUNZIONE DI TRASFERIMENTO ASSOCIATA A UN CODICE CONVOLUZIONALE

FUNZIONE DI TRASFERIMENTO ASSOCIATA A UN CODICE CONVOLUZIONALE FUNZIONE DI TRASFERIMENTO ASSOCIATA A UN CODICE CONVOLUZIONALE La funzione di trasferimento de codice convouzionae fornisce tutte e informazioni riguardo i pesi dei cammini che si dipartono da S 0 e riconfuiscono

Dettagli

Distribuzione Normale

Distribuzione Normale Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di

Dettagli

La statistica. Scienza che studia con metodi matematici fenomeni collettivi.

La statistica. Scienza che studia con metodi matematici fenomeni collettivi. La statistica Scienza che studia con metodi matematici fenomeni collettivi. I dati statistici Popolazione, carattere e frequenza Popolazione: insieme di elementi su cui si effettua l indagine statistica.

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

La Distribuzione Normale (Curva di Gauss)

La Distribuzione Normale (Curva di Gauss) 1 DISTRIBUZIONE DI GAUSS o DISTRIBUZIONE NORMALE 1. E la più importante distribuzione statistica continua e trova numerose applicazioni nello studio dei fenomeni biologici. 2. Fu proposta da Gauss (1809)

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità CORSO DI LAUREA IN INFERMIERISTICA LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità Lezioni di Statistica VARIABILITA Si definisce variabilità la proprietà di alcuni fenomeni di assumere

Dettagli

Linguistica Computazionale. 22 novembre 2016

Linguistica Computazionale. 22 novembre 2016 Linguistica Computazionae 22 novembre 2016 Tecnoogie de inguaggio Sistemi in grado di accedere a contenuto di informazione attraverso eaborazione automatica de inguaggio (Natura Language Processing, Trattamento

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

Distribuzione normale

Distribuzione normale Distribuzione normale istogramma delle frequenze di un insieme di misure relative a una grandezza che varia con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata

Dettagli

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

RICHIAMI DI CALCOLO DELLE PROBABILITÀ UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due

Dettagli

Linguistica Computazionale. 27 settembre 2016

Linguistica Computazionale. 27 settembre 2016 Linguistica Computazionae 27 settembre 2016 Obiettivi de corso Introduzione ai principai metodi di inguistica computazionae e di Natura Language Processing (NLP) Docenti Aessandro Lenci (Dip. di Fioogia,

Dettagli

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo Significato probabilistico di σ: su 1 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo x σ, x + σ e 99.7 nell intervallo x 3 σ, x + 3 Se si considerano campioni

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

Esplorazione dei dati

Esplorazione dei dati Esplorazione dei dati Introduzione L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione

Dettagli

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità Punti deboli della media aritmetica Robustezza: sensibilità ai valori estremi Non rappresentava nei confronti di distribuzioni asimmetriche. La media aritmetica è un valore rappresentativo nei confronti

Dettagli

Breve ripasso di statistica

Breve ripasso di statistica Breve ripasso di statistica D.C. Harris, Elementi di chimica analitica, Zanichelli, 1999 Capitolo 4 1 Il protocollo analitico Campionamento: 1. estrazione del campione dal lotto 2. conservazione e trasporto

Dettagli

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri; Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

Nicola De Rosa, Liceo scientifico sperimentale sessione straordinaria 2012, matematicamente.it

Nicola De Rosa, Liceo scientifico sperimentale sessione straordinaria 2012, matematicamente.it Nicoa De Rosa Liceo scientiico sperimentae sessione straordinaria matematicamente.it PROBLEMA La sezione trasversae di un canae di imgazione ha a orma di un trapezio isoscee con a base maggiore in ato.

Dettagli

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Capitolo 3 Sintesi e descrizione dei dati quantitativi Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

Linguistica Computazionale. 7 novembre 2017

Linguistica Computazionale. 7 novembre 2017 Linguistica Computazionae 7 novembre 2017 Modei di Markov in inguistica I modei a n-grammi sono usati per i risovere i probema de word prediction data una sequenza di paroe w 1,,w n-1, qua è a paroa seguente

Dettagli

I 5 principi dell estimo

I 5 principi dell estimo La stima del valore di mercato Prof. Arch. ALESSIO D AURIA, PhD DIPARTIMENTO DI CONSERVAZIONE DEI BENI ARCHITETTONICI E AMBIENTALI aldauria@unina.it I 5 principi dell estimo 1. Il valore dipende dallo

Dettagli

Variabile casuale Normale

Variabile casuale Normale Variabile casuale Normale La var. casuale Normale (o Gaussiana) è considerata la più importante distribuzione Statistica per le innumerevoli Applicazioni e per le rilevanti proprietà di cui gode L'importanza

Dettagli

Nozioni di statistica

Nozioni di statistica Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere

Dettagli

Amministrazione Provinciale di Siena - Ufficio di Piano per il PTCP ALLEGATO 3

Amministrazione Provinciale di Siena - Ufficio di Piano per il PTCP ALLEGATO 3 ALLEGATO 3 DISCIPLINA TECNICA DA UTILIZZARE COME STANDARD PROVINCIALE PER LA STIMA DELLE PORTATE AL COLMO, PER LA DEFINIZIONE DELLA PORTATA SMALTIBILE, PER LA DISCIPLINA DELLE DISTANZE DI SICUREZZA DAGLI

Dettagli

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Statistica Descrittiva La Variabilità V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 5 Ottobre 2009 Pier Francesco

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

LA DISTRIBUZIONE NORMALE o DI GAUSS

LA DISTRIBUZIONE NORMALE o DI GAUSS p. 1/2 LA DISTRIBUZIONE NORMALE o DI GAUSS Osservando gli istogrammi delle misure e degli scarti, nel caso di osservazioni ripetute in identiche condizioni Gli istogrammi sono campanulari e simmetrici,

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

PROBABILITA. Distribuzione di probabilità

PROBABILITA. Distribuzione di probabilità DISTRIBUZIONI di PROBABILITA Distribuzione di probabilità Si definisce distribuzione di probabilità il valore delle probabilità associate a tutti gli eventi possibili connessi ad un certo numero di prove

Dettagli

Foglio di Esercizi 9 con Risoluzione 29 dicembre 2015

Foglio di Esercizi 9 con Risoluzione 29 dicembre 2015 Matematica per Farmacia, a.a. 5/6 Foglio di Esercizi 9 con Risoluzione 9 dicembre 5 Esercizio. Integrare per parti: L integrale che poi si ottiene puó essere risolto con una sostituzione). ln d e arctan

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

Lezione 2 Equazioni famose

Lezione 2 Equazioni famose Moduo 7 U.D. Lez. Laura Citrini - Matematica de continuo Lezione Equazioni amose Matematica de continuo Moduo 7 - Funzioni di più variabii Unità didattica 4 Equazioni dierenziai Laura Citrini Università

Dettagli

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale Lezione VI: Distribuzione normale Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Lezione 6a- Ia distribuzione normale

Dettagli

Introduzione alla statistica

Introduzione alla statistica La statistica descrittiva Dicembre, 2016 Attilio Peloni, Istituto Alberti, Bormio 1 / 26 1 Introduzione Overview 2 La rappresentazione graca dei dati L'istogramma 3 La sintesi dei dati Media aritmetica

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva L obiettivo è quello di descrivere efficacemente i dati prima delle elaborazioni vere e proprie: - mediante rappresentazioni grafiche e tabelle - sintetizzandoli con indici opportuni

Dettagli

PROBLEMA 1 RISOLUZIONE. Punto 1

PROBLEMA 1 RISOLUZIONE. Punto 1 PROBLEMA Data una circonerenza di centro O e raggio unitario, si prendano su di essa tre punti A, B, C, tai che AB = BC.. Si cacoi, in unzione de angoo AÔB =, a quantità: AB BC CA controando che risuti:

Dettagli

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203 Esercizio Si considerino i seguenti dati relativi al numero di addetti

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

DISTRIBUZIONE NORMALE (1)

DISTRIBUZIONE NORMALE (1) DISTRIBUZIONE NORMALE (1) Nella popolazione generale molte variabili presentano una distribuzione a forma di campana, bene caratterizzata da un punto di vista matematico, chiamata distribuzione normale

Dettagli

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni

Dettagli

distribuzione normale

distribuzione normale distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: 1. si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; 2.

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

Laboratorio di Chimica Fisica. Analisi Statistica

Laboratorio di Chimica Fisica. Analisi Statistica Università degli Studi di Bari Dipartimento di Chimica 9 giugno F.Mavelli- Laboratorio Chimica Fisica - a.a. 3-4 F.Mavelli Laboratorio di Chimica Fisica a.a. 3-4 Analisi Statistica dei Dati Analisi Statistica

Dettagli

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona La distribuzione normale

Dettagli

L EQUAZIONE DIFFERENZIALE DELLA LINEA ELASTICA

L EQUAZIONE DIFFERENZIALE DELLA LINEA ELASTICA http://www.itimarconi.ct.it/sezioni/didatticaonine/edie/ostruzioni/linea%0eastic... Pagina di 06/0/006 L EQUAZIONE DIFFERENZIALE DELLA LINEA ELASTIA. BREVI RIHIAMI SULLA TEORIA DELLE TRAVI INFLESSE Si

Dettagli

Tutta la scienza è fondata sulle misure (Helmholtz)

Tutta la scienza è fondata sulle misure (Helmholtz) Tutta la scienza è fondata sulle misure (Helmholtz) L acquisizione di una osservazione come DATO SCIENTIFICO richiede che : osserviamo un fenomeno lo quantifichiamo correttamente lo confrontiamo con altri

Dettagli

La scala logaritmica

La scala logaritmica La scaa ogaritmica Obiettivi utiizzare coordinate ogaritmiche e semiogaritmiche 1. COORDINATE LOGARITMICHE Se un numero k eá maggiore di 10, i suo ogaritmo in base 10 eá moto piuá piccoo de numero stesso:

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Riepilogo lezione 4 Abbiamo visto: Distribuzioni discrete Modelli probabilistici nel discreto Distribuzione uniforme

Dettagli