informatica di base per le discipline umanistiche
|
|
|
- Edmondo Lamberti
- 9 anni fa
- Visualizzazioni
Transcript
1 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
2 sesta lezione: la dinamica del testo vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
3 come cresce il lessico di un testo? il lessico di un testo cresce quando introduciamo nel testo una parola mai usata prima intuitivamente la crescita di un lessico è rapida all inizio, in quanto ogni parola che usiamo ha la tendenza ad essere nuova (raramente ci sono ripetizioni nella stessa frase) aumentando il numero di frasi, tuttavia, aumenta la probabilità di riusare parole già usate il ritmo di crescita del lessico di un testo tende quindi a diminuire all aumentare del numero di frasi...
4 come cresce il lessico di un testo (prime 1000 parole) (torna indietro ) coefficiente angolare intercetta coefficiente angolare (continua )
5 come cresce il lessico di un testo (prime 1000 parole, interpolazione a potenza) (torna indietro ) (fine excursus) (fine excursus)
6 come cresce il lessico di un testo? (II) esistono classi di parole che è praticamente impossibile non ripetere all interno di un testo anche molto breve queste classi sono formate dalle cosiddette parole grammaticali (articoli, preposizioni, ausiliari ecc.), che costituiscono l impalcatura morfosintattica di una frase queste classi sono, tipicamente, relativamente ristrette (contengono pochi elementi) e chiuse, cioè non sono soggette ad espandersi attraverso processi produttivi del lessico come la derivazione o la composizione (per saperne di più clicca sulle parole evidenziate!)
7 come cresce il lessico di un testo? (III) un altro fattore evidente che ritarda la crescita esponenziale del lessico all interno dello stesso testo è la coerenza lessicale : la necessità, cioè,di ripetere concetti che sono legati al dominio o alla situazione specifica di cui parla il testo
8 la frequenza media la frequenza media di una parola nel testo è data dal rapporto tra la lunghezza del testo e la grandezza del suo lessico: C / V all inizio ogni parola è usata in media poco più di una sola volta (freq media 1) non appena ripetiamo una stessa parola, tuttavia, la freq media cresce (freq media > 1) in generale freq media tende a crescere per due ragioni: le parole grammaticali si ripetono, andando ad aggiungersi a C ma lasciando V invariato; il vocabolario a sua volta, come abbiamo visto, rallenta il suo ritmo di crescita col passare del testo
9 come cresce freq media? il ritmo di crescita di freq media tende a rallentare col passare del testo perché? la frequenza cresce linearmente al crescere del testo se il peso del lessico fosse costante, la crescita di freq media resterebbe lineare, ma avrebbe un ritmo inferiore (la retta che descrive questo andamento sarebbe più inclinata verso l asse delle x) se il peso del lessico aumentasse in modo lineare, freq media sarebbe costante dal momento che il lessico cresce in modo non lineare (con una potenza di poco inferiore all unità) solo una crescita di frequenza non lineare (con esponente di poco inferiore a 2) potrebbe consentire a freq media di crescere linearmente
10 (torna indietro ) crescita di freq media in un testo di parole
11 (torna indietro ) curve di crescita del lessico (continua )
12 (torna indietro ) crescita di freq media (fine excursus)
13 cresce tutto così? no! la lunghezza media di una parola tende a stabilizzarsi col passare del testo, cioè tende ad assumere un valore costante dopo una serie di oscillazioni casuali (legge dei grandi numeri)
14 campionamento casuale analogamente se invece di monitorare lo stesso testo nel tempo, se ne estraggono tanti campioni casuali, e se ne calcola per ciascuno lun media, il valore più volte attestato tenderà a riprodurre lun media di tutto il testo...
15 campionamento casuale (II)... tanto meglio, quanto maggiore è la lunghezza dei campioni:
16 la distribuzione gaussiana 68.27%
17 la legge di Zipf, di 2258 il 1309 e 1297 la 1165 a 914 che 864 e' 847 in 830 per 789 all interno di una porzione un di testo, 693 esiste una correlazione L' 647 del 587 inversa tra le frequenza di una parola e la sua posizione I 585 con 467 relativa (rango) in una lista si di parole 467 che va dalla più le 466 frequente alla meno frequente ha 456 una 449 non 441 della 435 : 400 da 393 al sono 291 dei 262 Piu' 260 dell' 251 ( 241 Ma 239 ) 238 Nel 238 anche 213 gli 213 alla 208 hanno 186 dal 181 anni 173 delle 159 all' 158 come 149 stato 145 Lo 143 f = C r α
18 Zipf (II)
19 il logaritmo
20 la funzione a x (esponenziale)
21 la scala logaritmica
22 Zipf (III) log( f ) = log( C) α log( r) y = x
23 la struttura del lessico (classi di frequenza) chiamiamo V i la classe di parole che appaiono con frequenza i volte ciascuna nel testo allora V = V 1 + V V max, dove max è la frequenza massima con cui una parola appare nel nostro testo
24 sesta lezione la dinamica del testo fine sesta lezione (lezione 7)
Linguistica Computazionale
Linguistica Computazionale La Legge di Zipf 13 ottobre 2014 Distribuzione della frequenza delle parole Rango di una parola (r v ) posizione occupata da una parola in un ordinamento di frequenza discendente
Analisi dei Dati Tabelle e Grafici
Analisi dei Dati Tabelle e Grafici Spesso una misurazione consiste nello studio di una grandezza,y i in funzione di un altra, x i. Esempi: o lo spazio percorso da un oggetto in funzione di un intervallo
Scale Logaritmiche. Matematica con Elementi di Statistica, Anna Torre a.a
Scale Logaritmiche SCALA LOGARITMICA: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
Esercizi. 1. Disegnare il grafico qualitativo della seguente funzione:
Esercizi. Disegnare il grafico qualitativo della seguente funzione: f(x) = x 2 per x 0 x per x > 0 e determinarne gli eventuali punti di massimo e minimo assoluti e relativi nell intervallo (,4]. Esercizi
Parole e frequenze. Alessandro Lenci
Parole e frequenze Alessandro Lenci Università di Pisa, Dipartimento di Linguistica Via Santa Maria, 36, 5600 Pisa, Italy [email protected] Linguaggio e comunicazione - LO042 Rango di una parola
Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16
Scale Logaritmiche Scala Logaritmica: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti
Trasformazioni Logaritmiche
Trasformazioni Logaritmiche Una funzione y = f(x) può essere rappresentata in scala logaritmica ponendo Si noti che y = f(x) diventa ossia Quando mi conviene? X = log α x, Y = log α y. log α (x) = log
FUNZIONI ESPONENZIALI
FUNZIONE ESPONENZIALE E FUNZIONE LOGARITMICA CRESCITA DI UNA POPOLAZIONE BATTERICA DISEQUAZIONI ESPONENZIALI E LOGARITMICHE SIMMETRIE E GRAFICI DEDUCIBILI Angela Donatiello FUNZIONI ESPONENZIALI Crescita
Utilizzo di index() per determinare la colonna delle x
Utilizzo di inde() per determinare la colonna delle In generale devo essere in grado di costruire un foglio dati con una colonna delle i cui estremi siano (a,b) bbiamo visto che le righe sono individuate
Analisi dei Dati Tabelle e Grafici
Analisi dei Dati Tabelle e Grafici L'analisi dei dati di fisica (e non solo) è molto facilitata da una raccolta accurata e ordinata dei dati che si effettua tramite la compilazione di tabelle e grafici.
y = è una relazione tra due variabili, che ad ogni valore della
LE FUNZIONI DEFIINIIZIIONE Una funzione f () = è una relazione tra due variabili, che ad ogni valore della VARIABILE INDIPENDENTE associa AL PIU (al massimo) un valore della VARIABILE DIPENDENTE E UNA
Distribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Linguistica Computazionale
Linguistica Computazionale Frequenze di parole 7 ottobre 2014 Statistica terminologia di base Popolazione (collettivo) l insieme delle entità (oggetti, individui, eventi, ecc.) che rappresentano il dominio
Classi: 4A inf Sirio Disciplina: MATEMATICA Ore settimanali previste: 3
Classi: 4A inf Sirio Disciplina: MATEMATICA Ore settimanali previste: 3 Titolo unità didattiche in cui è diviso Titolo Modulo il modulo Prerequisiti per l'accesso al modulo 1: Calcolo numerico e letterale,
Rappresentazione di Dati: Scala lineare Scala logaritmica. Grafici Lin Lin Grafici Lin Log Grafici Log Log
Rappresentazione di Dati: Scala lineare Scala logaritmica Grafici Lin Lin Grafici Lin Log Grafici Log Log Grafici in scala lineare Grafici Lin Lin Nella rappresentazione di dati in un piano cartesiano
Linguaggi e Grammatiche Liberi da Contesto
N.Fanizzi-V.Carofiglio Dipartimento di Informatica Università degli Studi di Bari 22 aprile 2016 1 Linguaggi Liberi da Contesto 2 Grammatiche e Linguaggi Liberi da Contesto G = (X, V, S, P) è una grammatica
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE
CAMPIONAMENTO - ALCUNI TERMINI CHIAVE POPOLAZIONE = qualsiasi insieme di oggetti (unità di analisi) di ricerca N = ampiezza della popolazione PARAMETRI = caratteristiche della popolazione [media, proporzione
Dispensa sulla funzione gaussiana
Sapienza Università di Roma Dipartimento di Scienze di Base e Applicate per l Ingegneria Sezione di Matematica Dispensa sulla funzione gaussiana Paola Loreti e Cristina Pocci A. A. 011-01 1 Introduzione:
Proprietà delle funzioni. M.Simonetta Bernabei & Horst Thaler
Proprietà delle funzioni M.Simonetta Bernabei & Horst Thaler Funzioni crescenti e decrescenti Una funzione f è crescente in (a, b) se f ( 1 ) f ( ) quando 1
Distribuzioni di Probabilità
Distribuzioni di Probabilità Distribuzioni discrete Distribuzione uniforme discreta Distribuzione di Poisson Distribuzioni continue Distribuzione Uniforme Distribuzione Gamma Distribuzione Esponenziale
1) D0MINIO. Determinare il dominio della funzione f (x) = ln ( x 3 4x 2 3x). Deve essere x 3 4x 2 3x > 0. Ovviamente x 0.
D0MINIO Determinare il dominio della funzione f ln 4 + Deve essere 4 + > 0 Ovviamente 0 Se > 0, 4 + 4 + quindi 0 < < > Se < 0, 4 + 4 4 e, ricordando che < 0, deve essere 4 < 0 dunque 7 < < 0 Il campo di
VERIFICA DI MATEMATICA Simulazione La funzione esponenziale e logaritmica - Soluzioni
Problema 1 a) c y f 1 : log 4 VERIFICA DI MATEMATICA Simulazione La funzione esponenziale e logaritmica - Soluzioni 1 log 1 4 0 4 1 Dominio: D ; 4 4 0 4 4 Intersezioni: 0 imp y 0 log 4 0 4 1 A ;0 Segno:
LICEO SCIENTIFICO "R. NUZZI" - ANDRIA Anno Scolastico 2015/16 MATEMATICA
LICEO SCIENTIFICO "R. NUZZI" - ANDRIA Anno Scolastico 2015/16 MATEMATICA Il Dipartimento di Matematica per il corrente anno scolastico (2015/2016) ha individuato la realizzazione di diciannove corsi integrativi
Domanda e offerta. consumatori di un bene/servizio per ciascun livello di prezzo del bene/servizio preso
. . La funzione di domanda La funzione di domanda (o curva di domanda) rappresenta la quantità domandata dai consumatori di un bene/servizio per ciascun livello di prezzo del bene/servizio preso in considerazione.
Il metodo della regressione
Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile
MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre
MODULI CLASSE TERZA TEMA ALGEBRA MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre COMPETENZE: utilizzare le tecniche e le procedure del calcolo aritmetico e algebrico, rappresentandole anche sotto
LA LUNGHEZZA DEI GENI UMANI (Es4.1)
STATISTICA INFERENZIALE: le caratteristiche della popolazione complessiva sono indotte da quelle osservate su un campione estratto dalla popolazione stessa(esempio exit poll) PROBLEMA: dato un campione
MODULO 1 - Esponenziali e logaritmi
PROGRAMMAZIONE INDIVIDUALE A. S. 2014.15 DOCENTE: Gagliardi Stefano CLASSE: 3 a AT MATERIA: Matematica ASSE CULTURALE: Asse Matematico MODULO 1 - Esponenziali e logaritmi Le potenze e le proprietà delle
LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b
Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA LOGARITMI L uguaglianza: a x = b nella quale a e b rappresentano due numeri reali noti ed x un incognita, è un equazione
Perché il logaritmo è così importante?
Esempio 1. Perché il logaritmo è così importante? (concentrazione di ioni di idrogeno in una soluzione, il ph) Un sistema solido o liquido, costituito da due o più componenti, (sale disciolto nell'acqua),
a rappresenta l intercetta o termine noto della retta, ossia il valore della y quando x = 0.
Esercitazioni sulla prima parte delle lezioni di Micro Richiamo di Analisi Matematica La forma funzionale più semplice è la retta, la quale può essere genericamente descritta dalla seguente relazione:
Linguaggi di Programmazione Corso C. Parte n.3 Linguaggi Liberi da Contesto e Linguaggi Contestuali. Nicola Fanizzi
Linguaggi di Programmazione Corso C Parte n.3 Linguaggi Liberi da Contesto e Linguaggi Contestuali Nicola Fanizzi ([email protected]) Dipartimento di Informatica Università degli Studi di Bari Grammatiche
Distribuzione Normale
Distribuzione Normale istogramma delle frequenze di un insieme di misure di una grandezza che può variare con continuità popolazione molto numerosa, costituita da una quantità praticamente illimitata di
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
PROGRAMMA DI MATEMATICA APPLICATA Classe III SIA sez. A A.S. 2015/2016
PROGRAMMA DI MATEMATICA APPLICATA Classe III SIA sez. A A.S. 2015/2016 LE DISEQUAZIONI 1. Le disequazioni di primo e secondo grado 2. Le disequazioni di grado superiore al secondo e le disequazioni fratte
MATEMATICA E STATISTICA
DIPARTIMENTO DI AGRICOLTURA, ALIMENTAZIONE E AMBIENTE (Di3A) Corso di laurea in Scienze e tecnologie alimentari Anno accademico 2017/2018-1 anno MATEMATICA E STATISTICA MAT/04-6 CFU - 1 semestre Docente
Esercizi sulle equazioni logaritmiche
Esercizi sulle equazioni logaritmiche Per definizione il logaritmo in base a di un numero positivo x, con a > 0 e a 1, è l esponente che occorre dare alla base a per ottenere il numero x. In simboli log
Fisica per Medicina. Lezione 2 - Matematica e Cinematica. Dr. Cristiano Fontana
Fisica per Medicina Lezione - Matematica e Cinematica Dr. Cristiano Fontana Dipartimento di Fisica ed Astronomia Galileo Galilei Università degli Studi di Padova 17 ottobre 17 Indice Richiami di matematica
Distribuzioni campionarie. Antonello Maruotti
Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento
GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti A cura di: Ing. Giovanna
UNITÀ DIDATTICA 2 LE FUNZIONI
UNITÀ DIDATTICA LE FUNZIONI. Le funzioni Definizione. Siano A e B due sottoinsiemi non vuoti di R. Si chiama funzione di A in B una qualsiasi legge che fa corrispondere a ogni elemento A uno ed un solo
Esercizi di Ricapitolazione
Esercizio 1. Sono dati 150 g di una soluzione S 1 concentrata al 12%. (a) Determinare quanti grammi di soluto occorre aggiungere a S 1 per ottenere una nuova soluzione S 2 concentrata al 20%. (b) Determinare
Programma svolto nell'a.s. 2014/2015. Disciplina: Matematica. Classe: 3D Docente: Prof. Ezio Pignatelli. Programma sintetico.
Programma svolto nell'a.s. 2014/2015. Disciplina: Matematica. Classe: 3D Docente: Prof. Ezio Pignatelli Programma sintetico. 1. Equazioni e disequazioni a) Equazioni e disequazioni di primo e secondo grado.
LOGARITMI. log = = con >0, 1; >0 = >0, 1, >0. log =1 >0, 1. notebookitalia.altervista.org
LOGARITMI Sia un numero reale positivo ed un numero reale, positivo, diverso da 1; si dice logaritmo di in base il valore da attribuire come esponente alla base per ottenere una potenza uguale all argomento.
La distribuzione delle frequenze. T 10 (s)
1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo
Funzioni Esponenziale e Logaritmica. Prof. Simone Sbaraglia
Funzioni Esponenziale e Logaritmica Prof. Simone Sbaraglia Funzione Esponenziale Vogliamo definire propriamente le funzioni esponenziali e logaritmiche che abbiamo introdotto in precedenza. Qual e` il
Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca
UdA n. 1 Titolo: Disequazioni algebriche Saper esprimere in linguaggio matematico disuguaglianze e disequazioni Risolvere problemi mediante l uso di disequazioni algebriche Le disequazioni I principi delle
Le funzioni elementari. Corsi di Laurea in Tecniche di Radiologia... A.A. 2010-2011 - Analisi Matematica - Le funzioni elementari - p.
Le funzioni elementari Corsi di Laurea in Tecniche di Radiologia... A.A. 200-20 - Analisi Matematica - Le funzioni elementari - p. /43 Funzioni lineari e affini Potenze ad esponente naturale Confronto
RELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016
RELAZIONE FINALE DEL DOCENTE Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016 In relazione alla programmazione curricolare sono stati conseguiti, in termini di livello medio,
Proprietà delle funzioni. M.Simonetta Bernabei, Horst Thaler
Proprietà delle funzioni M.Simonetta Bernabei, Horst Thaler Funzioni crescenti e decrescenti Una funzione f è crescente (non decrescente) in un intervallo I se f ( 1 ) < f ( ) (f ( 1 ) f ( )), quando 1
Esercitazioni di ISTITUZIONI di MATEMATICA 1 Facoltà di Architettura Anno Accademico 2005/2006
Esercitazioni di ISTITUZIONI di MATEMATICA 1 Facoltà di Architettura Anno Accademico 005/006 Antonella Ballabene SOLUZIONI -14 marzo 006- SCHEMA per lo STUDIO di FUNZIONI 1. Dominio della funzione f)..
Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
Tipi di variabili. Indici di tendenza centrale e di dispersione
Tipi di variabili. Indici di tendenza centrale e di dispersione L. Boni Variabile casuale In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o random variable)
