lavoro individuale prof. Dovigo

Tuesday, October 17, 2006

Modulo sulle frequenze e grado di connessione

ANALISI E LABORATORIO SULLE FREQUENZE E GRADO DI CONNESSIONE

Classe di riferimento
L’unità didattica è rivolta ad una classe quinta ITC indirizzo mercurio. In questa classe viene affrontato il modulo sulle distribuzioni di frequenze, connessione e correlazione e cioè viene acquisita dagli studenti una metodologia statistica per poter svolgere una analisi riguardante due variabili qualitative. Tramite la creazione di alcune tabelle, sempre partendo dai dati di partenza, si possono ricavare degli indici che assumono in statistica notevole importanza perché ci dicono se due fenomeni sono tra loro correlati.
Nel caso in esame consideriamo una indagine statistica riguardante fascia di età e numero di volte all’interno del mese in cui ci si è recati al cinema.
L’indagine riguarda un campione di 400 persone.
E’ facile pensare che i ragazzi stessi possano reperire e catalogare questi dati. Se all’interno di una classe di 20 persone ognuno “intervista” 20 persone (famigliari, vicini di casa, compagni di sport, ecc.), è molto veloce reperire i 400 dati e poi creare una tabella come quella già in nostro possesso. L’indagine può ovviamente riguardare altri settori. Importante è individuare le due variabili e soprattutto, deve esserci un senso logico nel chiedersi se vi è correlazione tra di esse. Ad esempio, non avrebbe senso indagare se c’è dipendenza tra il colore dei capelli di una persona e il numero di volte in cui essa si è recata al cinema perché un qualsiasi indice di correlazione non ci può dire nulla di statisticamente significativo!
E’ questo il primo vero problema della statistica. Al di là dei conti, dei calcoli, delle probabilità, deve esserci una mente pensante che sa dove si sta partendo e dove si vuole arrivare.
Interessante perciò sarà con i ragazzi cercare di individuare due fenomeni che li possono interessare e scoprire se tra di essi esiste o meno correlazione.
Ad esempio potremmo chiederci se c’è connessione tra il luogo di residenza (diviso tra nord, centro e sud) e il grado di studio raggiunto (diviso tra scuole elementari, scuole medie, scuole superiori e università).
Infatti, al termine di questo modulo - dopo che avremo spiegato una parte teorica con Power Point e dopo avere effettuato un lavoro in Excel - proporremo agli studenti, come tesina di maturità, una indagine statistica riguardante due fenomeni.
Saranno gli alunni a decidere quali variabili considerare e lascerò ampio spazio alla loro fantasia… con l’unico vincolo del “senso logico” dell’indagine! Dovranno reperire i dati (almeno 400), catalogarli in una tabella e svolgere l’analisi per scoprire se i due fenomeni sono tra essi collegati o meno.


Prerequisiti da fornire per poter svolgere l’esercitazione
se ne consiglia il ripasso tramite gli appositi link.
- Distribuzioni di frequenze;
- Concetto di classe;
- Frequenze relative nell’analisi di distribuzione univariata;
- Distribuzione bivariata e sua rappresentazione;
- Frequenze congiunte e frequenze marginali;
- Frequenze percentuali;
- Frequenze relative, frequenze condizionate di riga e di colonna;
- Indipendenza, connessione e contingenza.

Obiettivi
• Reperire e classificare con senso logico i dati;
• Essere in grado di leggere agilmente una tabella a doppia entrata;
• Saper usare i concetti di frequenza;
• Sapere interpretare i dati contenuti in una determinata riga e colonna;
• Capire, con opportuni calcoli, se vi è connessione o meno tra i dati del campione in esame;
• Discutere con senso critico i risultati statistici ottenuti.

Metodo
Partendo da una tabella che riassume i dati riguardanti una indagine sulla attitudine di recarsi al cinema:
• Trasformare la tabella assegnata in termini di frequenze relative:
- rispetto al totale generale
- rispetto ai totali di colonna;
• Per entrambe le distribuzioni ottenute: interpretare le frequenze relative della casella nella terza riga e prima colonna, evidenziando le diverse informazioni che offrono;
• Valutare, utilizzando un opportuno indice, il grado di connessione tra y e x.

Contenuto

PARTE TEORICA

Presentazione in Power Point della parte teorica con semplici slide che fungono da supporto (sfondo) per la spiegazione. Agli studenti sono state fornite le slide in forma cartacea in modo tale che possano prendere appunti direttamente su di esse.
La spiegazione parte dalla slide e viene svolta in collaborazione con gli studenti alla lavagna in modo tale che l’ottica dell’apprendimento, anche durante questa prima fase teorica, sia quella dell’“imparare lavorando insieme”.
Verranno proiettate e spiegate le seguenti slides:




















Vediamo adesso un esercizio e cerchiamo di svolgerlo mettendo in atto quanto appreso nella presentazione.









PARTE PRATICA

LABORATORIO CON ESERCITAZIONE IN EXCEL


Partiamo dalla tabella di cui sopra che rappresenta una indagine riguardante l’abitudine di recarsi al cinema, condotta su 400 italiani di diverse fasce di età (x) e numero di visioni cinematografiche nel mese di agosto 2000 (y).

Apriamo un foglio Excel e riscriviamo la tabella in nostro possesso.
Fermiamo la tabella in modo tale da avere sempre a disposizione i dati di partenza.

Osserviamo i dati. Cosa possiamo dire?
L’indagine è rivolta a un campione di 400 persone ma abbiamo un totale osservazioni = 384 perciò 16 persone non hanno risposto.
16 persone su 400 incidono per il 4%.Ci piace la tabella? Avremmo potuto farla meglio?
La fascia di età “sotto 24 anni” potrebbe sembrarci generica e non considerare che c’è una fascia di età “sotto i 13 anni” - che principalmente si reca al cinema a vedere cartoni animati - molto diversa dalla fascia di età “dai 14 ai 24 anni”!
Raccogliamo tutte le osservazioni dei ragazzi e facciamo loro notare che in una indagine statistica, la fase di raccolta e catalogazione dati è molto importante.
Proseguiamo ora nell’esercitazione e vediamo quali tabelle dobbiamo creare per poter rispondere alle domande poste.
Qui di seguito riportiamo l’esercitazione:

























Sarà interessante discutere con senso critico il risultato conseguito e rivedere i dati di partenza e le osservazioni iniziali.
Possiamo discutere se ci aspettavamo o meno un indice normalizzato c pari a 0,392.
Questo valore ci dice che c’è poca connessione tra il fenomeno “recarsi al cinema” e la variabile “età di una persona” (minimo = 0 massimo = 1).

Possibili applicazioni
Con questa esercitazione gli studenti hanno messo in pratica quanto spiegato durante la presentazione in Power Point. Hanno dovuto maneggiare i dati di partenza e costruire delle tabelle per effettuare una analisi sui dati e giungere infine ad una analisi statistica.

Valutazione attività di laboratorio

Si intende valutare:

- fase teorica:

a) attenzione in classe;
b) pertinenza domande svolte;
c) capacità di porre osservazioni critiche;

- il lavoro svolto:

a) il risultato ottenuto;
b) layout;
c) presenza di commenti;

- l’utilizzo del software:

d) le procedure utilizzate,
e) la padronanza delle strutture informatiche;
- conoscenze matematiche:
a) basi matematiche per eseguire l’esercitazione,
b) domande svolte in classe
c) collegamenti con quanto già svolto negli anni passati;

- partecipazione:

a) attenzione al lavoro;
b) lo studente dimostra, al termine delle ore di laboratorio, di avere lavorato;pone domande inerenti all’attività.