METODOLOGIA SCIENTIFICA E LINGUISTICA
Modulo INFORMATICA

Anno accademico 2022/2023 - Docente: ALFREDO PULVIRENTI

Risultati di apprendimento attesi

Descrizione generale sintetica

Il corso mira a far acquisire i principali concetti di base del calcolo delle probabilità e della statistica.

Obiettivi formativi generali dell'insegnamento in termini di risultati di apprendimento attesi:

  1. Conoscenza e capacità  di comprensione (knowledge and understanding): Il corso mira a far acquisire agli studenti abilità in merito alla descrizione di dati statistici; Comprendere i termini di base (popolazione, campione, variabile ecc); Calcolo e presentazione di distribuzioni di frequenza; Descrizione di dati con metodi grafici; Calcolo degli indici di tendenza centrale e variabilità; Comprendere i fondamenti della valutazione di probabilità di un evento e di una variabile aleatoria; Acquisire i concetti legati alla statistica inferenziale quali stime per intervall di confidenza e test di ipotesi.
  2. Capacità  di applicare conoscenza e comprensione (applying knowledge and understanding): identificare le distribuzioni idonee a rappresentare la conoscenza sottostante; risolvere problemi di statistica inferenziale e calcolo delle probabilità.
  3. Autonomia di giudizio (making judgements): Attraverso esempi concreti e casi di studio, lo studente sarà in grado di elaborare autonomamente soluzioni a determinati problemi e valutare l’idoneità della soluzione di un problema di statistica inferenziale e probabilità.
  4. Abilità comunicative (communication skills): lo studente acquisirà le necessarie abilità comunicative e di appropriatezza espressiva nell'impiego del linguaggio tecnico nell'ambito generale dell’analisi dei dati attraverso metodi statistici
  5. Capacità  di apprendimento (learning skills): il corso si propone, come obiettivo, di fornire allo studente le necessarie metodologie teoriche e pratiche per poter affrontare e risolvere autonomamente problemi nell’ambito dell’analisi statistica dei dati.

Modalità di svolgimento dell'insegnamento

Le lezioni sono tenute in aula con l'ausilio di slide, messe a disposizione degli studenti sul portale
Studium. Le slide non sostituiscono i testi di riferimento, ma, oltre che agevolare la comprensione della
lezione, forniscono un dettaglio puntuale sul programma svolto.


Le lezioni frontali teoriche sono intervallate da esercitazioni pratiche, svolte nella
stessa aula di lezione. Gli studenti sono invitati a formare piccoli gruppi di lavoro (massimo 2-3 persone)
per lo svolgimento delle esercitazioni proposte.

Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.

Prerequisiti richiesti

Conoscenze di matematica presenti in tutti i programmi delle scuole superiori.

Frequenza lezioni

La frequenza delle lezioni è obbligatoria.

Contenuti del corso

Le tecniche di campionamento: il campione casuale semplice, sistematico, stratificato, a grappoli, a stadi.

Statistica descrittiva. Distribuzioni di frequenza. Tabelle. Grafici, istogrammi, diagramma a barre. Indici di tendenza centrale. Indici di dispersione.

Cenni di calcolo delle probabilità. Definizione di probabilità; Eventi; Probabilità condizionata; Teorema di Bayes; Principio  delle probabilità totali; Variabili aleatorie discrete; Media, varianza e deviazione standard; Distribuzioni discrete notevoli: Bernoulli, binomiale, uniforme, geometrica, Poisson; Distribuzioni continue: uniforme, normale esponenziale.

Distribuzioni di campionamento: distribuzione t-student, distribuzione di Fisher; 

Inferenza statistica: stima puntuale e stima di intervallo. Intervallo di confidenza: per una media, per la differenza tra due medie, per una proporzione, per la differenza tra due proporzioni.

Principi della verifica di ipotesi (l’ipotesi nulla. Gli errori di I tipo e II tipo. La potenza di un test).

Test parametrici per le verifica di ipotesi: una media; confronto tra due medie nel caso di campioni indipendenti e appaiati.

Testi di riferimento

Testi di riferimento:

 Lantieri PB, Risso D, Ravera G: Statistica medica per le professioni sanitarie, II ed. McGraw-Hill

Programmazione del corso

 ArgomentiRiferimenti testi
1Introduzione alla bioinformatica: tipi di dati, problemi, strumenti.Capitolo 1 + materiale didattico integrativo fornito dal docente
2Sequenze, ricerca tramite BLAST, allineamento pairwise e multiplo. Algoritmi.Capitoli 3 e 4 + materiale didattico integrativo fornito dal docente
3Attività pratica su allineamento di sequenzeCapitolo 3 + Appendice A +materiale didattico integrativo fornito dal docente
4Banche dati biologiche presenti sul sistema dell'NCBI: nucleotide, protein, OMIM, PUBMED, GENE, SNPCapitolo 2 + materiale didattico integrativo fornito dal docente
5Attività pratica su banche datiCapitolo 2 + Appendice A + materiale fornito dal docente
6Banca dati UNiPROTCapitolo 7 +materiale didattico fornito dal docente
7Cenni sulla programmazione Rhttps://cran.r-project.org/doc/contrib/manuale.0.3.pdf
8Introduzione, statistica descrittivaCapitoli 1 e 3 + materiale didattico integrativo
9Raccolta e organizzazione dei dati, Indici di tendenza centrale e dispersioneCapitoli 4 5 e 6 + materiale didattico integrativo
10calcolo delle probabilità e distribuzioni di probabilitàCapitolo 8 + materiale didattico integrativo
11Rappresentazione grafica dei datiCapitolo 7 + materiale didattico integrativo
12Campionamento e inferenza statisticaCapitolo 10 + materiale didattico integrativo
13Stime di parametri per intervalloCapitolo 9 + materiale didattico integrativo
14Test di ipotesiCapitolo 10 + materiale didattico integrativo

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

L'esame finale consiste in una prova scritta ed un colloquio orale.

La prova scritta è costituita da esercizi e domande di teoria.

Chi non supera la prova scritta, non può sostenere l'orale. La prova scritta può essere visionata prima delle prove orali.

Salvo diversa comunicazione:

  • l'esame scritto si svolge alle ore 9:00

Note:

  • Per sostenere gli esami è obbligatorio prenotarsi utilizzando l'apposito modulo del portale CEA.
  • Non sono ammesse prenotazioni tardive tramite email. In mancanza di prenotazione, l'esame non può essere verbalizzato.

La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.

 

Esempi di domande e/o esercizi frequenti

Sul portale studium.unict.it saranno messi a disposizione esercizi svolti.

ENGLISH VERSION