Algorytmiczna i Statystyczna Analiza Danych

Wydział Fizyki, Astronomii i Informatyki Stosowanej,

Uniwersytet Jagielloński  w Krakowie


Rok akademicki 2014/2015



Konsultacje: poniedziałek, godz. 14:00 - 16:00; pokój 2-D-11.

 
Blok tematyczny I:

Analiza danych i statystyczne wnioskowanie
przygotowane w oparciu o materiały z Coursera: 

Dr. Mine Çetinkaya-Rundel
"Data Analysis and Statistical Inference"

Wykłady:
---------------
     2.10.2014  -  Co to są dane i jak je reprezentujemy
     9.10.2014  - 
Prawdopodobieństwo i rozkłady zmiennych
   23.10.2014
-  Wnioskowanie statystyczne, poziom i przedział ufności
    6.11.2014 -   Wnioskowanie statystyczne dla zmiennych numerycznych i opisowych
   13.11.2014 -   Regresja liniowa
   20.11.2014 -   Regresja w wielu wymiarach


Ćwiczenia:
----------------
    2.10.2014  -
        
1) uruchomić środowisko programowania R
         2) zrealizować w R kilka wybranych zadań  z rozdziału pierwszego w [2]
            
lub własne przykłady
             --> reprezentacja danych w postaci tabeli lub histogramów jak
            w przykładach omówionych na wykładzie
             --> prosta analiza statystyczna: wartość średnia, mediana, odchylenie standardowe
            reprezentacja w postaci "box-diagramu", "scatter" plotu, "diagramu mozaikowego    
        3) przygotować ze strony: http://www.openintro.org/stat/labs.php
              0 - Intro to R and RStudio
              1 - Introduction to Data
     9.10.2014  -
        
Przygotować ze strony: 
http://www.openintro.org/stat/labs.php
             
2 - Probability
              3 - Distributions
    23.10.2014  -
        
Przygotować ze strony:  http://www.openintro.org/stat/labs.php
             
4A - Intro to Interference
              4B - Confidence Levels

      6.11. 2014 -
        Przygotować ze strony:  http://www.openintro.org/stat/labs.php
              5 -   Interference for Numerical  Data
             
6 -   Interference for Categorical Data
   13.11. 2014 -
        Przygotować ze strony:  http://www.openintro.org/stat/labs.php
              7 -   Linear regression
   
20.11. 2014 -
        Przygotować ze strony:  http://www.openintro.org/stat/labs.php
              8 -   Multiple Regression
       

 
Blok tematyczny II:
Eksploracja zbiorów danych

przygotowane w oparciu o materiały z Coursera:
D. Peng, J. Leek and B. Caffo, "
Exploratory Data Analysis"

    27.11.2014   -  Algorytmy  do klastrowania danych
                                 dane do cwiczen: pm25_data_short.zipSamsungData.zip
          4.12.2014  - 
Algorytmy do redukcji wymiarów: dekompozycja SVD, analiza PCA
                                 
dane do cwiczen: pm25_data_long.zip    
        18.12.2014  -  Przykłady analizy, script.R
       
dodatkowe materiały:
http://www.stat.cmu.edu/~cshalizi/ADAfaEPoV/ADAfaEPoV.pdf
http://statweb.stanford.edu/~tibs/ElemStatLearn/
http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set
http://www.youtube.com/watch?v=wQhVWUcXM0A



Blok tematyczny III:
Eksploracja bardzo dużych zbiorów danych
przygotowane w oparciu o materiały z Coursera: 

 
J. Leskovec, A. Rajaraman and J. Ullman, "Mining massive datasets"
   8.01.2015  -  Algorytmy klastrujące: BRF, CURE
       15.01.2015 -  Analiza grafów i algorytm "PageRank"
       22.01.2015 - 
Model obliczeń równoległych "MapReduce"  


Materiały (książki oraz kursy):
-----------------

[1]  https://class.coursera.org/statistics
[2] http://www.openintro.org/stat/textbook.php
[3] https://class.coursera.org/exdata-006
[4] https://class.coursera.org/mmds
[5]
http://www.mmds.org/


Programowanie w języku R:
-----------------------------------------
http://www-bcf.usc.edu/~gareth/ISL/
http://www.alsharif.info/#!iom530/c21o7
https://class.coursera.org/rprog-006

Duże zestawy danych:
------------------------------------
http://webscope.sandbox.yahoo.com/catalog.php



Ostatnia modyfikacja: 7 styczeń  2015

Elzbieta Richter-Was


Wstecz