Анализ больших массивов данных

  1. Работа с Pandas
  2. Персональные страницы, блоги и т.п.
    1. Блог Игоря Субботина с еженедельными обзорами наиболее интересных материалов по анализу данных и машинному обучению
    2. Александр Дьяков
    3. Дмитрий Ефимов
  3. Открытые(бесплатные) онлайн курсы
    1. Видеолекции от Школы Анализа Данных (Яндекс)
    2. Курс Introduction to Machine Learning (smola.org)
    3. Курс Machine Learning - Tom Mitchell (cmu.edu)
    4. Курс R Programming for Simulation and Monte Carlo Methods
    5. Курс Анализ данных в R [Stepic.RUS]
    6. Курс Основы статистики [Stepic.RUS]
    7. Курс Введение в машинное обучение [Coursera.RUS]
    8. Курс Машинное обучение [Coursera.ENG]
    9. github Семинары по машинному обучению, ВМК МГУ [RUS]
  4. Статьи
    1. Статья Kaggle и Titanic — еще одно решение задачи с помощью Python
    2. Статья Введение в машинное обучение с помощью Python и Scikit-Learn
    3. Пример решения задачи множественной регрессии с помощью Python
  5. Matplotlib
    1. Пакет matplotlib. Наводим красивости
    2. Пакет matplotlib. Установка, проверка, настройка
    3. Пакет matplotlib. Строим банальный график
    4. Программирование и научные вычисления на языке Python
    5. Использование библиотеки Matplotlib
    6. Анализ данных при помощи Python. Графики в pandas и matplotlib.
    7. Библиотека Seaborn
    8. Cookbook[ENG]
  6. R
    1. R wiki page
    2. R reference manual
    3. rdocumentation.org
    4. R-Fiddle
    5. Rattle: A Graphical User Interface for Data Mining using R
    6. Обучение
      1. Try R от codeschool.com
      2. R tutorial (cyclismo.org)
      3. DataCamp
      4. Серия курсов на coursera.com от Johns Hopkins University по специальности Data Science
        1. The Data Scientist’s Toolbox
        2. R Programming
        3. Getting and Cleaning Data
        4. Exploratory Data Analysis
        5. Reproducible Research
        6. Statistical Inference
  7. Разное
    1. Wakari.io Онлан сервис для рамещения своих ipython notebook [ENG]
    2. Хабр Numpy - пособие для новичков [RUS]
    3. Data Tau агрегатор новостей [ENG]
  8. Соревнования. Решение проблем.
    1. Kaggle
    2. Innocentive
    3. DrivenData.org
    4. kdnuggets.com
    5. DataQuest
  9. Инструментарий
    1. Программы
      1. WEKA
        1. Статьи на сайте IBM
        2. 11 видео для начинающих
        3. Статья на wiki