Отправляет email-рассылки с помощью сервиса Sendsay

Блог об анализе данных и ИТ

  Все выпуски  

Дайджест статей по анализу данных No3 (9.06.2014 --22.06.2014)



Дайджест статей по анализу данных №3 (9.06.2014 —22.06.2014)
2014-07-08 14:27

Добрый день, уважаемые читатели. Пролетели 2 недели и пришло время нашей подборки материалов по анализу данных. Сегодняшний дайджест получился большим, и признаюсь често сам осилил не все, что в него попало. Но так как на вкус и цвет товарище нет, то я решил выложить всю подборку. Итак, из сегодняшней подборки вы узнаете о том как использовать хранилища данных различных типов в одном проекте, посмотрите какими большими данными может обладать бизнес и как их анализ может ему помочь. Также в нашей подборке будет статья посвященная алгоритму FTCA, а также будет материал про сравнени различных алгоритмов машинного обучения.



250 миллионов междурнародных событий в одном месте
2014-07-08 14:27

Исследователь Кавел Литару, из Джордтаунского университета, собрал каталог из 250 миллионов событий произошедших в мире с 1979, который ежедневно обновляется и доступен каждому желающему кто хочет его изучить.

Каждая запись набора имеет 58 атрибутов. А сам набор делиться на 300 различных категорий. На настоящий момент каталог имеет объем 100 Гб, а хостером является Goolge.



В избранное