Tagged in

Data Mining

Altsoph’s blog
Altsoph’s blog
Random notes on people and machines
More information
Followers
103
Elsewhere
More, on Medium

GRAPH CHI

В начале июля всплыл отличный проект GraphChi, которой может сильно облегчить жизнь исследователям, работающим с большими объемами информации.

Авторы предлагают подход, позволяющий гонять на обычном десктопе обработку больших графов с эффективностью, сопоставимой с работой среднего…


IRONSPREAD

Для любителей тонких извращений: IronSpread — плагин для MS Excel 2010, позволяющий писать макросы на питоне.

Have fun.


DATAMINING PRIMER

Нашелся очень доходчивый букварь по методам DataMining-а, оформленный в странной полуграфической форме. 
Для знакомых с темой там ничего нового, скорее всего, не найдется. Но новичкам будут полезны доходчивые определения и куча примеров задачек под Orange и Weka.


FOURSQUARE HEATMAP

Сервис WhereDoYouGo от Steven Lehrburger позволяет генерировать тепловые карты на основе записей в Foursquare. Т.е. если вы достаточно долго пользуетесь Forsquare для выставления отметок о своём местопребывании, вы сможете посмотреть на карту своего присутствия. Примерно так:


МАШИНА ПРОТИВ ТОЛПЫ

Согласно недавнему исследованию товарищей из Yelp, Inc. классификатор на основе Naive Bayes побеждает в схватке с Amazon’s Mechancial Turk в решении задачи верификации и классификации адресных данных различных организаций.