T-SNE MDS

Aleksey Tikhonov
Altsoph’s blog
Published in
1 min readAug 28, 2012

Нашёл относительно свежий алгоритм для MDS (укладки многомерных данных в пространство с низкой размерностью), называется t-SNE. Из достоинств заявляется эффективность и качество работы. Вот пример прогона на датасете из 6000 рукописных цифр:

В описании авторы сравниваются с известными аналогами (Isomap, Sammon mapping, CCA и т.п.), причём на всех демо-примерах — в свою пользу. Логика работы достаточно несложная — в качестве меры близости точек используется вероятность для второй точки быть выбранной в качестве соседа первой при условии гауссова распределения вероятности в пространстве параметров. Это хорошо ложится под градиентый спуск, отсюда неплохая эффективность. Плюс несколько костылей против “слипания” точек и для работы с большими датасетами.

На родном сайте помимо всяческих научных статей уже доступно несколько реализаций (в том числе под MatLab, R и голый питон).

--

--