Чуваки, простой статистико-алгоритмический вопрос. Есть, допустим, 100 человек. И есть 10 000 наборов, где эти человеки встречаются (в одном наборе — от 1 до 100). И надо из этого дела посчитать кластеры — типа «вася-петя-маша чаще встречаются вместе, но отдельно от ани-кати-гали, которые тоже часто встречаются вместе».
куда смотреть? ‎· чудеса да как леший
Для начала на http://en.wikipedia.org/wiki/Community_structure , но там алгоритмы заточены на графы, а не на гиперграфы. Ещё на hMETIS, но она не столько обнаруживает кластеры, сколько делит гиперграф на заданное число максимально связных подграфов. ‎· тайный москвофил
Ну и дальше поиск по community structure + hypergraph, кажется, двигает в нужном направлении, например: https://docs.google.com/viewer?a=v&q=cache:rjXvPX3L2zUJ:cinjw... ‎· тайный москвофил
ох ё. я-то думал, это что-нибудь такое. классически простое. типа 5 строчек псевдокода :( ‎· чудеса да как леший
бмвхххххх ‎· möe
есть вот такая старая хорошая книжка в том числе при эти алгоритмы: http://shop.oreilly.com/product/9780596529321.do ‎· Alex Kapranoff
я не хочу книжку! я хочу исследовать один набор данных, сделать какие-нито выводы и поскакать дальше!!! ‎· чудеса да как леший
Ну вот по второй ссылке есть код для матлаба, который реализует описанный в статье алгоритм. Я могу заняться даже. ‎· тайный москвофил