Чуваки, простой статистико-алгоритмический вопрос. Есть, допустим, 100 человек. И есть 10 000 наборов, где эти человеки встречаются (в одном наборе — от 1 до 100). И надо из этого дела посчитать кластеры — типа «вася-петя-маша чаще встречаются вместе, но отдельно от ани-кати-гали, которые тоже часто встречаются вместе».
Для начала на http://en.wikipedia.org/wiki/Community_structure , но там алгоритмы заточены на графы, а не на гиперграфы. Ещё на hMETIS, но она не столько обнаруживает кластеры, сколько делит гиперграф на заданное число максимально связных подграфов. ‎- крадецът на ябълки
Ну и дальше поиск по community structure + hypergraph, кажется, двигает в нужном направлении, например: https://docs.google.com/viewer?a=v&q=cache:rjXvPX3L2zUJ:cinjw... ‎- крадецът на ябълки
ох ё. я-то думал, это что-нибудь такое. классически простое. типа 5 строчек псевдокода :( ‎- новомодная имитация мышления
бмвхххххх ‎- möe
есть вот такая старая хорошая книжка в том числе при эти алгоритмы: http://shop.oreilly.com/product/9780596529321.do ‎- Alex Kapranoff
я не хочу книжку! я хочу исследовать один набор данных, сделать какие-нито выводы и поскакать дальше!!! ‎- новомодная имитация мышления
Ну вот по второй ссылке есть код для матлаба, который реализует описанный в статье алгоритм. Я могу заняться даже. ‎- крадецът на ябълки