Дорогие друзья! На Мокуме появился поиск, см. правую колонку. Важный disclaimer написан на странице https://mokum.ru/s Подсветка хэш-тэгов будет сделана в ближайшее время. Спасибо! #mokum-releases
Алексей, в следующих пресс-релизах, сообщающих о новых мажорных фичах, пожалуйста используйте оборот "Для тех пользователей, кому пока удобнее и лучше в Мокуме" (https://mokum.ru/freefeed/4395). Спасибо! ‎· screamager
^! ‎· many such cases
^^ !! ‎· жопасливый
Wow супер ‎· Naglfari
ТАДАМ! ‎· show up and be seen
ок опять внизу всё ‎· а ×
@squadette поставь ссылку на поиск в мобильном интерфейсе сверху тоже? ‎· liquidgold
Да, поставил, спасибо. Верстку поправим, сейчас ее программисты без присмотра делают. ‎· псы в рапиде
Дизайн от профессиональных программистов! ‎· всё это хуйня
Ты в курсе, что находятся в том числе посты, где поисковая фраза в комментарии того, кого я забанил? ‎· обломался весь банный день
нет! но я догадывался. поправлю, спасибо. ‎· псы в рапиде
Спасибо. По моим запросам (достаточно простым - "рельсы", "мокум", "Махоткин", "facebook") работает. Интересно, как технически все устроено. Не хватает выделения поисковой фразы в найденных постах. ‎· baluev
@baluev, выделение будет. устроено все простым Elasticsearch'ем в минимальной конфигурации с бесконечным потенциалом развития. ‎· псы в рапиде
В первую очередь поискала себя, нашла много интересного ). Спасибо! По произвольному дисплейнейму поиск не работает (https://mokum.ru/s?utf8=%E2%9C%93&q=%D1%82%D1%8B%D0%BA%D0%B0%D1%82%D1%8C+%D1%85%D0%BE%D1%80%D0%BE%D1%88%D0%BE&commit=Search), но это и не подразумевалось, наверное? ‎· за креативную орфографию
^ да, ищется только по постам и комментам ‎· псы в рапиде
Нашел один не баг - а особенность кролик и кроликами разные слова, что логично, но поскольку падеж/склонение я не помню - найти пост https://mokum.ru/aivanov/4669 не просто. Наверное надо подключать что-то вроде https://code.google.com/p/russianmorphology/ или аналогичного. ‎· Все собаки попадают в рай
@denistsyplakov - запрос вида "кролик*" находит указанный тобой пост ‎· secondary psychopathy
^! Спасибо. Пошел учить синтаксис запросов, ссылка на который уместно смотрелась бы мелким шрифтом справа под полем поиска. ‎· Все собаки попадают в рай
^ там lucene внутри. ‎· BSOD bluez
А автоподстановка там что использует (из чего берется)? ‎· Liber miser asperger
lucene я понимаю но я положим пойду найду lucene и почитаю но для порядка хорошо чтобы хелп был доступен без таких сложностей ‎· Все собаки попадают в рай
а) я вообще из этого треда узнал, что эта штука поддерживает звездочку. б) пока индекс вообще никак не конфигурировался, он строго дефолтный. ‎· псы в рапиде
^! улыбнуло про (а). Если можно я на анонимной основе приведу это в пример молодым инженерам как иллюстрацию того, что добавляя технологию T1 в современных приложениях ты часто вносишь в систему много совершенно неявных вещей и хорошо когда эти вещи безобидны как (title:foo OR title:bar)^1.5 (body:foo OR body:bar) ‎· Все собаки попадают в рай
конечно можно. ‎· псы в рапиде
да, ты же и так в курсе что кроме полнотекстовых полей там есть ещё и просто значения, и если теги выдрать и положить отдельным (multivalue) полем, то поиск по ним будет побыстрее и без магии? ‎· российский соотечественник
а если дальше положить в отдельные поля экспрессию генов OH WAIT ‎· российский соотечественник
^ хорошая идея. то есть можно не ебаться с токенизатором Люсина, круто! ‎· псы в рапиде
"хештеги будут делаться отдельным сервисом" (c) (tm) ‎· screamager
Ну там есть обычные поля, токенизируемые поля, и всё это может быть хранимым или нет. В принципе из этого легко делается NoSQL, и многие так и делали, вот скажем Doug Cutting... Хм, да. Или мы. Полнотекстовые поля при этом остаются приятным бонусом и источником вселенского счастья, если издалека смотреть. ‎· российский соотечественник
^^ мне кажется, кстати, что ноги у этой фразы растут из чего-то такого: http://www.michael-noll.com/blog/2013/01/18/implementing-real... — условный "анализ хэштегов" часто используется в качестве примера применения всяких storm, spark, samza, — "бигдаты", короче. Наверное, сработал какой-то short-circuit, что раз "хэштеги", то и бигдата, а значит надо КЛАСТЕР ХАДУПОВ С ЛЯМБДАМИ подымать. ‎· адский хардлайн в засаде
^^ а про идею использовать эластик как основной стораж aphyr уже писал %) ‎· адский хардлайн в засаде
@squadette со стандартным токенизатором ебаться не надо, его надо выкинуть и писать свой : / и парсер запросов тоже, потому что стандартным, в частности, можно вынести нахуй эластик and/or подглядывать в чужое. ‎· смешная третья опция
подглядывать в чужое? все, что я сейчас забираю у эластика – это список post_ids, который потом фильтруется стандартным фильтром. а по какой спеке надо писать свой? и почему опен-сорсное коммьюнити этого еще не сделало? :) ‎· псы в рапиде
ну мы-то не должны тебе врать про meaningful contributions? :) ‎· российский соотечественник
мммм? не понимаю фразы ‎· псы в рапиде
Я неудачно шучу. Вообще-то я о том что засабмитить что-то ощутимо полезное в лосин — это очень и очень нефиговая (мак предлагает "нефритовая", подозреваю камасутру) работа. Переписать парсер запросов под себя, чтобы собрать люсину тот AST, который тебе в самом деле нужен —это достаточно много работы, чтобы к окончанию осталось хоть какое-то желание еще и вылизывать свой код до пристойного пуллреквеста, и рассказывать что именно твой частный случай спасет всех. Прости, я подозреваю, что ты и так все это знаешь, а я плохо объясняю глупую шутку. ‎· российский соотечественник
да не, я не то что бы это прямо знаю. У нас в андеве была адская совершенно залепуха навернута поверх эластика, ее @spariev на кложуре написал. как обычно, эта залепуха бы не помешала многим, но я не помню статуса ее сабмита в опен-сорс. Также я помню Бабу Зою: https://linkedin.jira.com/wiki/display/BOBO/Realtime+Faceting... ‎· псы в рапиде
а) морфология будет б) ну ты бы ждал, а я бы вот не ждал — но ты небось и Бингом как дефолтным поисковиком пользуешься? в) да, пустые экраны я буду нормально обрабатывать, там есть три разных кейса, которые надо показывать. спасибо! ‎· псы в рапиде
ну, то есть, все ожидают google experience. ‎· псы в рапиде
Про бинг смешно!!! ‎· liquidgold
если вдруг будет интересно посмотреть морфологию, у нас (SemanticAnalyzer) есть такая под lucene / solr / elasticsearch. Она типа платная, но ради мокума нежалко :) ‎· This is a deep learning bot
@ffdk1 О, круто! И sentiment analysis поставить до кучи. ‎· many such cases
^ ого! http://semanticanalyzer.info/blog/products/? спасибо, напишу! ‎· псы в рапиде
да, это мы. ‎· This is a deep learning bot
@pgms всегда пожалуйста. Не знаю, какой сейчас трафик на мокуме, но если не десятки тысяч в день, то можно подключить сентимент. Даже интересно, что покажет на таких данных. ‎· This is a deep learning bot
http://semanticanalyzer.info/blog/ говорит Error establishing a database connection. Mokum- эффект ? ‎· наносит вред репутации енотов
@Сударь съ котофеемъ да, видать все мокумщики дружно полезли смотреть и база легла. Уже восстановил. ‎· This is a deep learning bot