User avatar
» posted to mokum-support

пост со словом "Ж.-П.Сартр" (без пробелов) не находится по слову "Сартр", а было бы неплохо

Comment

да-да, причем я не понимаю чем его подбить спереди (видимо, ничем), чтобы выцеплять то, что отягощено чем-то безпробельным впереди искомого

 ‎· (моя мышь того же мнения)
Comment

Считать токеном и фамилию, и полное слово?

 ‎· bardo calling
Comment

да, типа по точкам токенизировать в том числе (но я не знаю настроек нынешнего токенайзера)

 ‎· крылолёт буеров
Comment

/наивным голосом/ а нельзя сделать чтобы звездочка в начале слова работала, а не только в конце?

 ‎· (моя мышь того же мнения)
Comment

со звёздочкой в начале большая беда, на самом деле

 ‎· крылолёт буеров
Comment

@hotgiraffe PCRE перестает помогать?

 ‎· Ітоги подвєдьом
Comment

ых, ну как PCRE поможет строить индекс или выбирать из него?

 ‎· крылолёт буеров
Comment

в общем, битва с токенизатором и вариантами пунктуации это проигранная битва. но мы еще посмотрим.

 ‎· псы в рапиде
Comment

Если вариантов токенизации больше одного, можно индексировать их все.

 ‎· 9000
Comment

@9000: это понятно, вопрос в том, как токенизировать. теперь, впрочем, когда мы знаем язык, можно позволить себе раздельные токенизаторы. посмотрим, все равно поиск еще доделывать.

 ‎· псы в рапиде

1 2 3 4 5 6 7 8 9 10