Допустим, есть некий совершенно незнакомый огромный корпус текстов (лесбийская англоязычная проза XX века, допустим). Очевидно, что 98% из них - полное г. Каков алгоритм поиска алмазов в этой куче?
1) пользовательский рейтинг на сайте. 2) написать чьими-то силами скрипт прогона закавыченных названий текстов по гуглу и выстроить их по критерию, на что больше всего ссылок. это может не сработать, потому что название может быть частотным словосочетанием. пока в голову больше ничо не приходит ‎- this value is required
^ вот первая идея мне в голову почему-то не приходила. Попробую, спасибо. ‎- Белка-истеричка у аппарата
Когда-то гугл умел показывать именно места, где ссылаются на URL. Но, кажется, в отличие от 1) , в ссылках на может сильно играть общая популярность пэйринга ‎- USS Magey
^ я, в принципе, хотела не фемслэш, а как бы ориджиналы. Ну, любовные романы, вопрос терминологии. Но фемслэш тоже порою, да. ‎- Белка-истеричка у аппарата
Ещё есть ежегодные, кажется, конкурсы ориджиналов, где специальные группы мазохистов честно читают и оценивают конкурсные произведения. На выходе - несколько приличных вещей с названиями и именами авторов. Т.к. 99% от 99% полного г в данном корпусе является таковым не потому, что сюжет, скажем, неудачный, а просто потому что автор не умеет писать не то что романы и рассказы, а список продуктов, ... ‎- USS Magey
^ титаны духа! О, можно же порыть битву фандомов, наверное. Или как она правильно называется, на дайриках что-то такое мутили. ‎- Белка-истеричка у аппарата
^^ там были хорошие тексты, отвечаю. ‎- ~ирженька~