Нам пишут: «https://en.wikipedia.org/wiki/Dunning–Kruger_effect — это не про статью, а про то, как Мокум распарсит адрес статьи с тире»
Да. Фейсбук тоже так с тире поступает ‎- абонплата за листопад
Я даже не знаю, баг ли это. Потому что иначе надо половину Юникода захватывать при парсинге ‎- абонплата за листопад
А почему его браузер не отэскейпил, кстати? (не то, чтобы я понимал, как это работает) ‎- zrslv
Хммммм. Ack. ‎- псы в рапиде
@zrslv Я плохо понимаю, по каким правилам браузеры копируют в буфер обмена из адресной строки. ‎- абонплата за листопад
Если бы директором был я, я бы захватывал всё от "https?://" до первого пробела, потом отрезал бы справа вещи вроде ").". Надо, конечно, сначала попробовать на массиве URL-ов из постов и посмотреть, не слишком ли радикально. ‎- 9000
Юникодные эмодзи. ‎- zrslv
@9000, интуитивно кажется, что это слишком простое решение, чтобы оно не пришло в голову фейсбуковским инженерам (и например людям, которые писали парсер для Ruby). Но навскидку я тоже не понимаю, what could possibly go wrong. ‎- псы в рапиде
Как fb парсит тот же URL из википедии? ‎- 9000
Так же, как и в посте. С ошибкой. ‎- easiest cat to pill
Facebook iOS app парсит этот урл нормально, кстати. ‎- псы в рапиде
TIL, NSDataDetector, который как раз успешно детектит ссылки, покрыт патентом — http://www.google.com/patents/US5946647 ; и эпл его использовали чтобы htc судить ( https://www.cocoanetics.com/2011/12/apples-patent-on-nsdatade... ) ‎- адский хардлайн в засаде
@squadette nothing possibly could go wrong, кроме того, что "отрезать справа вещи вроде ').'" это плохое частное решение. Там вообще какая угодно пунктуация может быть "посмотри, какой котик на http://goatse.cx!", "когда я захожу на http://mokum.ru, у меня случается регрессия", "это у вас из http://iconfinder.com?", "и тут он мне говорит «зайди на мой сайт http://ilyabirman.ru»", и так далее, и тысяча тому подобных. Проще не резать по пробелу (уайтспейсов, кстати, в юникоде тоже жопой жуй) и потом дорезать по таблице, а отрезать всё, что не RFC 3986, а потом отдельными правилами хендлить популярные частные исключения, вроде как с википедией. ‎- zrslv
^ бгг, а " там откуда взялся :D ‎- zrslv
ну это один из багов, да. у меня кстати нет идеи все делать "проще". Уж как-нибудь \S в 2015 году поймет, что "уайтспейсов в юникоде жопой жуй", да. ‎- псы в рапиде
https://mokum.ru/squadette/4120 исправили. и кстати все кейсы @zrslv тоже перестроились корректно. ‎- псы в рапиде