Сегодня были одни из самых психологически тяжёлых 15 минут в моей жизни разработчика (именно разработчика-в-вакууме, не сотрудника/коллеги/подчинённого/предпринимателя). Сейчас расскажу.
1. Значительную часть своего хобби-времени я сейчас трачу на разработку цепочки проектов для извлечения common knowledge из общедоступных источников, в основном Википедии. Мне это ужасно нравится, я всё время думаю что бы туда ещё прикрутить, развиваю и усложняю. ‎- новомодная имитация мышления
2. Самый зрелый из этих проектов — infoboxer, которым я тут хвастался: https://github.com/molybdenum-99/infoboxer — высокоуровневый «клиент к данным». Самая крутая (и сложная в разработке) его часть — парсер разметки Википедии, который превращает её в дерево и позволяет по ней всячески навигировать: https://github.com/molybdenum-99/infoboxer/wiki/Showcase. Я писал его два месяца, и насколько могу судить, он довольно уникален (вроде был какой-то ещё Java-проект похожий, без документации и странной степени живости, но) ‎- новомодная имитация мышления
3. Сегодня, придумывая одну штуку, я обнаружил в доках API MediaWiki формат выдачи parsetree. Полгода назад его там _кажется_ не было (я бы заметил!). Степень моего удивления передать словами очень, очень, очень тяжело. ‎- новомодная имитация мышления
4. Так что целых 15 минут, пока внимательно не проверил, и не понял, что он парсит только часть документа (templates), а остальное возвращает as is (и потому бесполезен для всего, кроме довольно узкого спектра задач), я был в слегка изменённом состоянии духа. ‎- новомодная имитация мышления
PS: а самое смешное, что для того, для чего я изначально затеял infoboxer, этого parsetree бы хватило. но сейчас я вижу, что в той задаче пригодится ВСЁ, что мой infoboxer умеет делать. ‎- новомодная имитация мышления
↑ кххх. то есть был задеплоен на Википедию ≈за месяц до начала разработки инфобоксера. что делает эту историю ещё более дебильной! (впрочем, я тогда внимательно всё проверил, включая сорцы медиавики — и, видимо, поняв, что полного дерева они всё равно не строят, вытеснил эту грустную историю из памяти) ‎- новомодная имитация мышления