Oh Wow: https://morph.io/. 1) пишешь скрепер каких-нибудь открытых данных на любом ЯП; 2) выкладываешь на GitHub; 3) подключаешь на morph.io (free & open); 4) имеешь публичный общедоступный API с любыми данными, которые раньше только в HTML были. Ебануться.
Если они в принципе взлетят — интересно, через сколько часов их прикроют, потому что на сайт загружены скреперы амазона, гугла, фейсбука и т.п.? На данный момент документация на тему таких вещей весьма скупа: «Please keep things legal. Don't scrape anything you're not allowed to. If you do end up doing anything you're not allowed to, it's your responsibility not ours.» ‎- новомодная имитация мышления
скажем, выложены где-нибудь судебные решения (по закону об открытых данных) — обычно HTML в дикой вёрстке. загружаешь парсерчик маленький вот туда: и всё, по адресу morph.io/moscow-court.json — красиво отформатированные и доступные данные (ты не думаешь о хостинге, о регулярном запуске парсера и т.п.) ‎- новомодная имитация мышления
да, богатая тема. ‎- wisdom of wombats