в то время как космические корабли бороздят. скажите, а, например, можно взять какой-то практический ML и решить задачу "адаптивно выделить в таблице три зоны -- названия строк, колонок, и числа в сердцевине"?
скажем, можно для этого сделать штук сто экспертно размеченных таблиц. чему их скормить? ‎· больше не буду
семь вечера пятницы, самый праймтайм для такого вопроса! ‎· больше не буду ‎· 1
А в чём именно задача? Есть таблица, отличить числа от строк? Или название может быть числом? Чему именно надо научить алгоритм? Почему нужен именно ML, а не что-то простое? Или под «таблицей» вы подразумеваете её изображение? ‎· !You ‎· 2
зависит от таблиц. в ближайшей окрестности для этого использовали несложный набор правил или ручную разметку там где нельзя ошибаться. у гуглеров есть несколько статей про таблицы с веба, там может найтись что-нибудь интересное (для затравки: http://ai2-s2-pdfs.s3.amazonaws.com/ca04/4fd0d3360d24c65a9c4b...). ‎· marat ‎· 1
@bofh задача -- есть сотня таблиц из дикой природы (то есть сделанные вообще совсем как попало и кем попало), надо автоматом выделить из них названия колонок, строк и собственно данные. проблемы можно оценить, например, по абстракту и введению статьи Nagy G, Tamhankar M. Vericlick: an efficient tool for table format verification. InIS&T/SPIE Electronic Imaging 2012 Jan 22 (pp. 82970M-82970M). International Society for Optics and Photonics (или вот выше ссылка, или любая другая). ‎· больше не буду
@marat спасибо. только хотелось не рисерч затевать а сунул вынул и пошел. ‎· больше не буду
@larhat на первый взгляд очень в тему, спасибо. ‎· больше не буду