Avatar for ati
ati» from archive
And there you have the glory of a public spectacle.What any of them died for we don’t know. For, of them any ways of understanding the Great War, the standard ones are like bright-colored balloons - you have to hold on to them or they blow away.
Comment
Andthereyouhavethegloryofapublicspectacle.Whatanyof themdiedforwedon’tknow.For,ofthemanywaysofunderstanding theGreatWar,thestandardonesarelikebright-coloredballoons;120 MILITANTMESSIAHS youhavetoholdontothemortheyblowaway. Note: mobs messiahs and markets Shared on June 29th, 2011 from Kindle See recent activity from Alexander From a Personal Document ‎· ati
Comment
we all hate pdf as a (non-existent) logical markup language, don't we. ‎· 9000
Comment
Но... КАК? ‎· ati
Comment
да вопрос-то к амазону. а вам сочувствие. ‎· 9000
Comment
Видимо это хитровыделанный pdf, в котором роль пробелов исполняет секретный агент юникодных таблиц. На вид он не отличается ничем, единственная разница - киндла не показывает перевод слов при подведении курсора. Т.е. внутри себя она тоже не разделяет слова, хотя, опять-таки курсор прыгает именно по словам, как и в остальных книжках. Зогатко, короче говоря. ‎· ati
Comment
PDF может состоять вообще из одних кривых, без всяких явных букв. Нередко слова совершенно произвольно позиционируются на странице, без применения пробелов (как символов). PDF хорош для точного воспроизведения картинки, и больше ни для чего. Увы, традиция рассматривает книгу как картинку, напечатаную на бумаге, а сейчас хочется-то иного. ‎· 9000
Comment
PDF создавался как упрощённое (по сравнению с PostScript) и цельное (со стандартным встраиванием шрифтов и гарантией что не требуются внешние ресурсы) средство для обмена вёрсткой между издательством и типографией :) ‎· бородат и духовно хвостат
Comment
ну буквы там явно есть. Оно же постит на амазон буквы. -- https://kindle.amazon.com/post/2G3LPIVVU4WH7 ‎· ati
Comment
а вот пробелы, кажется, В КРИВЫХ! ‎· ati
Comment
Букв там на самом деле в явном виде нет. Есть индексы глифов, которые в простых случаях совпадают с ascii кодом символа. ‎· Стадо овец
Comment
оо! круто. вы поднимаете мне веки. ‎· ati
Comment
@aivanov Или даже с unicode. Что вообще-то рекомендуется. Но не обязательно... ‎· бородат и духовно хвостат
Comment
любопытно, насколько хорошо можно автоматически вставлять пробелы в "сплющеную" строку? ‎· ati
Comment
В 2003/2004, когда я последний раз пробовал что-то делать с PDF форматом, пробелы вставлялись при помощи несложного эвристического алгоритма. Предполагалось, что шрифт в строке одинаковый почти везде, поэтому можно было собрать координаты от bounding boxes и по ним уже прикинуть, где пробел, а где просто spacing между фрагментами текста, чтобы красивее выглядело на печати. ‎· Стадо овец
Comment
Аха, понятно. Но я имел в виду, что на входе не PDF, а уже испорченая строка. ‎· ati
Comment
Авторазбивалка на слова тоже приходила мне в голову. ‎· 9000
Comment
На мой дилетантский взгляд без словаря такую задачу не решить. ‎· Стадо овец
Comment
Хотя вот от университета остались смутные воспоминания, что данная задача является стандартной для китайского языка и как-то решается статистическими методами. ‎· Стадо овец
Comment
Гугл вроде бы как-то разбивает. -- http://www.google.com/search?q=Andthereyouhavethegloryofapubl... ‎· ati
1 2 3 4 5 6 7 8 9 10

2015-2018 Mokum.place