Заметки на полях...

Omne ignotum pro magnifico est...

среда, Декабрь 28, 2005

Я сделал это!

Я сделал это! После долгих мытарств (то времени нету, то криво получается, то настроение не креативное, то еще что-нибудь), я наконец-то реинкарнировал блог проекта Астротоп. Заодно сделал новый дизайн для блога в частности и для проекта в целом. Блог работает на textpattern...

воскресенье, Декабрь 25, 2005

Вечная песнь звезд…

Оказывается знаменитая фраза о существовании “музыки небесных сфер” не простая метафора! Люди уже дошли в своем любопытстве до того, что начали подслушивать разговор звезд.

суббота, Декабрь 24, 2005

How Much Is My Blog Worth?

Зашел вчера на мерялку блогов в денежном эквиваленте и хохмы ради проверил стоимость своего блога Alter World, который не виден уже уйму времени. Результатом проверки я был очень удивлен – стоимость блога была более 10000$, о чем свидетельствует бланк ниже.


My blog is worth $10,161.72.
How much is your blog worth?



То же самое, сделанное сегодня, дало другую сумму.


My blog is worth $7,903.56.
How much is your blog worth?



Сначала я удивился такому положению дел. Потом припомнил, что в первом случае оканчивающий слеш я не ставил, а во втором – ставил. Подумал над этим и удивился еще больше – получается, что можно в блоге посчитать стоимость каждой страницы!.. Потом решил провести аналогичный эксперимент для этого блога – сумма оказалась одинаковой. Теперь даже и не знаю, что думать по этому поводу... Наверное действительно надо попытаться померять стоимость нескольких страниц.

пятница, Декабрь 23, 2005

Question...

ааааааагеееееееззииииккккллммммннннооооопрррссстттучыыьь,?

среда, Декабрь 21, 2005

Йох! Унлау!

Странное что-то со мной творится в последние дни... Чувствую себя обыкновенным плебеем. Куча дел накопилась, не терпящих отлагательства, а у меня не получается заставить себя их хорошо сделать. На этой почве, кстати говоря, я, наверное, скоро заполучу себе хороший такой комплекс неполноценности.

Вот вчера, на занятиях по верстке в очередной раз поймал себя на том, что у меня физически не получается запомнить все правила русского языка и правила верстки неэлектронных документов от и до. И правил вроде как не сильно много, но что-то постоянно забываю, а когда вспоминаю, то, как правило, бывает уже поздно. И это меня неимоверно бесит до чертиков! Ведь если взялся что-то делать, то хочется это сделать профессионально, а получается что-то не очень...

С электронными документами ситуация еще веселее – если в полиграфии с типографикой еще как-то можно разобраться и результат твоей работы будет нормально выглядеть где бы то ни было, то с веб страницами такого фокуса уже не получается. Ужасно!

С дизайна меня тоже в последнее время плющит... У меня даже завелось пару идей фикс, которые, в общем-то, не плохи. Первая такая идея сидит довольно давно и нудит, а смысл её можно сформулировать так: "Дизайн должен быть с человеческим лицом". Казалось бы, очевидный факт и все о нём прекрасно осведомлены, но вот почему-то при этом таких дизайнов мало попадалось. Точнее говоря, мне попадались человеческие очертания в элементах дизайна, но редко когда во всём дизайне сразу. Начинаешь верстать такой – с человеческим лицом, в моём понимании, конечно – дизайн и вроде как симпатично и хорошо получается (по отзывам тех, кто мои поделки видел), но... чувствую, что что-то в них не хватает или что-то не так... Результат: мне такой дизайн нравится всё меньше и меньше, и я его выкидываю в долгий ящик в лучшем случае. В худшем – вообще выкидываю. Вторая идея плавно вытекает или втекает (зависит от точки зрения) из первой идеи и формулируется она примерно так: "Дизайн должен быть живым". Но тут я с ужасом понимаю, что чем более живым дизайн будет натурально, тем более жуткие нагрузки будут испытывать браузеры, каналы передачи данных и люди, в конечном счете. Встаёт проблема кванта дизайна. Собственно говоря, я вчера вечером окончательно продумал, как должен работать параметрический дизайн, который является жалким подобием живого дизайна. При этом квант дизайна будет не сильно большим, и нагрузка будет минимальной, но... заметить всю прелесть этой технологической ножки будет сложнее. Хотя кто-то может и оценит всю глубину и прелесть такого подхода к дизайну и сделает её лучше, но... почему-то еще никто не додумался до очевидного. Или додумался, да я не знаю. Или уже делали, да забросили за бесперспективностью. Или может я просто редкостный слепец в этом вопросе. Плохо, что сейчас нет доступа извне до наших универовских хостов, а то можно было бы показать идеи в живую (правда, нужно её еще воплотить в код). Кстати говоря, об универе. Я же поднял таки блог-хостинг для студентов нашего факультета! Уже есть первые ласточки. Правда, пришлось вчера начать публикацию самопального how-to по wordpress-μ на своем "рабочем" блоге. Может потом оно пригодится не только нашим студентам...

Человечность и профессионализм меня преследуют и в программировании – меня ужасно расстраивает тот факт, что программный код у меня получает не оптимальным и не универсальным.

Уф... Рассказал я тут вам практически классическую басню, вот только мораль у неё простая, освещенная веками – для получения хороших результатов нужно непрерывно работать и учиться.

вторник, Декабрь 20, 2005

Статистика удобочитаемости: расшифровка sor

Уровень образования

Этот показатель основан на образовательном индексе Флеша-Кинсайда и показывает, каким уровнем образования должен обладать читатель проверяемого документа. Подсчет показателя делается на основе вычисления среднего числа слогов в слове и слов в предложении. Значение показателя варьируется от 0 до 20. Значения от 0 до 10 означают число классов школы, оконченных читателем. Следующие пять значений — от 11 до 15 — соответствуют курсам высшего учебного заведения. Высшие пять значений относятся к сложным научным текстам.
Рекомендуемый диапазон значений этого показателя: от 8 до 10.

Легкость чтения

Данный показатель основан на индексе легкости чтения Флеша. Показатель подсчитывается по среднему числу слогов в слове и слов в предложении и варьируется от 0 до 100. Чем выше значение показателя, тем легче прочесть текст и тем большему числу читателей он будет понятен.
Рекомендуемый интервал значений для обычного текста: от 60 до 70.

Число сложных фраз

Этот показатель показывает в процентах, какое количество сложных фраз содержится в проверенном тексте. Сложными считаются фразы с относительно большим количеством знаков препинания, перегруженные союзами, местоимениями, прилагательными и т.д.
Нормальным количеством сложных фраз можно считать 10—20%.

Благозвучие

Данный показатель указывает на удобочитаемость текста с фонетической точки зрения. Подсчет показателя основан на вычислении среднего количества шипящих и свистящих согласных. Интервал изменения показателя: от 0 до 100.
Рекомендуемый диапазон значений: от 80 до 100. Этот индекс указывает на удобочитаемость текста с фонетической точки зрения.

[via Научная работа библиотекарей на персональном компьютере]

P.S. Ура-а-а!!! Я учусь в 6-м классе школы по версии Word'а...

Индекс удобочитаемости блога "Кто-то ещё и я"

Продолжая тему исследования удобочитаемости текстов я взял на себя смелость проверить на неё - удобочитаемость - блог заведомо умного и творческого человека - Юлии.

Word для её блога выдал такую статистику:

Всего в тексте слов: 10813
Всего в тексте символов: 65342
Всего в тексте абзацев: 337
Всего в тексте предложений: 894

Среднее количество предложений в абзаце: 2,6
Среднее количество слов в предложении: 11,8
Среднее количество символов в слове: 5,6

Показатели легкости чтения:
Уровень образования (1-20): 6,6
Легкость чтения (0-100): 82,4
Число сложных фраз (в %): 5,7
Благозвучие (0-100): 90,2


Что дает в результате индекс удобочитаемости блога "Кто-то ещё и я" по Деверу равным 4,338.

Индексы удобочитаемости наших блогов оказались схожими...

Продолжение следует...

понедельник, Декабрь 19, 2005

Индекс удобочитаемости по Деверу

Итак, я таки положил на аналитический стол самого себя и подверг свой блог проверке на удобочитаемость повторно. В качестве материала для обработки послужили практически все тексты в этом блоге, которые я писал сам. Цитаты и слямзенное в анализ не входило. Более того, в этот раз я взял больший массив данных, чем при пришлом исследовании.

Теперь о том, что же считалось. Индекс удобочитаемости в общем случае показывает насколько хорошо тот или иной текст будет понятен реципиентам. Единого взгляда на этот индекс в научных кругах нет и поэтому он считается по разным алгоритмам. Индексы в основной своей массе используются для объективной оценки качества учебных текстов. Самым простым в рассчетах является индекс удобочитаемости по Деверу, который рассчитывается по формуле:

ДИУ=1,56*длина слов + 0,19*длина предложения – 6,64.


По этому методу Девера средняя длина слов высчитывается на основании числа буквенных мест. В число буквенных мест включается как каждый звук пунктуации, так и каждое пустое место между двумя словами. Если текст перепечатан на пишущей машинке, то легко можно вычислить точное число буквенных мест. Когда мы разделили это число на число слов в образце текста, то получили среднюю длину слова. Вторым элементом является средняя длина предложения, которая находится путем деления числа слов на число предложений. [Мария Крсманович. Методы исследования удобочитаемости учебных текстов. // Проблемы школьного учебника. Выпуск 2. – Москва, Просвещение, 1974, С.112]

Итак, нас интересует средняя длина слова и средняя длина предложения. Прекрасно! Именно это мы можем заполучить у Word'а.

Вот какую статистику по моему блогу он мне выдал:

Всего в тексте слов: 9447
Всего в тексте символов: 62487
Всего в тексте абзацев: 151
Всего в тексте предложений: 609

Среднее количество предложений в абзаце: 4,0
Среднее количество слов в предложении: 14,8
Среднее количество символов в слове: 5,3

Показатели легкости чтения:
Уровень образования (1-20): 6,9
Легкость чтения (0-100): 78,4
Число сложных фраз (в %): 1,4
Благозвучие (0-100): 90,5


Что мы имеем? Во-первых, необходимые для рассчетов индекса данные. Во-вторых, чем больший массив данных обрабатывается, тем более объективная оценка "качества текста" получается (сравните с ранее полученными результатами на меньшем объеме данных). Подставляем необходимые данные в формулу и получаем, что индекс удобочитаемости блога "Заметки на полях..." по Деверу равен 4,44. Неплохой результат, надо сказать...

Для большинства эта цифра ничего не говорит - я это прекрасно осознаю. Чтобы "разговорить" её, нужно вооружиться несколькими умными книжками по исследованию текстов или сравнить результаты с другими (скажем, проанализировать на удобочитаемость несколько блогов и сравнить свои субъективные ощущения с объективными данными). Второй вариант в данном случае предпочтительнее, т.к. он будет более наглядным. К тому же последнее можно автоматизировать за счет RSS-фидов блогов (во только результаты очень грубые будут получаться).

Продолжение следует...

четверг, Декабрь 15, 2005

Удобочитаемость, часть 2

В прошлый раз я немного схитрил и ограничился той информацией, что мне выдал Word в качестве индекса удобочитаемости. Честно говоря, я не знаю, какой именно индекс удобочитаемости рассчитывает Word, поэтому собираюсь посчитать индексы "вручную", благо, что когда-то в силу научных интересов приходилось этим заниматься. :) К сожалению, LIX руками считать довольно муторно, а скрипт писать некогда, так что придется ограничиться рассчетом долько ДИУ. Есть ли желающие попасть на аналитический стол?

вторник, Декабрь 13, 2005

Блоги

Вот и Mail.ru обзавелся блог-сервисом, вслед за Рамблером. Надо полагать, что скоро могут появиться интересные блоги и там, и там...

Закон бутерброда

Философы утверждают, что бутерброд всегда падает маслом вниз. Из этого утверждения вытекает любопытное следствие: если бутерброд намазать маслом с двух сторон, то он будет кататься по полу, переворачиваясь со стороны на сторону. Еще более катастрофический результат ждет этот несчастный бутерброд, если его намазать маслом со всех сторон - при падении его разрывает на куски.

понедельник, Декабрь 12, 2005

Хитрый RSS-аггрегатор

Задача такая: нужно собирать RSS|ATOM-feed'ы из разных источников и отдавать оные одним или несколькими потоками (по категориям или тегам, которые задаю я) в виде RSS|ATOM-feed'а. Можно написать самому, но вполне возможно, что есть уже что-то готовое (в виде сервиса) на просторах сети - попадалось кому?

воскресенье, Декабрь 11, 2005

.astro | The world of day night...

The Day...


...and the Night...


...the whimsical image intertwine in this strange World of Day Night and Night Day...


...The World of Strange Dreams...

суббота, Декабрь 10, 2005

Удобочитаемость

В прошлые разы я уже заикался о темном деле, под названием "исследование" - теперь я приоткрою некоторую часть завесы тайны. На самом деле мне стало интересно, насколько хорошо может восприниматься материал, написанный мною и другими людьми. Естественно, при этом хотелось бы получить объективные данные. Потом я припомнил такую вещь, как удобочитаемость и то, что статистику удобочитаемости может предоставить Microsoft Word. Конечно для любого статистического исследования массив данных должен быть достаточно большим - в моем случае в вордовский файл были слиты практически все мои заметки из этого блога (годичный труд). Критично было то, что они должны были быть именно моими! К счастью, таких у меня абсолютное большинство. Итак, обработав тексты (строгое соблюдение правил), Word выдал следующее заключение:
Среднее количество предложений в абзаце: 5.5
Среднее количество слов в предложении: 15.5
Среднее количество символов в слове: 5.3

Уровень образования: 7.2 (максимум 20 единиц)
Легкость чтения: 77.0 (максимум 100 единиц)
Число сложных фраз: 2.4%
Благозвучие: 90.4 (максимум 100 единиц).


В принципе неплохое заключение, но на две вещи в нем необходимо обратить внимание. Во-первых, я делаю слишком большие предложения - в среднем по 15 слов, что довольно затруднительно читать. Значит мысли нужно излагать более коротко. Во-вторых, у меня низкий уровень образования - это ещё более тревожный сигнал. Скорее всего он стал таким из-за того, что я часто использую слова из сленга и не всегда удосуживаюсь правильно расставлять знаки препинания. Значит придется по возможности отказаться от сленга и более внимательно отнестись к пунктуации.

Теперь попытаемся провести аналогичные проверки у других людей, ведущих свои древники.

Первой мне под руку попалась Юлия Ромашкина со своим дневником "Кто-то ещё и я". Собственно говоря после ознакомления с её трудами Word выдал следующее:
Среднее количество предложений в абзаце: 5.7
Среднее количество слов в предложении: 14.4
Среднее количество символов в слове: 5.4

Уровень образования: 6.8 (максимум 20 единиц)
Легкость чтения: 79.2 (максимум 100 единиц)
Число сложных фраз: 4.3%
Благозвучие: 90.5 (максимум 100 единиц).


Как видим Юлия также как и я склонна к витиеватому постоению предложений. Ну а уровень образования был существенно занижен Word'ом из-за обилия смайликов в тексте - у него напрочь отсутствует чувство юмора... Впрочем, ничего удивительного - он же не имеет эмоций.

Следующий подопечный Word'а - Рад, автор Radoblog'а, со следующим приговором:
Среднее количество предложений в абзаце: 3.5
Среднее количество слов в предложении: 10.2
Среднее количество символов в слове: 5.1

Уровень образования: 4.3 (максимум 20 единиц)
Легкость чтения: 89.6 (максимум 100 единиц)
Число сложных фраз: 1.2%
Благозвучие: 89.4 (максимум 100 единиц).

Пока что у Рада самые лучшие показатели. Такой невероятно низкий уровень образования связан с англорусским языком и сленгом, которые применяются на блоге весьма обильно.

Теперь посмотрим, что получится в качестве результата для дневника InfoReDesign Дениса Перехреста (как-никак один из самых популярных блогов).
Среднее количество предложений в абзаце: 3.0
Среднее количество слов в предложении: 10.9
Среднее количество символов в слове: 5.2

Уровень образования: 4.6 (максимум 20 единиц)
Легкость чтения: 88.2 (максимум 100 единиц)
Число сложных фраз: 1.0%
Благозвучие: 90.1 (максимум 100 единиц).

Как видим абзацы у Дениса коротенькие, а с образованием такие же трудности, что и у остальных - печально.

Следующий дневник-герой лишь немного менее популярен InfoReDesign'а - Лаборатория Стрелка. Word подумал-подумал и выдал:
Среднее количество предложений в абзаце: 6.4
Среднее количество слов в предложении: 9.7
Среднее количество символов в слове: 5.5

Уровень образования: 5.7 (максимум 20 единиц)
Легкость чтения: 86.6 (максимум 100 единиц)
Число сложных фраз: 0.1%
Благозвучие: 90.7 (максимум 100 единиц).

Вот кто у нас пишет самым простым языком! Учитесь, коллеги! А благозвучие? Лучшее (пока что)! Вот только с образованием небольшие проблемы - из-за пунктуации?

Следующий подопытный - Slaff, которого мой Word особо не взлюбил за англоиспанорусский язык:
Среднее количество предложений в абзаце: 3.2
Среднее количество слов в предложении: 11.4
Среднее количество символов в слове: 5.3

Уровень образования: 5.6 (максимум 20 единиц)
Легкость чтения: 85.2 (максимум 100 единиц)
Число сложных фраз: 1.1%
Благозвучие: 90.8 (максимум 100 единиц).

В целом показатели приемлемые, вот только мне теперь интересно стало, а этот самый Word когда-нибудь вообще начисляет более 10 единиц за уровень образования?

Следующей в списке идет Блогиня со следующей статистикой:
Среднее количество предложений в абзаце: 4.7
Среднее количество слов в предложении: 14.5
Среднее количество символов в слове: 5.3

Уровень образования: 6.8 (максимум 20 единиц)
Легкость чтения: 79.0 (максимум 100 единиц)
Число сложных фраз: 0.6%
Благозвучие: 90.3 (максимум 100 единиц).

Впечатляющие результаты - чуть ли не самые лучшие по всем показателям!

В качестве заключения в моем списке идет "Маниакальный Веблог" Ивана Сагалаева:
Среднее количество предложений в абзаце: 1.9
Среднее количество слов в предложении: 12.4
Среднее количество символов в слове: 5.5

Уровень образования: 6.8 (максимум 20 единиц)
Легкость чтения: 81.2 (максимум 100 единиц)
Число сложных фраз: 1.1%
Благозвучие: 90.5 (максимум 100 единиц).

Такое странно малое количество предложений в абзаце случилось из-за кода, приводимого в статьях.

Вот такое небольшое исследование получилось, которое является практически очередной раздачей слонов и не внесет сущесвтенного вклада, к сожалению. В принципе каждый может провести его сам и сам для себя же сделать выводы.

Universe


пятница, Декабрь 09, 2005

"Эксперимент"

Почти сутки назад я сетовал на свою память и заикнулся об «исследовании»… По зрелому размышлению я пришел к выводу, что исследование нужно начинать с себя. Теперь осталось сделать репрезентативную выборку и провести «измерительный эксперимент». Надеюсь, что оно того стоит, а то как бы снова не получилось – все это суета сует и томление духа…

четверг, Декабрь 08, 2005

Моя плохая память

Вот как всегда – постоянно забываю сделать интересные вещи. В прошлую пятницу я к примеру собирался выпустить свежий номер Blog Times, но так и не сделал этого, ибо на выходных сперва забегался по делам, а потом, вечером, когда я уже освободился, я про него благополучно забыл. (

Сегодня вечером (ранним) я набросал для себя план небольшого исследования нескольких блогов (точнее блоггеров), да так и забыл про него более поздним вечером – переувлёкся фильмом Alone Dark, который был заряжен на переоцифровку (из 6 Гб DVD получить 1,1 Гб AVI). Придется это исследование делать уже утром, ибо сейчас, когда я о нем вспомнил, у нас уже начало четвертого утра – пора на боковую.

вторник, Декабрь 06, 2005

Origami

Интересная хреновина... :)

четверг, Декабрь 01, 2005

Bryce: my first experience



No comments...