Две жопы
22.02.04 14:46 ◇ keywords: register fictionРаздумывая о вечном классификации контента всегда натыкаешься на две трудности:
1) Сама по себе КК на пустом месте не возникает ее нужно прописывать руками в каждую запись. Каждый раз, как только мы вводим/изменяем систему КК. Выходом была бы динамическая КК, но до этого жить и жить
2) КК необходимо составлять до, а не после появления записей. Соотвественно, требуется предугадывать содержание будущих записей и их место в КК (мелкая корректировка под сиюминутные нужды на это не влияет).
Если бы не две этих жопы, жить было бы легче и веселей.
changelog
28.02.04 15:17 ◇ keywords: registerЧтобы не было дурацких вопросов, немного поясню.
Вот эти маленькие
Эффект деформации 2
20.04.04 13:33 ◇ keywords: register fictionИдея анализа внешних поисковых запросов, хотя и заманчива, но с практической стороны близка к бесполезной, поскольку:
- непонятно, что именно ищет посетитель
- посетитель может искать вполне конкретную запись, и не согласен на принудительную замену
- непонятно, какую из N записей context chain считать более релевантной перехваченному запросу.
Как вариант, после анализа внешних поисковых запросов можно выводить не конкретную запись, а context chain. Но польза от этого сомнительна, а усилий требует.
И что делать? А ничего. Тем, кто заходит в блог и пытается откомментировать запись годичной давности, уже ничего не поможет. Кроме белых тапок и горизонтального положения…
А для остальных будем строить context chain. Вот urbansheep предлагает строить цепочки вручную и по номерам. Ну а я записываю в todo «поддержка перекрестных threads» (т.е. когда запись входит в несколько нитей)
Перехват поиска
25.04.04 17:09 ◇ keywords: register fictionВот, кстати и решение проблемы с попаданием посетителя из внешней поисковой системы в середину записей.
Итак, если реферер содержит запрос поисковой системы, то мы можем перенаправить этот запрос в собственную (внутреннюю) поисковую систему, в которой мы можем сами управлять релевантностью и «связанными одной цепью» записями, давая в качестве бонуса посетителю проигнорировать результаты «правильного» поиска и пройти на ту запись, которую ему откопала внешняя поисковая система.
Поиск блоговский
15.05.04 15:42 ◇ keywords: web, register fictionurbansheep, рассуждая о поиске, напомнил мне о том, что я как бы собирался прикрутить поиск к
Что
а) запихивать туда записи неудобно
б) искать можешь только сам
Зато представляется интересной мысль использовать «безлимитную» почтовую систему в качестве резервной копии.
Поиск у френдов
17.05.04 13:36 ◇ keywords: register fictionВспомнил, почему я до сих пор его так и не сделал, хотя по прикидкам это получается несложно.
Дело в том, что была еще одна мысль разделить
Иначе говоря, я пока в раздумьях.
Хвост и грива
12.06.04 15:10 ◇ keywords: register fiction, virtualЯ не исчезаю. Я просто помолчу. Будем разговаривать, когда рядом никого нет. Если начнете делать ошибки я поправлю.
Р. Хайнлайн. «Пройдя долиной смертной тени»
Удобно расположившись на диванчике, одна из зеленоглазых блондинок начинает пытать подругу: После того, как бутылки вскрыты, а пиво продегустировано (это входит в обязательный ритуал «прочистка горлышка»), разговор продолжается. Увлекшись разговором, двигается в сторону и, не удержавшись, падает с дивана. У тебя извращенное воображение! p.s. Текст был написан довольно давно, но причесать и выложить руки дошли только сейчас
Вот скажи мне, группировка записей по ключевым словам это кластеризация?
Подруга отрывается от медитативной бутылки пива, ставит ее на пол под диван, чтобы бутылка не мешала интересному разговору.
А вот и нет. Если ты говоришь о нашем readme, то ключевые слова у нас предопределенный класс т.е. критерий сортировки записей по загончикам, хотя мы привыкли ставить их абы как, по принципу «на какое слово больше всего смахивает новая запись».
Ага. Мы в совершенстве освоили этот потрясающий метод и жутко не любим заводить новый keyword. Так чем же у нас занимаются ключевые слова?
А ключевые слова как были classification, так и остались. Хотя, с нашим опытом и методом ведения блога de facto ключевые слова это сводный гибрид fuzzy affinity и clustering.
Блондинка не торопится отвечать. Она нащупывает под диваном бутылку пива и делает глоток.
Ой, пиво кончилось!
В холодильнике возьми. Пару бутылок.
В смысле «между»?
В смысле
Я
Кластеризация, как известно, выделяет на некотором множестве данных компактные подгруппы из близких по своим характеристикам записей
А с нашими разношерстными записями нам больше подходит хаотическая кластеризация, правда, мы рискуем получить один большой и толстый кластер.
Методом исключения получается, что у нас кластер это threads?
Умница. Так оно и есть. Но у нас есть и nodes, выполняющие как раз прямо противоположную роль unclustering. Для баланса интересов.
А мы, как две блудные дурочки, вынуждены искать золотую середину на лезвии бритвы.
Дорогая моя, ты преувеличиваешь… впрочем, я согласна, метания между различными системами классификаций могут вскружить голову.
Ну, а что еще остается делать, если существующая классификация нас не удовлетворяет.Вот и щупаем варианты…
Подруга морщится интересный разговор так неожиданно прервался.
Если ты и дальше собираешься падать с дивана положи вниз подушку.
Снизу показывается всклокоченная и озадаченная мордашка.
Это невозможно. Подушка, как и кот, слишком Шредингеровская штука.
Это как? удивляется подруга.
Очень просто: куда бы я ни положила подушку, вероятность того, что я упаду на нее, определяется в момент падения.
Хм… дорогая, у нас нет столько подушек, так что постарайся не падать.
Это ты жадничаешь. А в результате подушек не хватает не только для «соломку подстелить»… даже покидаться нечем!
Ты на что намекаешь? пытается сообразить подруга.
На кота Шредингера, разумеется. Точнее о виртуальной вероятности. В случае с кошкой мы
А третье это какое?
Высокий импеданс. Так вот: а почему мы не учитываем другие состояния? Например, открываем ящик а кошки там нету. Забавно, да? Но более интересным эксперимент становится тогда, когда кот распределен по ящику в вероятностном смысле и может квантоваться. Тогда, открыв ящик, мы можем обнаружить 30% кота (к примеру). А остальные 70% кота недетерминированы. А в пиковых случаях мы можем получить 1% кота знаменитую чеширскую улыбку. Как ты думаешь, автор Алисы долго тренировался на кошках? Впрочем, это уже неважно, нас больше интересует виртуальная составляющая.
Виртуальная?
Видишь ли, ключевые слова не обязаны быть constant составляющей иначе это лишает всю систему гибкости. То есть, ключевые слова не должны быть частью записи они должны быть виртуальны… возможно,
Ты хотела сказать «метанарративное»?
А что, есть разница?
Я тебя покусаю!
Из вредности?
Неа, скромно потупившись, прикладывается к бутылке пива.
Кипу это «узелковое письмо», употреблялось в государстве древних инков, и представляло собой веревку, к которой был привязан ряд разноцветных шнурков с различной формы узелками средством для удержания в памяти последовательности и логической связи передаваемых устно сообщений. Ну, а мы, глюпые блондинки, эту последовательность периодически начинаем путать.
И тогда появляются убойные неожиданные идеи…
Подруга смеется.
Ладно, давай почитаем Хайнлайна, и баиньки. Так лучше, Юнис?
* Эвентуальный возможный при соответствующих обстоятельствах.
register: status update
25.07.04 15:46 ◇ keywords: registerНесколько изменил систему комментирования. Если будут явные косяки пишите.
По поводу Оперы претензии не принимаются, потому как.
Post edit script
05.08.04 17:28 ◇ keywords: registerПару дней назад исправил забавный косяк
e2: test-drive
31.10.04 13:38 ◇
keywords: soft, register, e2
Поставил e2, который, как уверяют, но 93% лучше, чем Register. Но так и не понял в каком именно месте он на 93% лучше?
Зато, по моему субъективному мнению, e2 по многим некоторым позициям проигрывает Register. Но, из вредности, не скажу. ;)
Впрочем, еще 33 тысячи версий и золотой ключик будет у нас в кармане.