ArtReal's readme
personal unreality:  точка пушистости

Keyword: register

<< previous entries | entries 21-30 from 71 total | next entries

Перехват поиска

25.04.04 17:09 ◇ keywords: register fiction

Вот, кстати и решение проблемы с попаданием посетителя из внешней поисковой системы в середину записей.
Итак, если реферер содержит запрос поисковой системы, то мы можем перенаправить этот запрос в собственную (внутреннюю) поисковую систему, в которой мы можем сами управлять релевантностью и «связанными одной цепью» записями, давая в качестве бонуса посетителю проигнорировать результаты «правильного» поиска и пройти на ту запись, которую ему откопала внешняя поисковая система.

 [ link ] [ thread ]

Поиск блоговский

15.05.04 15:42 ◇ keywords: web, register fiction

urbansheep, рассуждая о поиске, напомнил мне о том, что я как бы собирался прикрутить поиск к френд-ленте.
Что
касается организации поиска по дневнику/блогу с использованием почтовой системы, то:
а) запихивать туда записи неудобно
б) искать можешь только сам
Зато представляется интересной мысль использовать «безлимитную» почтовую систему в качестве резервной копии.


Поиск у френдов

17.05.04 13:36 ◇ keywords: register fiction

Вспомнил, почему я до сих пор его так и не сделал, хотя по прикидкам это получается несложно.
Дело в том, что была еще одна мысль — разделить friend-ленту на две части: архив (2003 год) и «оперативная часть». В таких условиях поиск пойдет только по оперативной части. А с архивом тогда как? Либо использовать constant part как часть индекса, либо делать еще один поиск по архиву.
Иначе говоря, я пока в раздумьях.

 [ link ]

Хвост и грива

12.06.04 15:10 ◇ keywords: register fiction, virtual

Я не исчезаю. Я просто помолчу. Будем разговаривать, когда рядом никого нет. Если начнете делать ошибки — я поправлю.
Р. Хайнлайн. «Пройдя долиной смертной тени»

Удобно расположившись на диванчике, одна из зеленоглазых блондинок начинает пытать подругу:
 — Вот скажи мне, группировка записей по ключевым словам — это кластеризация?
Подруга отрывается от медитативной бутылки пива, ставит ее на пол под диван, чтобы бутылка не мешала интересному разговору.
 — А вот и нет. Если ты говоришь о нашем readme, то ключевые слова у нас ’предопределенный класс’ — т.е. критерий сортировки записей по загончикам, хотя мы привыкли ставить их абы как, по принципу «на какое слово больше всего смахивает новая запись».
 — Ага. Мы в совершенстве освоили этот потрясающий метод и жутко не любим заводить новый keyword. Так чем же у нас занимаются ключевые слова?
 — А ключевые слова как были classification, так и остались. Хотя, с нашим опытом и методом ведения блога de facto ключевые слова — это сводный гибрид fuzzy affinity и clustering.

Блондинка не торопится отвечать. Она нащупывает под диваном бутылку пива и делает глоток.
 — Ой, пиво кончилось!
 — В холодильнике возьми. Пару бутылок.

После того, как бутылки вскрыты, а пиво продегустировано (это входит в обязательный ритуал «прочистка горлышка»), разговор продолжается.
 — В смысле «между»?
 — В смысле «или-или», в зависимости от того, зачем мы их будем пользовать. Это ведь ты как-то раз сказала: «мы освоили 1024 метода аппроксимации кошки»?
 — Я как-нибудь их подробно распишу. Хорошо, а кластеризация?
 — Кластеризация, как известно, выделяет на некотором множестве данных компактные подгруппы из близких по своим характеристикам записей
 — А с нашими разношерстными записями нам больше подходит хаотическая кластеризация, правда, мы рискуем получить один большой и толстый кластер.
 — Методом исключения получается, что у нас кластер — это threads?
 — Умница. Так оно и есть. Но у нас есть и nodes, выполняющие как раз прямо противоположную роль — unclustering. Для баланса интересов.
 — А мы, как две блудные дурочки, вынуждены искать золотую середину на лезвии бритвы.
 — Дорогая моя, ты преувеличиваешь… впрочем, я согласна, метания между различными системами классификаций могут вскружить голову.
 — Ну, а что еще остается делать, если существующая классификация нас не удовлетворяет.Вот и щупаем варианты…

Увлекшись разговором, двигается в сторону и, не удержавшись, падает с дивана.
Подруга морщится — интересный разговор так неожиданно прервался.
 — Если ты и дальше собираешься падать с дивана — положи вниз подушку.
Снизу показывается всклокоченная и озадаченная мордашка.
 — Это невозможно. Подушка, как и кот, слишком Шредингеровская штука.
 — Это как? — удивляется подруга.
 — Очень просто: куда бы я ни положила подушку, вероятность того, что я упаду на нее, определяется в момент падения.
 — Хм… дорогая, у нас нет столько подушек, так что постарайся не падать.
 — Это ты жадничаешь. А в результате подушек не хватает не только для «соломку подстелить»… даже покидаться нечем!
 — Ты на что намекаешь? — пытается сообразить подруга.
 — На кота Шредингера, разумеется. Точнее — о виртуальной вероятности. В случае с кошкой мы почему-то учитываем только предопределенные состояния — аж три штуки.
 — А третье — это какое?
 — Высокий импеданс. Так вот: а почему мы не учитываем другие состояния? Например, открываем ящик — а кошки там нету. Забавно, да? Но более интересным эксперимент становится тогда, когда кот распределен по ящику в вероятностном смысле и может квантоваться. Тогда, открыв ящик, мы можем обнаружить 30% кота (к примеру). А остальные 70% кота — недетерминированы. А в пиковых случаях мы можем получить 1% кота — знаменитую чеширскую улыбку. Как ты думаешь, автор ’Алисы’ долго тренировался на кошках? Впрочем, это уже неважно, нас больше интересует виртуальная составляющая.
 — Виртуальная?
 — Видишь ли, ключевые слова не обязаны быть constant составляющей — иначе это лишает всю систему гибкости. То есть, ключевые слова не должны быть частью записи — они должны быть виртуальны… возможно, content-driven. Тогда возможна трансформация ключевых слов — когда в зависимости от контекста одно ключевое слово может плавно переходить в другое. Эвентуальная* фича, если так можно выразиться.

 — У тебя извращенное воображение!
 — Ты хотела сказать «метанарративное»?
 — А что, есть разница?
 — Я тебя покусаю!
 — Из вредности? Мя-ау! Спрячь коготки, котенок! Ты знаешь, что такое кипу?
 — Неа, — скромно потупившись, прикладывается к бутылке пива.
 — Кипу — это «узелковое письмо», употреблялось в государстве древних инков, и представляло собой веревку, к которой был привязан ряд разноцветных шнурков с различной формы узелками — средством для удержания в памяти последовательности и логической связи передаваемых устно сообщений. Ну, а мы, глюпые блондинки, эту последовательность периодически начинаем путать.
 — И тогда появляются убойные неожиданные идеи…
Подруга смеется.
 — Ладно, давай почитаем Хайнлайна, и баиньки. Так лучше, Юнис?

p.s. Текст был написан довольно давно, но причесать и выложить руки дошли только сейчас




* Эвентуальный — возможный при соответствующих обстоятельствах.


register: status update

25.07.04 15:46 ◇ keywords: register

Несколько изменил систему комментирования. Если будут явные косяки — пишите.
По поводу Оперы претензии не принимаются, потому как.


Post edit script

05.08.04 17:28 ◇ keywords: register

Пару дней назад исправил забавный косяк (наконец-то до него дошли руки). Проявлялся он вот как: после того как я отредактировал запись и нажал на кнопку «Post entry», текст в формочке заменялся на тот, который был до редактирования, но сохранялся исправленный вариант.


e2: test-drive

31.10.04 13:38 ◇ keywords: soft, register, e2

Поставил e2, который, как уверяют, но 93% лучше, чем Register. Но так и не понял — в каком именно месте он на 93% лучше?
Зато, по моему субъективному мнению, e2 по многим некоторым позициям проигрывает Register. Но, из вредности, не скажу. ;)
Впрочем, еще 33 тысячи версий — и золотой ключик будет у нас в кармане.


Keywords must die

01.12.04 12:33 ◇ keywords: register fiction, технологии

На самом деле, если честно, то даже переход с линейных на древовидные большого прироста хоть чего-нибудь не дал. Новые паутинообразные кейворды вызывают у меня ещё больший скептицизм… [ >>> ]

А я до сих пор думаю, что keywords (особенно, в экзотических вариантах) мало полезны. Равно как и традиционные системы классификации. И большого смысла для блогописателя в них нет.
Остается жуткий, но правильный путь — придумать систему классификации самому. Для себя.
(Я все больше склоняюсь к ассоцитивно-DM-линкованной системе)


One step back

02.12.04 11:23 ◇ keywords: технологии, линкс, register

Связывать друг с другом записи — это очень хорошо, но тут другая проблема. В блоге это вряд ли будет работать, потому, что блог хочется писать, а не связи в нём настраивать. Кейворды, они тем и полезны, что позволяют мало напрягаться. А представим, что нам вместо кейвордов нужно вручную перечислять все заметки, которые мы считаем близкими по теме к данной. Ну и что, кто бы этим пользовался? [ >>> ]
С точки зрения банальной экстрадиции мыслей — это чушь. Даже шнурки можно завязывать десятью различными методами! С той же легкостью и различными методами (поскольку предпосылки/модели могут быть разными) можно связывать и записи.
Материал для изучения:


Связи данных

05.12.04 13:29 ◇ keywords: register, технологии

«Не хватает важного кусочка — и потерян смысл всей вообще истории, а тот, у кого кусочек на руках, не знает, что ему с ним делать.»
(Маятник Фуко)

Надо сказать, что КС1 — это простой, но малоэффективный способ классификации. Поэтому взякие извращения (типа древовидных, спиральных, etc) обычно усложняют систему КС, но ожиданий не оправдывают (иначе говоря, сложность СК растет быстрее, чем эффективность).

Большинство СК (систем классификации) занимается тем, что раскладывают записи на кучки (по принципу «чем меньше куча — тем быстрее в ней можно откопать нужное»).
Примерно так:
Области покрытия ключевых слов
Как вариант, возможен симбиоз нескольких СК. Какая-то из них для данной выборки окажется более эффективной.

Но обычные СК не группируют контекст и не учитывают динамику (т.е. не видят цепочек типа «поставлена задача»-"возможные пути решения" — «решена вот так»). Требуется система линковки (связывания по контексту/динамике) записей.
Иначе говоря, вместо того чтобы накладывать на систему КС дополнительные уровни, для раскладывания контента по полочкам лучше использовать «альтернативные методы» — вопрос даже не в том, чтобы аккуратно разложить записи по полочкам и кучкам, а в том, чтобы ориентироваться в контенте как рыба в воде — т.е. не только быстро найти нужную запись, но и связанные с ней контекстным вектором. Чудес не бывает, но чем больше возьмет на себя СК, тем лучше для нас.

На этом лирическое вступление можно считать законченным, и пора переходить к более практичным вещам.

Для связывания записей можно использовать:
- намеки (hints) и  ручная настройка привязки
- сотовая классификация
- ассоциативная классификация

Линковку записей проще всего делать нитями. Пользователю достаточно внести имя нити (новую или из списка), в которую попадет эта запись:
Привязка к нити
Все остальное (в меру сил алгоритма) делает скрипт. В существующей реализации доступны только линейные нити, а перекрестные и паутинные — как-нибудь потом.
Что касается актуальности нитей, то такой вопрос пока не поднимался, но, если что, это вполне решаемо.

[-1]



1 —
далее по тексту: КС — ключевые слова, СК — система классификации

 [ link ] [ thread ]

Keyword: register

<< previous entries | entries 21-30 from 71 total | next entries