ArtReal's readme
personal unreality:  точка пушистости

О ключевых словах

10.02.04 13:21 ◇ keywords: register fiction

Хотя некоторые считают ключевые слова чуть ли не панацеей, я в этого джинна не верю.
Да, ключевые слова позволяют разложить одну большую кучу записей на несколько мелких кучек — согласно тематике. Но от этого куча так и остается неупорядоченной.
Упорядочить записи можно. Если предварительно сгенерировать список ключевых слов по принципу УДК (не копировать!). И при этом много ключевых слов останутся незадействованными.
Поэтому обычно ключевые клова вводятся по мере надобности. А с предыдущими записями, которые подходят под это ключевое слово — что делать? Ворошить и перебивать КС в N записей? Так лень же!
Фасетная классификация? ФК начинает хорошо работать на большом объеме равномерно раскиданных данных. 10 000, например. А когда записей пара сотен, издержки на ФК превышают эффективность использования.
Сотовая классификация, тоже в жопе, поскольку у меня нет плотной упаковки записей.
Что же делать? Есть два пути, облегчающих жизнь:
а) использовать ортогональную систему классификаторов (иерархическая/многоуровненвая рубрикация, threads, маркеры важности), позволяющие искать по стыкам (точкам пересечения, converge)
б) использовать параллельную систему — аннотации по контексту (constrict, предельно сжатое содержания записи). Минус: не умею я грамотно сжимать контекст и поддерживать релевантность аннотаций во времени.

 [ link ] -1 +1    comments : 3