Конфигурирование поисковых зон
Формальные правила описания зон можно представить следующим набором выражений: <Zones> yxzone = htelem (,htelem)* yxzone = htelem (,htelem)* /yxattr </Zones> Где
yxzone - имя поисковой зоны |
htelem - имя HTML-тега |
yxattr - имя поискового атрибута, определяющего условную поисковую зону |
(...)* - ноль, один или несколько элементов |
Имя поисковой зоны не может совпадать с одним из зарезервированных имен doc, empty, any. Вместо имени HTML-тега допустимо использовать символ _ (подчеркивание). Он означает любой тег.
Пример: Текст внутри тега title принадлежит поисковой зоне title. title = title
Пример: Текст внутри всех элементов Hn, а также заголовки таблиц принадлежат поисковой зоне header. header = h1,h2,h3,h4,h5,h6,caption
Пример: Текст внутри тега a принадлежит поисковой зоне anchor только при условии, что имеется поисковый атрибут link. anchor = a/link