Рубрики в СайтСпутник(е). :: Приемы работы с программой СайтСпутник (SiteSputnik) :: Форум СПКР (66)


Первоисточник: http://forum.razved.info/index.php?t=1045&p=54882
Компиляция: программой SiteSputnik - https://sitesputnik.ru/

 
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации:
7 июня 2009
Работает эффективно. Уже сейчас делю поток по нужному Объекту на составляющие (СМИ и СоцМедиа). По некоторым Объектам деление будет глубже - СМИ, ИнформАгентства, ПрофПорталы, Блоги, Соцсети, МикроБлоги, Форумы.

Составлю словарь-список соответствющих площадок (т.к. этот список довольно длинный) и использую в правилах именно отсылку к этому списку. Так удобнее.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009
    Обсуждали в переписке по e-mail с Tungus1973 опцию "Рубрицировать HTML-код".

    Реализовал эту опцию в SiteSputnik Pro+News версии 8.7.2 от 11.06.14.



    Назначение опции
    При её включении анализируется не текстовая составляющая документа, а весь его HTML-код (точнее его значимая часть).

    Если ключевые слова найдены в текстовой части документа, то они выделяются зеленоватым фоном, если в теге html-документа, то они (ключевые слова) выносятся за пределы тега и кроме подзеленения зачеркиваются (потому что их реально в содержании документа в этом месте нет).

    Рекомендуется применять эту опцию только в специальных случаях. Например:

      title /2 Кудрин - отфильтровать ссылки, внутри контента которых есть такой код: <A title="Алексей Кудрин" htef=...>...

      href= /1 (http://sitesputnik.ru/ | www.sitesputnik.ru) - есть обратная ссылка на сайт www.sitesputnik.ru или проще:
      href= /1 sitesputnik.ru

      можно просто искать какой-то тег, например: <noindex

    Следует помнить, что эта опция может изменить расстояние между словами, поскольку теги (они невидимы) могу стоять где угодно и в них бывают пробелы. Например, может быть:

    Алексей Кудрин - текст без Html: расстояние между словами 1 пробел,
    Алексей <b style="...">Кудрин</b> - соответствующий ему Html-код: расстояние между словами 2 пробела.

    Поэтому эту опцию рекомендуется применять только в специальных случаях с учетом всех особенностей HTML-кода

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009

    В SiteSputnik Pro+News версии 8.7.3.1 от 19.06.14 можно в Правилах рубрикации применить оператор &.

    Например, правило:

      Медведев & Кудрин Антон /1 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном предложении и в любом месте ссылки рядом должны ещё быть слова Антон и Силуанов.


Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации:
7 июня 2009
Полезный оператор - спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7 от 30.03.15 можно в Правилах рубрикации применить оператор &&.

    Например, правило:

      Медведев && Кудрин Антон /2 Силуанов

    означает, что в контенте ссылки слова Медведев и Кудрин должны встретиться в одном абзацеи, а также в любом месте ссылки должны ещё быть слова Антон и Силуанов на расстоянии не более двух пробелов (одного слова).



    Пример из реальной жизни от Дмитрия из Владивостока:

      !индекс* /1 ('ММВБ' | 'MICEX') && (!максимум* | !плюсе* | !рост* | !подрос | !подн* | !выше | !прибавил | !повы* | !слабоповы*)
      !индекс* /1 ('ММВБ' | 'MICEX') && (!минимум* | !минус* | !пада* | !сниж* | !сниз* | !просел | !опустил* | 'негативное влияние')
      !индекс* /1 ('ММВБ' | 'MICEX') && (!отметк* | !район* | !пробил* | !поддержк* | !уров* | !предел* | !коррекц* | !сопротивлени*)

    Этo правило применяется для отслеживания трех ситуаций настроения рынка по индексу ММВБ:
    1. Движение ММВБ вверх.
    2. Движение ММВБ вниз.
    3. Боковое движение.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009

    В SiteSputnik Pro+News версии 8.8.7.3 от 13.04.15 можно в Правилах рубрикации применять скобочную структуру с любой глубиной вложенности (многоуровневая скобочная структура).
    Ранее была реализована только одноуровневая скобочная структура.

    Ранее можно было так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 обвинение | предъявлены /1 доказательства)

    Теперь можно так:
      (Хорошавин | Сандаков) /5 (махинации | хищения | предъявлено /1 (обвинение | доказательства))


    Пример, из реальной практики:
      ((нормандская /1 (четверка | четвёрка)) | ( (Владимир /1 !Путин*) & (Ангела /1 Меркель) & (Франсуа /1 Олланд) & ((Петр | Пётр) /1 Порошенко)) ) ('НАТО' | Йенс /1 Столтенберг | 'США' | Барак* /1 Обам* )

    3-уровневая структура. Отслеживание информации по вопросу отношения США и НАТО, с одной стороны, и "нормандской четверки", с другой стороны.

    К слову будет сказано. Иногда правила Рубрикации, описывающие интересующую нас информацию, рационально снабдить комментариями. Здесь, также как и в пакетах запросов, можно применять комментарии. Всё, что правее ^^ - это комментарий. Пробельные строки в правилах рубрикации тоже допускаются. Они просто игнорируются.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 803
Рейтинг пользователя: 11


Ссылка


Дата регистрации:
3 июля 2009
Отлично! Рубрики СайтСпутника стали ещё более точными.
Теперь можно будет прописывать в рубриках меньшее число правил. Настройка рубрик станет более быстрой.
Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации:
7 июня 2009
Да - согласен - вложенные скобки позволяют делать более тонкую настройку.
Спасибо!

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009

    Объекты в Рубриках (Объектное мышление)

    Доступно, начиная с версии SiteSputnik News 8.8.9 от 19.11.2015г.

    Объекты - это поставляемые вместе с программой или созданные Пользователями правила анализа контента ссылок.

    Объект может быть задан как логическое выражение, сформированное из обычных Правил, из Регулярных выражений, из Внешних функций.

    На картинке ниже показан способ выбора Объекта и Правило, составленное из них:



    Назначение приведенного на картинке Правила, содержащего три объекта следующее:

    Правилу удовлетворяют те ссылки, в контенте которых имеются и 10-значный номер телефона (любой), и адрес электронной почты (любой), и название Юридического лица (любого), и слова Москва или Московская область.

    Как видно по картинке, наименованию Объекта предшествует символ %.

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 872
Рейтинг пользователя: 6


Ссылка


Дата регистрации:
22 июня 2009

    Ещё про одну маленькую деталь забыл: Объекты для Рубрик могут быть вложенными. То есть, Вы можете прописать в теле Объекта другой Объект.

    Например, если для предыдущего примера Вы создадите Объект "Контакты" в таком виде:

    %Телефон10 %ПочтаЭлектронная %ЮЛ

    То вместо Правила:

    %Телефон10 %ПочтаЭлектронная %ЮЛ (Москва | Московская /1 область)

    можно будет написать:

    %Контакты (Москва | Московская /1 область)

    Глубина вложенности Объектов - произвольная. То есть, Объект "Контакты" может сам быть вложен в другой Объект. Следите за тем, чтобы не было зацикливаиия. Если не уследите, то СайтСпутник сообщит Вам об этом.



<<Назад  Вперед>>Страницы: 1 2 3 4 5 6 7 8 * 9 10
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Рубрики в СайтСпутник(е).