Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 12 сентября 2013 16:17 Сообщение отредактировано: 22 октября 2013 23:25
В последней версии программы SiteSputnik в Правилах попадания в Рубрику можно применить следующие два оператора:
Например, Правило:
означает, что в Рубрику попадет информация о Дмитрии Медведеве только с сайта twitter.com, или со ссылок, адреса которых содержат слово comments или forum, или название источника (см. последний оператор), содержит слово blogs. Напомню, что название источника прописывается при его подключении в Мастере на третьей вкладке. Сделано при реализации заявки Игоря Нежданова, связанной с потребностью разделения потока новостей, попадающих в Рубрики, на составные части такие как: СМИ, ИнформАгентства, Блоги, Микроблоги, Соцсети, Форумы, ПрофПорталы, ... в различных комбинациях. Для этих целей удобно саму тему описать в родительской рубрике, а в дочерних указать параметр "Искать только в родительской" и нужные операторы inurl: и insource:. Возможно, что найдется другое применение этих операторов. Кроме разложения потока на составляющие, произойдет его упорядочивание по источникам. Порядок не алфавитный, а в соответствии с правилами из дочерних Рубриках. Замечание от 22.10.13. В версии SiteSputnik 8.5.6.1 эту конструкцию применять можно, например, правило: Оборонсервис ~inurl:war ~inurl:weapon ~inurl:arsenal.com/ означает, что содержащие информацию об Оборонсервисе новости, размещенные на ссылках, URL которых включает хотя бы одну из трех лексем не попадут в Рубрику. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1055 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Работает эффективно. Уже сейчас делю поток по нужному Объекту на составляющие (СМИ и СоцМедиа). По некоторым Объектам деление будет глубже - СМИ, ИнформАгентства, ПрофПорталы, Блоги, Соцсети, МикроБлоги, Форумы. Составлю словарь-список соответствющих площадок (т.к. этот список довольно длинный) и использую в правилах именно отсылку к этому списку. Так удобнее. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 11 июня 2014 7:43 Сообщение отредактировано: 11 июня 2014 8:20
Реализовал эту опцию в SiteSputnik Pro+News версии 8.7.2 от 11.06.14. ![]() Назначение опции При её включении анализируется не текстовая составляющая документа, а весь его HTML-код (точнее его значимая часть). Если ключевые слова найдены в текстовой части документа, то они выделяются зеленоватым фоном, если в теге html-документа, то они (ключевые слова) выносятся за пределы тега и кроме подзеленения зачеркиваются (потому что их реально в содержании документа в этом месте нет). Рекомендуется применять эту опцию только в специальных случаях. Например: title /2 Кудрин - отфильтровать ссылки, внутри контента которых есть такой код: <A title="Алексей Кудрин" htef=...>... href= /1 (http://sitesputnik.ru/ | www.sitesputnik.ru) - есть обратная ссылка на сайт www.sitesputnik.ru или проще: href= /1 sitesputnik.ru можно просто искать какой-то тег, например: <noindex Следует помнить, что эта опция может изменить расстояние между словами, поскольку теги (они невидимы) могу стоять где угодно и в них бывают пробелы. Например, может быть: Алексей Кудрин - текст без Html: расстояние между словами 1 пробел, Алексей <b style="...">Кудрин</b> - соответствующий ему Html-код: расстояние между словами 2 пробела. Поэтому эту опцию рекомендуется применять только в специальных случаях с учетом всех особенностей HTML-кода |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В SiteSputnik Pro+News версии 8.7.3.1 от 19.06.14 можно в Правилах рубрикации применить оператор &. Например, правило:
|
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1055 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Полезный оператор - спасибо! ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В SiteSputnik Pro+News версии 8.8.7 от 30.03.15 можно в Правилах рубрикации применить оператор &&. Например, правило:
Пример из реальной жизни от Дмитрия из Владивостока: !индекс* /1 ('ММВБ' | 'MICEX') && (!максимум* | !плюсе* | !рост* | !подрос | !подн* | !выше | !прибавил | !повы* | !слабоповы*) !индекс* /1 ('ММВБ' | 'MICEX') && (!минимум* | !минус* | !пада* | !сниж* | !сниз* | !просел | !опустил* | 'негативное влияние') !индекс* /1 ('ММВБ' | 'MICEX') && (!отметк* | !район* | !пробил* | !поддержк* | !уров* | !предел* | !коррекц* | !сопротивлени*) Этo правило применяется для отслеживания трех ситуаций настроения рынка по индексу ММВБ: 1. Движение ММВБ вверх. 2. Движение ММВБ вниз. 3. Боковое движение. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 13 апреля 2015 9:46 Сообщение отредактировано: 15 апреля 2015 22:01 В SiteSputnik Pro+News версии 8.8.7.3 от 13.04.15 можно в Правилах рубрикации применять скобочную структуру с любой глубиной вложенности (многоуровневая скобочная структура). Ранее была реализована только одноуровневая скобочная структура. Ранее можно было так:
Теперь можно так:
Пример, из реальной практики:
3-уровневая структура. Отслеживание информации по вопросу отношения США и НАТО, с одной стороны, и "нормандской четверки", с другой стороны. К слову будет сказано. Иногда правила Рубрикации, описывающие интересующую нас информацию, рационально снабдить комментариями. Здесь, также как и в пакетах запросов, можно применять комментарии. Всё, что правее ^^ - это комментарий. Пробельные строки в правилах рубрикации тоже допускаются. Они просто игнорируются. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 803 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Отлично! Рубрики СайтСпутника стали ещё более точными. Теперь можно будет прописывать в рубриках меньшее число правил. Настройка рубрик станет более быстрой. |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1055 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Да - согласен - вложенные скобки позволяют делать более тонкую настройку. Спасибо! ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Объекты в Рубриках (Объектное мышление) Доступно, начиная с версии SiteSputnik News 8.8.9 от 19.11.2015г. Объекты - это поставляемые вместе с программой или созданные Пользователями правила анализа контента ссылок. Объект может быть задан как логическое выражение, сформированное из обычных Правил, из Регулярных выражений, из Внешних функций. На картинке ниже показан способ выбора Объекта и Правило, составленное из них: ![]() Назначение приведенного на картинке Правила, содержащего три объекта следующее: Правилу удовлетворяют те ссылки, в контенте которых имеются и 10-значный номер телефона (любой), и адрес электронной почты (любой), и название Юридического лица (любого), и слова Москва или Московская область. Как видно по картинке, наименованию Объекта предшествует символ %. |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 7 8 * 9 10 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Рубрики в СайтСпутник(е). |