Алексей Мыльников
Долгожитель форума
Система: Мониторинг СМИ, социальные сети, упоминания. Программа: поиск, сбор, искать и найти информацию в интернете
индивидуальная настройка сайтов, ресурсов и папок, библиотека источников и иструменты её создания и ведения, сайт спутник [146]
программа спутник,индивидуальная настройка сайтов, ресурсов и папок, библиотека источников и иструменты её создания и ведения, сайт спутник [146]
система,программа,индивидуальная,настройка,сайтов,ресурсов,папок,библиотека,источников,иструменты,её,создания,ведения,сайт,спутник,[146],средство
Сбор Yandex,Google,найтиДата обновления:вчера;Автор:Мыльников Алексей Мониторинг СМИ,социальные сети,ищет упоминания,обновления,изменения,ФИО,поиск,искИтоги,обзоры:программ,систем,мониторинг СМИ,потоки,медиа,обновление,язык,паук,анализВК,ФБ,ИГ,ТВ,ТГ,ОК Иск,Объект,человек,персона,ФЛ,ФЛ,люди,переводчик,контент,искатьЛучшая программа поиска,сбора:люди,физлица,системы,изменение,упоминанияКлюч,word Поиск телеграм,канал.Скачать Программа:Поиск и Мониторинг СМИПробить человека,персону,ИБ,информаци,безопасность,search,КЕШСлова ключевые Написать:поделиться:сохранить:ответить Реестр российского ПО ЭВМ гарантии,доставка,оплата,условия сотрудничества,условия возврата Программа поиск мониторингинфографика,переводчик,полиглот,слова ключевые. Программыinternet,key,перевод:русский язык английский,текст,автоFIO,watcher
Поиски и сборы информации в интернете программным обеспечением
Для поиска Ключа,трекер,Бот,Скан,Парсинг,паук,система,Программа для мониторинга.Кряк.Автомат,Слежу поиск,отчеты:Рейтинг По тегамАнализ Соц сеть сканер Купить мониторить Прогу для поиска. Ключевые слова поиск соцсети чат спутник-шпион онлайн браузер.Искатель ищу лица слежка слешка,Соискатель программный все самые популярные. Prog free bot soft download search E-Mail Sputnik programs pro key spider application system api chat Искусственный интеллект (ИИ)Находка инфо группа высокая. Найдено бесплатно Поисковиком ключ-слово парсингБОТ допрос пытать интернет.Программа самая лучшая популярная автоматическая, запрос ключа к мониторингу соцсетей СМИ телеграм телефона контрагента. Софт поисковая система,автоматизм,по ключ-словам.Поисковики на русском языке-прога ключевые слова Теле Сервис Мониторинга телеграм ключ по поиску по сбору Кнопка. Ценник 365,Спутник,сайт слежу Находчивый найдёт фото людей в ТГ. Поиск Иск. Блок АПИ,МО,ПО,ППО,Инструменты,Средства,Приложения,системы,комплексы,программы для мониторинга и по мониторингу для сбора по сбору для анализа для поиска и по поиску. Сайт Cпутник По дате нахожу следы,контакты,нашёл по фото,foto,ютуб,маркер. Видео, Форум, Чат, Мессенджер, Парсер, краб! ЭВМ, виджет,ноут,комп,СБ?
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 СсылкаДата регистрации на форуме: 22 июня 2009
|
Профиль | ИгнорироватьNEW! Сообщение отправлено: 12 января 2012 0:51 Сообщение отредактировано: 6 октября 2019 18:57
В версии 7.4.4 от 12.01.12 программы SiteSputnik News реализована новая функция, позволяющая прописывать "индивидуальные" настройки для ссылок, найденных в процессе мониторинга источников информации (сайтов). Настройки предназначены для выбора из содержания ссылок значимой информации. Они применяются, когда автоматический выбор какого-то фрагмента значимой информации невозможен. Настройки могут быть прописаны сайтам, ресурсах или принадлежащим им папкам, в которые "попадают" ссылки. Они принадлежат к контекстно-зависимому типу. Описание новой функции.К значимой информации относятся : очищенное от мусора смысловое содержание ссылки (контент), дата публикации, автор контента, источник. По мере развития программы SiteSputnik News этот список будет расширяться. В настоящей версии программы реализованы следующие контекстно-зависимые условия выбора значимой информации. - Начало контента (новости) - часть тега, тег или несколько тегов, размещенных перед началом значимого контента.
Как правило, началом значимого контента является заголовок новости, статьи или сообщения, но можно практически прописать любое "место" в ссылке.
- Окончание контента (новости) - тег или фраза, следущие после значимого контента.
В качестве признака окончания контента можно брать стандартные фразы, следующие за новостью, например, "Ещё материалы по теме".
- Удалить с (в значимый контент иногда вставляют незначимый, например, рекламу) - тег или фраза, с которой начинается этот ненужный фрагмент.
- Удалить до - тег или фраза, которой оканчивается ненужный фрагмент.
- Пройти по ссылке, дата выхода (сделано), автор (сделано), источник и другие поля зарезервированны под будущую разработку программного обеспечения.
На картинке ниже приведен фрагмент базы данных "Настройка сайтов" (красная стрелка). Она вложена в базу данных "Настройка поиска".  Значения настроек можно прямо живьём вводить в таблицы базы данных. Для этого используйте иконки, на которые указывает синяя стрелка: левый плюсик - создать строку в верхней таблице, правый - в нижней. Можно для ввода и редактирования настроек воспользоваться иконками, на которые указывает зеленая стрелка. В этом случае появится картинка, размещенная ниже. Особенности работы с контекстно-зависимыми настройками.- С каждой строкой верхней таблицы связано несколько строк нижней таблицы.
- Обязательным для заполнения столбцом верхней таблицы является только столбец Сайт, ресурс, папка сайта.
На первой картинке - он третий. Програма СайтСпутник при выполнении мониторинга выбирает нужные настройки следующим образом. Из адреса ссылки выделяется самая глубокая папка. Если она присутствует в верхней таблице, то осуществляется переход к работе с соответствующими настройками, имеющимися в нижней таблице. Если папка в столбце не обнаружена, то выделяется папка, в которую она вложена, и проверяется её присутствие в верхней таблице. Этот процесс продолжается до тех пор, пока не будет обработан сайт или ресурс, которому ссылка принадлежит.
- В нижней таблице заполняются только те ячейки, которые необходимы: может быть заполнена только одна ячейка, могут быть заполнены все ячейки.
Может быть только одна строка, может быть несколько строк. Настроек Начало контента (новости) и Окончание контента (новости) может быть сколько угодно. Они не спарены, то есть, работают независимо друг от друга. Как правило, для Начало контента (новости) достаточно одной настройки. Настроек Удалить с и Удалить до может быть также сколько угодно, но они спарены, то есть, из значимого контента ссылки, выделенного автоматически или при помощи настроек из предыдущего пункта, удаляются только фрагменты, заключенные в теги или фразы, размещенные в одной строке нижней таблицы.
- В обеих таблицах есть столбец "Использовать ...". Если в нем прописать значение "Нет", то соответствующие настройки использоваться не будут.
- Чтобы отключить или включить применение всех "Настроек сайтов" воспользуйтесь параметром "Включить "Настройку сайтов"",
который доступен из главного меню: "Настройки - Параметры - вкладка News".
Отладка настроек. Для того, чтобы правильно определить значения настроек, используйте специальный режим отладки. Он не влияет на результаты основной работы программы. Для его включения в "Настройки - Параметры - вкладка News" установите галочку для параметра "Создавать отладочные файлы на рабочем столе для "Настройка сайтов"". Параметр размещён в правом нижнем углу вкладки.
Это приведет к тому, что на рабочем столе перед моментом выделения значимого контента ссылок создастся папка с именем "SiteSputnik Work", в которую будут записываться контенты ссылок. Именно в них рационально искать настройки сайтов. Например, если начало новости в автоматическом режиме определено неправильно, то Вам следует найти её заголовок в тексте, затем взять впереди стоящий тег, его часть или несколько тегов, проверить является ли эта конструкция единственной до заголовка и перекопировать её в столбец Начало контента (новости).
Смысл отладочного режима в следующем. Текст новости уже упрощён. Он пошёл предварительную обработку, в частности, приведен к единой читабельной кодировке на русском языке, несодержащей аброкадабр. Знание языка html не требуется - понимать смысл конструкций этого языка при определении настроек нет необходимости.
Искать настройки следует только в программе "Блокнот". Другие программы могут "приукрашивать" (искажать) реальный html-код текста.
Подробнее на ссылке о настройке сайтов в СайтСпутнике. Структура базы данных "Настройка сайтов" с несколькими настройками прикреплена к сообщению. Поместите ее в папку "Alias\Internet\Настройка поиска" и обновите структуру: "Ящик - Иерархия Ящиков - Обновить". Это можно сделать пользователям, у которых +News уже установлена и работает. В дальнейшем эта база данных будет находиться в дистрибутиве на своем месте. Прикрепленный файл (Настройка сайтов.rar, 9259 байт, скачан: 373 раза)
|