|
SiteSputnik. Мониторинг СМИ и новостных источников.
SiteSputnik. Создание собственных новостных лент. |
Автор Алексей Мыльников |
Назначение, цели, решение(1) Под новостью понимается не только собственно новостной контент, но и "синтаксически" аналогичные контенты, например, вакансии с рекрутинговых сайтов, товары и лоты с досок объявлений и торговых площадок, объекты недвижимости, тендеры и прочие.
- Предположим, что перед Вами стоит задача: постоянно просматривать электронные СМИ, новостные или подобные(1) им источники и собирать информацию на заданную тему или о заданном объекте.
- Рассмотрим, как эту задачу можно решить в программе SiteSputnik Pro+News.
- Возьмем конкретный объект – Владимир Путин, а в качестве источников информации следующие шесть:
РБК, Вести.Ру, Яндекс.Новости, Google.Новости, C•News и Gazeta.ru.- Составим средствами программы СайтСпутник специальное задание.
- Будем периодически выполнять его, получая результаты,
один из которых приведен на ссылке http://sitesputnik.ru/Files/ZPutin.htm.- Результаты мониторинга на другую тему: Прогнозы аналитиков, -
приведены на ссылке http://sitesputnik.ru/Files/ZPrognoz.htm.- Темы мониторинга могут быть любые, источников мониторинга – огромное множество.
- Виды источников - самые различные: RSS-потоки существующие и эмулированные, встроенные в сайты поиски, произвольные страницы, на которых изменяется информация и ссылки на неё.
- Мониторинг нескольких источников выглядит так, как будто Вы работаете с одним источником.
- На видеоролике продемонстрировано как программу SiteSputnik News можно использовать для Мониторинга региональных СМИ.
В качестве региона выбрана Челябинская область.
В качестве объектов мониторинга выбраны четыре парламентские партии: "Единая Россия", КПРФ, ЛДПР, "Справедливая Россия".
Дополнительная информация на форуме.- На другом видеоролике продемонстрирован мониторинг сайтов, содержащих предложения купли-продажи бизнеса.
Особенности реализации на 21.04.2010г.
- SiteSputnik соберёт ссылки из всех прописанных источников, на которых упоминается Владимир Путин.
- Отсеет повторно найденные ссылки не только для текущего задания, но и для всех ранее выполненных заданий о Владимире Путине.
- Откроет все оставшиеся новые ссылки, на которых упоминается В.Путин.
- Распознает:
• местонахождение текстового контента каждой новости;
• выделит этот контент, отбросив неотносящуюся к новости информацию;
• разместит «очищенные» новости в специальной выдаче.
- С точки зрения пользователя процесс работы выглядит очень просто:
• выбрал и запустил нужное задание;
• получил выдачу контента всех новостей, очищенных от мусора.
• На все действия будет затрачено несколько минут. Остается только ознакомиться с новостями.
• В случае необходимости, по одному щелчку мышки доступен оригинал страницы, на которой размещена новость.
В настоящее время реализовано следующее.Выводы.
- Отсев повторяющихся новостей не только по «имени» ссылки, но и по контенту новости.
Это реализовано в рамках выполнения нескольких последних заданий: повторы одинаковых по содержанию новостей удаляются.- Рубрики: раскладывание новостей по полочкам (в древовидную структуру).
Смотрите отдельную публикацию, посвященную Рубрикам.
- Список "Ссылка-Рубрики": для каждой новости (ссылки) приводится перечень Рубрик, в которые она попала.
- Список "Рубрика-ссылки": для каждой Рубрики приводится перечень новостей (ссылок), которые в нее попали.
- Диспетчер задач, предназначенный для мониторинга новостей по расписанию.
Данный инструмент позволяет пользователю формировать собственные новостные ленты под свои потребности, подбирая нужные источники и критерии выбора из них нужной информации. В отличии от других программ могут быть задействованы практически любые источники и любые способы взятия из них информации.
Обсуждение программы SiteSputnik NewsДополнительную информацию можно получить на форуме:http://forum.razved.info/index.php?t=1730
http://forum.razved.info/index.php?t=1555
http://forum.razved.info/index.php?t=1045
http://forum.razved.info/index.php?t=894
Список литературы.Полный список публикаций о программе собран на этой странице http://sitesputnik.ru/Public.htm.
Сайт о программе - http://sitesputnik.ru/.
Скачать программу можно отсюда.