Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 1 октября 2014 9:07 Сообщение отредактировано: 21 сентября 2015 10:57
Замечание от 21.01.2015. В течение года описанный в этом топике "Блок поиска новых источников" развился до нового варианта комплектации SiteSputnik NewStreams. Подробнее в 5-ом топике этой темы - forum.razved.info/index.php?t=5287&p=55499#pp55499
В настоящей версии можно искать следующие два вида потоков информации: 1. RSS-потоки. На картинке ниже по красной стрелке показано где включается поиск адресов RSS-потоков. Включение приводит к созданию двух списков: RSS-потоки все и RSS-потоки новые. В первом - все RSS-ки, найденные в текущем выполнении Проекта, во втором - новые RSS-потоки, которые ещё не были найдены ни разу при всех выполнениях Проекта. 2. URL-потоки. Страницы, не являющиеся RSS-потоками, но несущие поток или потоки информации на заданные темы. Включение по зеленой стрелке. Сами темы отределяются в поле по синей стрелке, например: econom; business;. Включение приводит к созданию двух списков: URL-ссылки все и URL-потоки новые. В первом - все ссылки по заданным темам из текущего выполнения Проекта, во втором - новые, которые ещё не были найдены ни разу при всех выполнениях Проекта, и на которых обнаружены потоки. Можно создать ещё и третий список. По серой стрелке включается поиск новых адресов страниц, содержащих информацию на заданную тему. Список URL-ссылки новые содержит только такие ссылки. ![]() RSS-потоки новые и URL-потоки новые в настоящей реализации можно вручную просмотреть, оценить и, если это рационально, то некоторые из них добавить в источники проекта (вручную вписать в Проект), возможно даже, что не в данный, а в какой-то другой Ваш Проект. На этом пока всё. Работы в данном направлении продолжаются. P.S. 1. Уже более трёх месяцев сам работаю с этими списками. Находил новые полезные источники для мониторинга не только в новых для себя темах, но и в хорошо изученных. 2. В принципе, можно искать источники не только для работы в СайтСпутнике, но и для других целей. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 803 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Посмотрел новый функционал в работе. Списки источников пополняются. Алексей Борисович, мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял? |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
tungus1973 написал: Посмотрел новый функционал в работе. Списки источников пополняются. Да, сначала новых источников побольше, потом поменьше, так как отсеиваются ранее найденные источники, то есть, всё сделано "по-сайтспутниковски". Практическое значение этой функции всё-таки в SiteSputnik News и выше. tungus1973 написал: мне несколько непонятен механизм коллекционирования потоков. Новые источники собираются только для тех новостей, которые попали в рубрики? Если ссылка не попала ни в одну рубрику, то она, как источник, не засчитывается? Или я неправильно понял? Нет, не так. Всё, а именно, все ссылки, которые открываются и скачиваются, и все адреса ссылок, которые находятся в контенте этих ссылок, - проверяется на предмет принадлежности к RSS-потокам и URL-потокам. Для этого по адресам ссылок тоже надо сделать подкачку, чтобы проанализировать контент (можно и далее углубиться, но это не практично). Что такое RSS-поток знают все. Кроме RSS-потоков, в интернете есть ещё масса страниц с краткими описаниями (или даже только заголовками) новостей или сообщений и ссылками на их полное содержание. Они в программе СайтСпутник называются URL-потоками. Вот эти два вида потоков и ищутся, если это прописано в настройках, при выполнении Проекта и на этапе поиска (открытия прописанных в Проекте источников), и на на этапе скачивания найденных в источниках новых ссылок, и на этапе подкачки комментариев. То есть, Вы поняли не так, но мыслите по-своему, мыслите вперед и мыслите правильно. Если то, о чем написано выше делать с контентами только тех ссылок, которые попали в Рубрики, то будем "добывать" меньше источников, но вероятность, что они будут востребованы в текущем Проекте больше. У меня другие задумки на перспективу, но Вашу буду иметь ввиду, хотя в плане её практичности имею некоторые сомнения. В любом случае, поиск новых источников "попутно" при выполнении Проектов или целенаправленно на мой взгляд может быть полезен. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 803 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Спасибо, Алексей Борисович! |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 21 сентября 2015 10:54 Сообщение отредактировано: 22 сентября 2015 17:11
Вышла Бета-версия нового варианта комплектации программы СайтСпутник - SiteSputnik NewsStreams. Обновитесь до 8.8.8. Назначение: • Организация и автоматизация поиска Источников информации: именно Источников, а не самой информации. • Мониторинг интернета на предмет появления в нём Источников, которые могут быть интересны. • Модуль +NewStreams можно назвать поставщиком Источников для SiteSputnik News или других программ. • Его также можно использовать для более глубокого мониторинга открытых источников интернета. Настройки находятся на отдельной вкладке и выглядят следующим образом: ![]() Подробнее о них и пошаговая инструкция применения SiteSputnik NewStreams на ссылке _http://sitesputnik.ru/Help/I/i_SiteSputnik_NewStreams.docx. |
Ed
Модератор форума
Всего сообщений: 1826 Рейтинг пользователя: 28 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Обновился. Даже только ради 08.08.08. |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » SiteSputnik NewStreams - поиск новых источников информации |