ara_367519
Долгожитель форума
Откуда: г. Пенза Всего сообщений: 818 Рейтинг пользователя: 17 Ссылка Дата регистрации на форуме: 4 дек. 2012 |
Да), об этом А.Масалович говорил, не очень давно.. добавляйтесь к нам в группу интернет-разведка на ФБ, там много интересного)) ---
истина где-то рядом... |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
ara_367519 написал: не очень давно..
Кстати, в пробивку E-mail я ещё добавил проверку имени, которое идет до знака @: проверяю на абсолютно точное совпадение, если имя состоит из букв и цифр и длиннее 6 символов. Это тоже бывает полезным и не приносит практически мусора. И ещё. "Распыление" по ФБ, ВК и другим источникам - это нормальное явление, но если Вы нашли хорошую фичу и хотите донести её до широкого круга Пользователей, то пишите о ней здесь на форуме тоже. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Алексей Мыльников написал: 3. Пункт Искать по теме - в стадии проектирования.
Принцип следующий. Как правило, предложение несет в себе какую-то смысловую нагрузку, соответственно, выделенный фрагмент текста разбивается на предложения, из которых составляются запросы. Запросы посылаются на новостные источники раздельно. Затем делается их "Аналитическое объединение", которое в начало выдачи поднимает ссылки, удовлетворяющие большему количеству запросов. Сгенерированный Пакет запросов перед выполнением предварительно показывается Пользователю, который может отредактирвать запросы и прописать их выполнение на других источниках. Для этапа поиска, думаю что это довольно-таки практичное решение. Другое дело - этап Рубрикации, который в этой функции не применяется. Обращение к данной функции следующее: подменю "Золотого ключика" - Поиск по выделенному тексту - Искать по теме - Сгенерировать Пакет запросов. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Приписать в выдаче к сниппету (ссылке) Источник и Запрос - новый параметр в Настройках, размещён на вкладке Pro. Название параметра говорит само за себя: Источник, в котором найден сниппет (ссылка) и запрос, при помощи которого он был найден, приписываются в конец сниппета. Этот параметр помогает понять какой Источник, по какому Запросу, какую информацию принес в выдачу. Полезено, когда Пакет запросов состоит из нескольких Источников и нескольких Запросов. Другими словами, он помогает "на месте" (не прокручивая выдачу, не заглядывая в Пакет запросов и Настройки) понять какие Источники и Запросы приносят нужную информацию, а какие нет. По умолчанию параметр выключен. Доступно в SiteSputnik Pro v.9.2.6 от 09.01.17 и выше. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Два новых параметра, размещены на вкладке +News: - Не выводить Правило попадания в Рубрику - в конец Рубрики не дописывается Правило, которому она удовлетворила. Бывает полезным, если Правило очень большое (например, больше самой новости или сообщения) и мешает просмотру результатов работы. - Не Рубрицировать офисные и другие не-html-файлы - офисные файлы иногда попадаются очень большие, например, книга на 600 страниц, соотвественно, обработка такого файла ресурсоёмкая, и если точно известно, что в файле не будет нужной информации, например, если "вычисляем" все интервью Трампа за 2016 год, то есть смысл применить этот параметр. Доступно в SiteSputnik Pro+News v.9.2.7.3 от 02.02.17 и выше. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В SiteSputnik News+WebSpider версии 9.3.2 от 20.02.17 добавлены средства мониторинга страничек из Инстаграм (внутрь100грамм). Прописать страничку из Инстаграм в Проекте можно следующим образом: %ИГ=https://www.instagram.com/mossobyanin/ или https://www.instagram.com/mossobyanin/ +/p/ Важное замечание. Т.к. в Инстаграм комментарии не оформляются отдельной ссылкой, а приписываются в ссылку, создаваемую при первом Посте, то для отслеживания новых комментариев, написанных после последнего выполнения Проекта, следует применить возможности модуля +WebSpiser, а именно, прописать в Проекте оператор ^^WebSpider;. В этом случае СайтСпутник будет сравнивать новые и предыдущие состояния ссылок, находить и выделять в них только новые комментарии и отправлять их на Рубрикацию. Пример небольшого Проекта для наблюдением сразу за 7 страничками из Инстаграм на предмет отслеживания новых сообщений и комментариев о "Масленице", "Днях рождениях" и "О полиции": %ИГ=https://www.instagram.com/alexei_mylnikov/ %ИГ=https://www.instagram.com/mossobyanin/ %ИГ=https://www.instagram.com/skyment/ %ИГ=https://www.instagram.com/roman.romachev/ %ИГ=https://www.instagram.com/tov.nachoperot/ %ИГ=https://www.instagram.com/alex.mitrofanov/ %ИГ=https://www.instagram.com/yushchuk/ Рубрика://Праздники/Масленица Масленица | Масленница | !блины* Рубрика://Праздники/День Рождения День /1 рождения | Днюха Рубрика://МВД/О полиции Полиция | Милиция | !мент* ^^WebSpider; Результат работы на тему "Масленица" представлен на ссылке. В качестве одного из Правил попадания информации в Рубрику использовано: Масленница, на случай написания этого слова с грамматической ошибкой. Дополнительная информация. Если у Вас Internet Explorer 9 (IE 9), то обновите его до IE 11 из самого IE следующим образом: "Справка - Техническая поддержка - ...". |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 21 сентября 2017 22:29 Сообщение отредактировано: 22 февраля 2018 15:50 Поиск новых Сайтов и Доменов 3-го уровня Список Ссылки новые уже сушествует давно. Он содержит только новые уникальные ссылки, которые не встречались ещё ни разу ни в одном из предыдущих выполнений Проекта (впервые найденные ссылки). Теперь к нему добавлены ещё два списка. Сайты новые (Домены 2-го уровня новые) Список "Сайты новые" содержит только впервые найденные сайты, то есть, те сайты, ссылки с которых ещё ни разу не были найдены ни в одном из предыдущих выполнений Проекта (Пакета запросов). Удобно, например, тогда, когда ищутся сайты, посвященные какой-то теме - Пользователю не придется повторно просматривать ранее найденные сайты. Домены 3-го уровня новые Список "Домены 3-го уровня новые" содержит только впервые найденные Домены 3-го уровня. Удобно, например, тогда, когда нужные темы находятся на таких cайтах как livejournal.com. Доступно, начиная с Site Sputnik версии 9.4.4 от 21.09.2017 г. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Сохранение в формате PDF, DOCX, RTF, TXT, MHT, HTM. ![]() Практически любой файл (Рубрику, Чистый поток, Объединение, Ссылки новые, ...) можно сохранить как документ в форматах, указанных в заголовке топика. Обращение: "Главное меню - Файлы - Сохранить как документ ..." (показано на картинке) или про нажатию правой кнопки мышки на нижней Табличке. Доступно, начиная с SiteSputnik 9.5.6 от 30.01.2018 г. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Работа со списками "Сайты новые" и "Домены 3-го уровня новые" В топике № 88 из этой темы (см. на два топика выше) сообщалось о создании списков "Сайты новые" (Домены 2-го уровня новые) и "Домены 3-го уровня новые", в которые попадают невстретившиеся (ненайденные) ранее ни разу при выполнении Проекта адреса Сайтов и Доменов 3-го уровня. Для удобства работы с этими списками сделаны следующее две функции. 1. Вручную отправить на Рубрикацию (на модуль +News) ссылки из списков На картинке ниже красная и зеленая стрелочки показывают пункты меню, выбрав которые можно применить данную функцию: ![]() 2. Прописать в Проекте работу с Сайтами новыми и Доменами 3-го уровня новыми Чтобы не запоминать и не набирать на клавиатуре соответствующий оператор, его можно выбрать так, как показано на картинке ниже: ![]() Если операторы: ^^Сайты новые; или ^^Домены 3-го уровня новые; применены в теле Проекта, то Рубрикация будет выполнена для ссылок их этих списков, то есть для главных страниц сайтов и доменов 3-го уровня, а не для ссылок из списка "Ссылки новые". Допускается применение обоих операторов в одном Проекте. Поскольку, в общем случае, для главных страниц сайтов и доменов 3-го уровня выделение значимого контента программным образом не представляется возможным и целесообразным, их текстовый контент в новостную ленту помещается полностью, соответственно, и Рубрикация будет сделана по их полному текстовому содержанию. Доступно, начиная с SiteSputnik News версии 9.4.7.1 от 27.02.2018 г. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 872 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Доступно в SiteSputnik 9.5.7.3 от 12.03.2018: • В "Чистом потоке" (напомню, ЧП - это полнотекстовая новостная лента, в которую попадают контенты всех ссылок, собранных в Проекте) СайтСпутник отмечает галочкой контенты ссылок, которые попали хотя бы в одну Рубрику. Соотвественно, непопавшие ни в одну Рубрику ссылки галочкой не отмечаются. • Время Рубрикации - добавлено в "Статистика по Источникам текущая" для каждого Источника. • Время поиска и время Рубрикации - точность измерения до микросекунд, а не до секунд как было ранее, иначе на некоторых Источниках при исследовании может возникнуть большая погрешность. |
Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 * 10 11 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Разработчик СайтСпутник, документация, где скачать » Мелочи |